Modèle linéaire généralisé def

Une deuxième façon importante dans laquelle le modèle linéaire général diffère du modèle de régression multiple est dans sa capacité à fournir une solution pour les équations normales lorsque les variables X ne sont pas linéairement indépendantes et l`inverse de X`X n`existe pas. La redondance des variables X peut être fortuite (par exemple, il se peut que deux variables prédictifs soient parfaitement corrélées dans un petit ensemble de données), accidentelles (par exemple, deux copies de la même variable peuvent être utilisées involontairement dans une analyse) ou conçues (p. ex. indicateur des variables avec des valeurs exactement opposées peuvent être utilisées dans l`analyse, comme lorsque les variables prédictitrices mâles et femelles sont utilisées pour représenter le genre). Trouver l`inverse régulier d`une matrice non-plein-rang rappelle le problème de trouver l`réciproque de 0 dans l`arithmétique ordinaire. Aucun inverse ou réciprocité n`existe parce que la division par 0 n`est pas permise. Ce problème est résolu dans le modèle linéaire général en utilisant un inverse généralisé de la matrice X`X pour résoudre les équations normales. Un inverse généralisé est une matrice qui satisfait nous avons utilisé la régression linéaire pour les sorties à valeur réelle. Plus précisément, si les valeurs en sortie sont des comptes, nous pouvons modifier la distribution de probabilité et utiliser la même configuration pour ce nouveau problème. La distribution de poisson est une distribution appropriée aux données de comptage de modèles et nous l`utiliserons. Du point de vue des modèles linéaires généralisés, cependant, il est utile de supposer que la fonction de distribution est la distribution normale avec la variance constante et la fonction de lien est l`identité, qui est le lien canonique si la variance est connue. Je dirais que ici, nous utilisons l`âge de l`organisme que nous étudions pour prédire combien il est grand, et que l`équation de régression linéaire résultante que nous obtenons (montré sur l`image) peut être utilisé pour prédire la taille d`un organisme est si nous connaissons son âge.

Le sujet d`aujourd`hui est les modèles linéaires généralisés, un groupe de modèles généraux de machine learning pour les problèmes d`apprentissage supervisés (à la fois pour la régression et la classification). Je dirais que cette équation est un exemple de régression linéaire simple. Je voudrais alors expliquer comment vous (ou un ordinateur) pourrait s`adapter à une telle équation à un nuage de points de données, comme celui montré dans cette image: maintenant, je vois qu`un 100 pieds carrés maison coûte 1M $ (obtenez sur vous-même, c`est un exemple simplifié). Donc, naturellement, vous vous attendriez à une maison de 200 pieds carrés au coût double.