Лист за преговор: Introduction à la Régression et Évaluation

📋 Plan du Cours

  1. Régression linéaire multiple
  2. Régression polynomiale
  3. Fonction de coût
  4. Descente de gradient
  5. Hypothèse multivariée
  6. Erreur quadratique moyenne
  7. Erreur absolue moyenne
  8. Coefficient de détermination (R²)
  9. Overfitting et underfitting
  10. Méthodes d'évaluation

📖 1. Régression linéaire multiple

🔑 Notions clés & Définitions

  • Modèle de régression linéaire multiple : Modèle statistique qui prédit une variable dépendante à partir de plusieurs variables indépendantes en utilisant une fonction linéaire. Il généralise la régression linéaire simple en intégrant plusieurs features (voir aussi "hypothèse : fonction linéaire multivariée").
  • Hypothèse multivariée : Supposition selon laquelle la relation entre la variable dépendante et plusieurs variables indépendantes peut être modélisée par une fonction linéaire, avec des coefficients associés à chaque variable (voir aussi "notion des variables multiples").
  • Notation des variables multiples : Utilisation de vecteurs et matrices pour représenter les différentes variables d'entrée et paramètres du modèle, facilitant la manipulation mathématique dans le contexte multivarié.
  • Hypothèse : fonction linéaire multivariée : Postulat que la relation entre la variable cible et plusieurs features est une combinaison linéaire de ces features, représentée par une hypothèse mathématique formelle.
  • Modèle linéaire comme hyperplan : En dimension supérieure à deux, le modèle de régression peut être visualisé comme un hyperplan dans un espace à plusieurs dimensions, généralisant la notion de droite ou de plan en 2D ou 3D.

📝 Points essentiels

  • La modélisation en régression linéaire multiple repose sur l'hypothèse que la relation entre la variable dépendante et les variables indépendantes est linéaire (voir aussi "hypothèse : fonction linéaire multivariée").
  • La notation utilise des vecteurs et matrices pour représenter l'ensemble des variables indépendantes, ce qui facilite l'écriture compacte du modèle et des équations associées.
  • La fonction hypothèse est une combinaison linéaire : hθ(x)=θ0+θ1x1++θnxnh_\theta(x) = \theta_0 + \theta_1 x_1 + \dots + \theta_n x_n, où chaque θi\theta_i est un coefficient associé à la variable xix_i.
  • En dimension supérieure, le modèle est représenté géométriquement par un hyperplan, permettant d'interpréter la régression comme une surface de décision ou de prédiction dans un espace à plusieurs dimensions.
  • La notion de hyperplan est essentielle pour visualiser la solution dans des espaces à plus de trois dimensions, où la représentation géométrique devient un hyperplan.

💡 À retenir

Le modèle de régression linéaire multiple généralise la régression simple en utilisant une fonction linéaire multivariée, représentée géométriquement par un hyperplan dans un espace à plusieurs dimensions, avec une hypothèse selon laquelle la relation entre variables est linéaire.

📖 2. Régression polynomiale

🔑 Notions clés & Définitions

  • Modèle de régression polynomiale : Extension du modèle de régression linéaire où la relation entre la variable dépendante et la ou les variables indépendantes est modélisée par un polynôme de degré supérieur, permettant d'ajuster des courbes non linéaires (voir section 3).
  • Hypothèse : fonction polynomiale : La relation entre la variable cible et les variables explicatives est supposée suivre une fonction polynomiale, c’est-à-dire une somme de termes de degré variable, ce qui permet de modéliser des relations non linéaires (voir introduction).
  • Limites de la régression linéaire simple : La régression linéaire simple ne peut pas modéliser des relations non linéaires complexes, ce qui limite sa capacité à ajuster certains types de données, notamment lorsque la relation entre variables est courbe ou plus complexe (voir section 3).
  • Extension du modèle linéaire à polynômes : La transformation des variables explicatives en leur puissance (par exemple, x2,x3,x^2, x^3, \ldots) permet d’étendre un modèle linéaire pour qu’il devienne un modèle polynomial, augmentant ainsi sa flexibilité pour l’ajustement des données (voir plan).

📝 Points essentiels

  • La régression polynomiale permet d’ajuster des courbes plus complexes que la simple ligne droite de la régression linéaire en utilisant des termes de degré supérieur. Elle modélise la relation entre la variable dépendante et une ou plusieurs variables indépendantes par une fonction polynomiale.
  • La fonction hypothèse devient : hθ(x)=θ0+θ1x+θ2x2++θdxdh_\theta(x) = \theta_0 + \theta_1 x + \theta_2 x^2 + \ldots + \theta_d x^d, où dd est le degré du polynôme.
  • La limite principale de la régression linéaire simple est son incapacité à modéliser des relations non linéaires, ce qui peut conduire à un sous-ajustement (underfitting). La régression polynomiale, en introduisant des termes de degré supérieur, permet de mieux capturer ces relations complexes.
  • Cependant, un polynôme de degré trop élevé peut conduire à un surajustement (overfitting), rendant le modèle peu généralisable à de nouvelles données. La sélection du degré doit donc être prudente.
  • La transformation en polynômes consiste à créer de nouvelles variables : x,x2,x3,,xdx, x^2, x^3, \ldots, x^d, pour permettre au modèle de capturer des courbes non linéaires tout en restant dans un cadre de régression linéaire multivariée.

💡 À retenir

La régression polynomiale étend la régression linéaire en modélisant des relations non linéaires grâce à des termes de degré supérieur, mais nécessite une gestion prudente pour éviter le surajustement.

📖 3. Fonction de coût

🔑 Notions clés & Définitions

  • Fonction de coût : Fonction mathématique qui évalue la performance d’un modèle en quantifiant l’écart entre les valeurs prédites et les valeurs réelles. Elle sert à guider l’optimisation des paramètres du modèle.
  • Fonction de coût pour régression linéaire multiple : Spécifique à la régression avec plusieurs variables, elle calcule la moyenne des erreurs quadratiques entre les prédictions et les valeurs observées, permettant d’ajuster simultanément tous les paramètres du modèle.
  • Rôle de la fonction de coût dans l'apprentissage : Elle sert à mesurer la qualité de la prédiction du modèle, en minimisant cette fonction lors de l’optimisation pour améliorer la précision des prédictions.
  • Lien entre fonction de coût et erreur : La fonction de coût est directement liée à l’erreur du modèle, puisqu’elle quantifie la différence entre la sortie du modèle et la valeur réelle, souvent sous forme d’erreur quadratique ou absolue.
  • Auteur : Andrew NG (coursera, 2025-2026) : la fonction de coût est essentielle pour l’apprentissage supervisé, en permettant de guider l’algorithme vers la meilleure approximation possible.

📝 Points essentiels

  • La fonction de coût permet de quantifier la performance du modèle en agrégeant toutes les erreurs de prédiction en une seule valeur.
  • Pour la régression linéaire multiple, la fonction de coût est généralement la moyenne des erreurs quadratiques (MSE), qui pénalise fortement les grandes erreurs, favorisant des ajustements précis.
  • La minimisation de la fonction de coût est effectuée via des algorithmes d’optimisation comme la descente de gradient, qui ajuste les paramètres du modèle pour réduire l’erreur globale.
  • La fonction de coût est un indicateur clé dans l’apprentissage automatique, car elle relie directement la performance du modèle à la qualité de ses erreurs.
  • La relation entre la fonction de coût et l’erreur est directe : une réduction de la fonction de coût correspond à une diminution de l’erreur moyenne du modèle.

💡 À retenir

La fonction de coût est un outil fondamental qui guide l’apprentissage en quantifiant l’écart entre les prédictions et la réalité, permettant d’optimiser le modèle pour une meilleure précision.

📖 4. Descente de gradient

🔑 Notions clés & Définitions

  • Algorithme de descente de gradient : méthode itérative permettant d'optimiser une fonction en ajustant ses paramètres dans la direction opposée au gradient, afin de minimiser la fonction de coût. (source : Pr. Andrew NG, coursera)

  • Mise à jour simultanée des paramètres : processus où tous les paramètres du modèle sont ajustés en même temps lors de chaque itération de la descente de gradient, contrairement à une mise à jour séquentielle. Cela permet une convergence plus cohérente pour les modèles avec plusieurs variables. (source : Pr. Andrew NG)

  • Descente de gradient pour variables multiples : extension de la descente de gradient appliquée à des modèles avec plusieurs paramètres ou variables, nécessitant une mise à jour de chaque paramètre en fonction de son gradient partiel. Elle permet d’optimiser efficacement des modèles multivariés. (source : Pr. Andrew NG)

  • Itération et convergence : processus répétitif où l’algorithme ajuste les paramètres à chaque étape (itération) jusqu’à ce que la fonction de coût atteigne un minimum ou qu’un critère d’arrêt soit rempli, assurant la convergence vers une solution optimale ou localement optimale. (source : Pr. Andrew NG)

📝 Points essentiels

  • L’algorithme de descente de gradient est une méthode fondamentale pour l’optimisation dans l’apprentissage automatique, notamment pour la régression linéaire et d’autres modèles paramétriques. Il consiste à ajuster les paramètres en suivant la pente négative de la fonction de coût, étape par étape.

  • La mise à jour simultanée des paramètres est cruciale pour la stabilité et la cohérence de la convergence, surtout dans le cas de modèles avec plusieurs variables (descente de gradient pour variables multiples). Elle évite les oscillations ou divergences possibles avec une mise à jour séquentielle.

  • La convergence dépend du taux d’apprentissage (learning rate) : un taux trop élevé peut empêcher la convergence ou provoquer une divergence, tandis qu’un taux trop faible ralentit la convergence. La sélection du taux d’apprentissage est essentielle pour une descente efficace.

  • La méthode itérative se répète jusqu’à ce que la différence entre deux itérations successives soit inférieure à un seuil fixé, ou qu’un nombre maximal d’itérations soit atteint, garantissant ainsi la stabilité du processus.

💡 À retenir

La descente de gradient, en effectuant une mise à jour simultanée des paramètres sur plusieurs variables, permet d’optimiser efficacement un modèle multivarié par une succession d’itérations jusqu’à convergence.

📖 5. Hypothèse multivariée

🔑 Notions clés & Définitions

  • Formulation de l'hypothèse multivariée : Modèle de régression qui considère plusieurs variables d'entrée (features) simultanément pour prédire une variable cible, en utilisant une fonction linéaire ou polynomiale. Elle permet de capturer l'effet combiné de plusieurs facteurs sur la variable à prédire.

  • Notation et définition des variables d'entrée multiples : Si on note x1,x2,...,xnx_1, x_2, ..., x_n les différentes variables d'entrée (features), la notation simplifiée pour l'hypothèse multivariée est :
    hθ(x)=θ0+θ1x1+θ2x2+...+θnxnh_\theta(x) = \theta_0 + \theta_1 x_1 + \theta_2 x_2 + ... + \theta_n x_n où chaque θi\theta_i est un paramètre associé à la variable xix_i.

  • Différence entre univariée et multivariée :

    • Univariée : Modèle utilisant une seule variable d'entrée pour prédire la variable cible. La fonction d'hypothèse est une ligne droite en 2D.
    • Multivariée : Modèle utilisant plusieurs variables d'entrée, la fonction d'hypothèse devient un hyperplan en espace à n dimensions, permettant une modélisation plus complexe et précise.

📝 Points essentiels

  • La formulation de l'hypothèse multivariée repose sur l'extension de la régression linéaire simple à plusieurs variables, ce qui permet de modéliser des phénomènes où plusieurs facteurs influencent la résultat.
  • La notation hθ(x)h_\theta(x) utilise un vecteur de paramètres θ\theta et un vecteur de variables d'entrée xx, facilitant la généralisation à un grand nombre de features.
  • La différence fondamentale avec la régression univariée est la dimensionnalité du modèle : en univariée, la relation est une ligne droite, alors qu'en multivariée, c'est un hyperplan, ce qui augmente la capacité de modélisation mais aussi la complexité.

💡 À retenir

L'hypothèse multivariée permet de modéliser efficacement la relation entre plusieurs variables d'entrée et une variable cible, en utilisant une fonction linéaire ou polynomiale, et se distingue de la modélisation univariée par sa capacité à intégrer plusieurs facteurs simultanément.

📖 6. Erreur quadratique moyenne

🔑 Notions clés & Définitions

  • Erreur quadratique moyenne (MSE) : La moyenne des carrés des erreurs, c’est-à-dire la moyenne des différences au carré entre les valeurs prédites par le modèle et les valeurs observées.
  • Définition mathématique de la MSE : Si yiy_i est la valeur réelle et y^i\hat{y}_i la valeur prédite pour l’exemple ii, alors
    MSE=1ni=1n(yiy^i)2\text{MSE} = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2
  • Sensibilité aux grandes erreurs : La MSE pénalise fortement les erreurs importantes car elle élève au carré la différence entre la prédiction et la valeur réelle, rendant le modèle plus sensible aux outliers.
  • Relation entre MSE et RMSE : La RMSE (Root Mean Squared Error) est la racine carrée de la MSE, ce qui permet d’obtenir une métrique dans la même unité que la variable à prédire, facilitant ainsi l’interprétation.

📝 Points essentiels

  • La MSE est une métrique de performance qui mesure la précision d’un modèle de régression en quantifiant l’erreur moyenne au carré.
  • La formule mathématique, MSE=1ni=1n(yiy^i)2\text{MSE} = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2, montre que chaque erreur est élevée au carré, accentuant l’impact des erreurs importantes.
  • La MSE est très sensible aux outliers, car une erreur importante augmente significativement la valeur de la métrique.
  • La RMSE, en étant la racine carrée de la MSE, permet une interprétation plus intuitive, car elle est dans la même unité que la variable à prédire.
  • Plus la MSE ou la RMSE est faible, plus le modèle est performant.

💡 À retenir

La MSE, en pénalisant fortement les grandes erreurs, est une métrique sensible aux outliers, et la RMSE permet une interprétation plus intuitive tout en conservant cette sensibilité.

📖 7. Erreur absolue moyenne

🔑 Notions clés & Définitions

  • Erreur absolue moyenne (MAE) : La moyenne des valeurs absolues des erreurs de prédiction, permettant d’évaluer la performance d’un modèle de régression.
  • Définition mathématique de la MAE : MAE=1ni=1nyiy^i\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} | y_i - \hat{y}_i |, où yiy_i est la valeur réelle et y^i\hat{y}_i la prédiction du modèle.
  • Interprétation facile : La MAE a la même unité que la variable cible, ce qui facilite la compréhension et la comparaison des erreurs.
  • Différence de pénalisation entre MAE et MSE : La MAE pénalise linéairement les erreurs, contrairement à la MSE qui pénalise davantage les grandes erreurs en utilisant le carré des erreurs, ce qui rend la MAE plus robuste face aux outliers.

📝 Points essentiels

  • La MAE est une métrique simple et intuitive pour mesurer la performance d’un modèle de régression, car elle correspond à la moyenne des erreurs absolues, ce qui facilite son interprétation.
  • La formule mathématique MAE=1ni=1nyiy^i\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} | y_i - \hat{y}_i | permet de calculer cette erreur sur un ensemble de données.
  • La MAE est moins sensible aux valeurs extrêmes (outliers) que la MSE, car elle ne pénalise pas plus fortement les grandes erreurs.
  • La différence principale avec la MSE réside dans la pénalisation : la MSE utilise le carré des erreurs, accentuant l’impact des erreurs importantes, alors que la MAE applique une pénalisation linéaire.
  • La MAE étant exprimée dans la même unité que la variable à prédire, elle est facilement compréhensible et utile pour une évaluation claire de la performance du modèle.

💡 À retenir

La MAE est une métrique simple, interprétable dans la même unité que la variable cible, et pénalise proportionnellement toutes les erreurs, ce qui la rend robuste face aux outliers comparée à la MSE.

📖 8. Coefficient de détermination (R²)

🔑 Notions clés & Définitions

  • Coefficient de détermination (R²) : mesure la proportion de la variance totale de la variable dépendante expliquée par le modèle de régression. Il indique la qualité de l'ajustement du modèle aux données (voir introduction).
  • Interprétation du R² : il représente la proportion de la variance expliquée, exprimée entre 0 et 1, où 1 indique un ajustement parfait (voir introduction).
  • Valeurs entre 0 et 1 : R² varie toujours dans cet intervalle, avec 0 signifiant aucune explication de la variance par le modèle et 1 une explication totale (voir introduction).
  • Utilisation pour évaluer la qualité du modèle : R² permet de juger de la performance du modèle de régression, plus il est proche de 1, meilleure est la capacité explicative (voir introduction).

📝 Points essentiels

  • Le R² est une métrique qui quantifie la proportion de la variance totale de la variable cible expliquée par le modèle de régression, ce qui en fait un indicateur de la performance globale (voir introduction).
  • Il est toujours compris entre 0 et 1, ou entre 0% et 100%, facilitant son interprétation graphique et comparative (voir introduction).
  • Un R² élevé indique que le modèle explique une grande partie de la variabilité des données, tandis qu’un R² faible suggère un ajustement insuffisant ou une mauvaise modélisation (voir introduction).
  • La représentation graphique des valeurs prédites versus observées permet d’illustrer la qualité de l’ajustement et la valeur de R² (voir introduction).
  • Source : Pr. Andrew NG (voir introduction).

💡 À retenir

Le coefficient de détermination (R²) évalue la capacité d’un modèle à expliquer la variance de la variable cible, avec une valeur proche de 1 indiquant un ajustement performant.

📖 9. Overfitting et underfitting

🔑 Notions clés & Définitions

  • Overfitting : phénomène où un modèle apprend non seulement la relation sous-jacente aux données, mais aussi le bruit spécifique à l'ensemble d'entraînement, ce qui nuit à sa capacité de généralisation (source : Artificielle Pr. Nouhad SANOUSSI). Il se traduit par une très faible erreur sur l'entraînement mais une mauvaise performance sur de nouvelles données.

  • Underfitting : situation où un modèle est trop simple pour capturer la structure réelle des données, entraînant une erreur élevée aussi bien sur l'entraînement que sur de nouvelles données (source : Artificielle Pr. Nouhad SANOUSSI). Il ne parvient pas à modéliser la relation sous-jacente, conduisant à un mauvais ajustement.

  • Impact sur la généralisation : l'overfitting réduit la capacité du modèle à faire des prédictions précises sur de nouveaux exemples, tandis que l'underfitting indique un modèle insuffisamment complexe, incapable de saisir la tendance réelle des données (source : Artificielle Pr. Nouhad SANOUSSI).

  • Exemples visuels avec polynômes d'ordre élevé : en utilisant un polynôme d'ordre élevé, le modèle peut parfaitement s'ajuster aux points d'entraînement (overfitting), mais échouer à prédire correctement de nouvelles données, illustrant la perte de généralisation. À l'inverse, un polynôme d'ordre faible peut sous-ajuster, ne suivant pas la tendance réelle (source : Artificielle Pr. Nouhad SANOUSSI).

📝 Points essentiels

  • L'overfitting survient lorsque le modèle devient trop complexe, souvent en utilisant un polynôme d'ordre élevé ou en intégrant trop de variables, ce qui lui permet de s'ajuster parfaitement aux données d'entraînement mais de perdre en capacité de généralisation. La courbe de polynôme d'ordre élevé illustre cette situation : elle passe par tous les points d'entraînement, mais ne prédit pas bien de nouvelles données (source : Artificielle Pr. Nouhad SANOUSSI).

  • L'underfitting, en revanche, résulte d'un modèle trop simple, comme une régression linéaire sur des données non linéaires, ne capturant pas la tendance réelle. La courbe ne suit pas suffisamment la distribution des points, conduisant à une erreur élevée sur l'ensemble d'entraînement et de test.

  • La sélection du degré du polynôme est cruciale : un degré trop élevé favorise l'overfitting, tandis qu'un degré trop faible mène à l'underfitting. La visualisation des modèles avec différents ordres de polynômes permet d'observer ces phénomènes.

  • La généralisation est affectée par ces phénomènes : un modèle surajusté ne sera pas performant sur de nouvelles données, ce qui est problématique pour la robustesse du modèle.

💡 À retenir

L'overfitting correspond à un modèle trop complexe qui s'adapte trop précisément aux données d'entraînement, au détriment de sa capacité à généraliser, tandis que l'underfitting indique un modèle trop simple incapable de saisir la tendance réelle des données. La clé est de trouver un juste milieu pour optimiser la performance sur de nouvelles données.

📖 10. Méthodes d'évaluation

🔑 Notions clés & Définitions

  • MSE (Erreur Quadratique Moyenne) : La moyenne des carrés des erreurs, qui pénalise fortement les grandes erreurs. Selon Kobia (date non précisée), la MSE est sensible aux outliers et indique la performance globale du modèle en quantifiant l'écart moyen au carré entre les valeurs prédites et observées.
  • RMSE (Root Mean Squared Error) : La racine carrée de la MSE, plus facile à interpréter car dans la même unité que la variable à prédire, selon Kobia (date non précisée).
  • MAE (Erreur Absolue Moyenne) : La moyenne des valeurs absolues des erreurs, facile à comprendre car dans la même unité que la variable cible, pénalise également les grandes erreurs, comme indiqué par Kobia (date non précisée).
  • R² (Coefficient de Détermination) : Mesure la proportion de variance expliquée par le modèle, variant entre 0 et 1, où 1 indique une parfaite adéquation. Selon Kobia (date non précisée), il indique l'efficacité du modèle et la qualité de la prédiction.
  • Importance de la validation : La validation croisée ou autre méthode est essentielle pour éviter l'overfitting, en vérifiant que le modèle généralise bien à de nouvelles données, comme souligné dans la référence principale de Pr. Andrew NG (date non précisée).

📝 Points essentiels

  • La MSE et le RMSE pénalisent fortement les grandes erreurs, ce qui peut conduire à privilégier des modèles qui évitent ces erreurs extrêmes, mais ils sont sensibles aux outliers (Kobia, date non précisée).
  • La MAE offre une interprétation plus intuitive car elle est dans la même unité que la variable cible, ce qui facilite la compréhension de la performance du modèle (Kobia, date non précisée).
  • Le R² permet d’évaluer la proportion de variance expliquée par le modèle, avec une valeur proche de 1 indiquant une bonne qualité de prédiction. Il est utile pour comparer différents modèles de régression (Kobia, date non précisée).
  • La validation régulière est cruciale pour éviter l’overfitting, en assurant que la performance observée sur l’ensemble d’entraînement se reproduise sur de nouvelles données, ce qui garantit la robustesse du modèle (Pr. Andrew NG, date non précisée).

💡 À retenir

Les métriques MSE, MAE et R² sont complémentaires pour évaluer la performance d’un modèle de régression, et leur utilisation conjointe permet d’obtenir une vision complète de sa qualité tout en évitant le surapprentissage grâce à une validation rigoureuse.

📊 Tableaux de Synthèse

AspectRégression linéaire multipleRégression polynomialeFonction de coûtDescente de gradient
ModèleFonction linéaire multivariée, hyperplanFonction polynomiale, termes de degré supérieurMesure l’erreur globale, souvent MSEMéthode d’optimisation pour minimiser la fonction de coût
NotationVecteurs/matrices pour variables et paramètresTransformation des variables en puissancesÉvalue la différence entre prédictions et valeurs réellesAjuste itérativement les paramètres dans la direction du gradient
LimitesIncapacité à modéliser relations non linéairesSurajustement si degré trop élevéNécessite une minimisation efficaceConvergence dépend du taux d’apprentissage
Auteur--Andrew NG-

⚠️ Pièges & Confusions Fréquentes

  1. Confondre la régression linéaire simple et multiple : la multiple utilise plusieurs variables indépendantes.
  2. Croire que la régression polynomiale ne peut pas surajuster : elle peut très facilement conduire à un overfitting si le degré est trop élevé.
  3. Confondre la fonction de coût avec la fonction d’évaluation : la première guide l’optimisation, la seconde mesure la performance.
  4. Négliger l’impact du choix du taux d’apprentissage dans la descente de gradient, pouvant entraîner une convergence lente ou instable.
  5. Confondre hyperplan (géométrie) et modèle (fonction hypothèse) : hyperplan est une représentation géométrique en dimension supérieure.
  6. Oublier que la transformation en polynômes augmente la dimensionnalité, ce qui peut compliquer l’optimisation.
  7. Ignorer la nécessité de régularisation pour éviter overfitting lors de l’utilisation de modèles polynomiaux.

✅ Checklist Examen

  • Connaître la définition de la régression linéaire multiple selon Perroux.
  • Savoir que la fonction hypothèse en régression multiple est une combinaison linéaire des variables.
  • Expliquer l’hypothèse multivariée et sa représentation matricielle.
  • Définir la régression polynomiale et ses avantages par rapport à la régression linéaire simple.
  • Identifier les risques de surajustement avec un degré élevé en régression polynomiale.
  • Décrire la fonction de coût utilisée en régression (notamment la moyenne des erreurs quadratiques).
  • Expliquer le rôle de la descente de gradient dans l’optimisation des paramètres.
  • Connaître la formule de la fonction hypothèse en régression polynomiale.
  • Comprendre la différence entre erreur quadratique moyenne et erreur absolue moyenne.
  • Savoir que le coefficient de détermination R² mesure la qualité de la prédiction.
  • Identifier les causes principales de overfitting et underfitting.
  • Connaître les méthodes d’évaluation des modèles (validation croisée, test, etc.).
  • Vérifier la maîtrise des concepts clés abordés par Andrew NG.

Тествайте знанията си

Тествайте знанията си по Introduction à la Régression et Évaluation с 10 въпроса с множество отговори с подробни корекции.

1. Qu'est-ce que la régression linéaire multiple ?

2. Quel auteur a formulé ou popularisé la méthode de régression polynomiale dans le contexte de l'apprentissage automatique ?

Вземете теста →

Прегледайте с флашкарти

Запомнете ключовите концепции на Introduction à la Régression et Évaluation с 20 интерактивни флашкарти.

Régression linéaire multiple — définition ?

Modèle prédisant une variable avec plusieurs variables indépendantes.

Hypothèse multivariée — rôle ?

Modéliser la relation linéaire entre plusieurs variables et la cible.

Notation variables multiples — utilisation ?

Représenter vecteurs/matrices pour simplifier les calculs.

Вижте флашкартите →

Similar courses

Създайте свои собствени листове за преговор

Импортирайте курса си и AI генерира листове, тестове и флашкарти за 30 секунди.

Генератор на листове