Quiz: Optimisation et Régularisation en Apprentissage Profond — 10 questions

Question 1

1. Quelle est la principale fonction d'une régularisation en apprentissage profond ?

Réduire la complexité du modèle pour éviter le surapprentissage

Augmenter la capacité du modèle pour mieux s'adapter aux données

Augmenter la vitesse de convergence de l'algorithme de gradient

Diminuer la taille des données d'entraînement pour accélérer l'apprentissage

Explanation

La régularisation vise à limiter la capacité du modèle afin d'éviter qu'il ne mémorise le bruit dans les données d'entraînement, ce qui conduit à un meilleur généralisation. Elle réduit donc la complexité du modèle pour prévenir le surapprentissage.

Answer

Réduire la complexité du modèle pour éviter le surapprentissage

Question 2

2. Quelle méthode est utilisée pour calculer de manière efficace les gradients dans un réseau de neurones ?

La descente de gradient par la règle de la chaîne.

La méthode du gradient à pas fixe.

La méthode des moindres carrés.

Les règles de l'algèbre linéaire classique.

Explanation

La backpropagation utilise la règle de la chaîne pour calculer efficacement les gradients dans un réseau de neurones, ce qui permet une mise à jour efficace des paramètres.

Answer

La descente de gradient par la règle de la chaîne.

Question 3

3. Quel est le rôle de la méthode de Dropout dans la régularisation des réseaux neuronaux ?

Augmenter la taille du réseau en ajoutant des neurones

Augmenter la vitesse de convergence en modifiant la fonction de perte

Réduire le nombre de couches du réseau

Désactiver aléatoirement certains neurones pendant l'entraînement

Explanation

Dropout consiste à désactiver aléatoirement un pourcentage de neurones lors de chaque étape d'entraînement, ce qui empêche les neurones de devenir trop dépendants les uns des autres et améliore la capacité de généralisation du modèle.

Answer

Désactiver aléatoirement certains neurones pendant l'entraînement

Question 4

4. Selon la fiche, quels optimisateurs avancés combinent plusieurs techniques pour améliorer la convergence ?

SGD et Momentum.

Adam et RMSProp.

Adagrad et Descente de gradient classique.

Méthodes basées uniquement sur la descente de gradient descendante vanilla.

Explanation

Adam et RMSProp sont des optimiseurs avancés qui combinent plusieurs techniques comme l’adaptativité et le momentum pour accélérer la convergence.

Answer

Adam et RMSProp.

Question 5

5. Parmi les optimiseurs suivants, lequel combine à la fois la notion de momentum et une adaptation du taux d'apprentissage pour chaque paramètre ?

RMSProp

SGD classique

Adam

Adagrad

Explanation

L'optimiseur Adam combine les avantages du momentum (accumulation des gradients passés) et de l'adaptativité du taux d'apprentissage pour chaque paramètre, ce qui permet une convergence plus efficace et stable.

Answer

Régularisation L1.

Answer

Surapprentissage.

Answer

Les fonctions d'activation non linéaires telles que ReLU, tanh, sigmoid.

Answer

Oscillations ou stagnation.

Answer

L1 favorise la sparsité, L2 décourage les poids importants.

Question 6

6. Quelle régularisation est recommandée pour encourager la sparsité dans les poids d'un réseau ?

Régularisation L2.

Régularisation L1.

Dropout.

Early stopping.

Explanation

La régularisation L1 favorise la sparsité en ajoutant une pénalité basée sur la somme absolue des poids, ce qui incite certains à devenir nuls.

Question 7

7. Quel problème survient quand un modèle de réseau neuronal mémorise le bruit dans les données d'entraînement ?

Sous-apprentissage.

Surapprentissage.

Convergence trop lente.

Overfitting dû à la régularisation excessive.

Explanation

Le surapprentissage survient lorsque le modèle mémorise le bruit et le bruit spécifique des données d’entraînement, réduisant sa capacité à généraliser.

Question 8

8. Parmi les éléments suivants, quel est un composant clé qui rend un modèle de réseau non linéaire ?

Les fonctions d'activation non linéaires telles que ReLU, tanh, sigmoid.

L'absence d'activations dans le réseau.

Une seule couche linéaire.

La moyenne des poids.

Explanation

Les fonctions d'activation non linéaires telles que ReLU, tanh, et sigmoid rendent le modèle non linéaire, ce qui est crucial pour apprendre des représentations complexes.

Question 9

9. Quel phénomène peut être causé par une complexité excessive du paysage de la perte ?

Oscillations ou stagnation.

Une convergence très rapide.

Une réduction automatique du taux d'apprentissage.

Une capacité sous-optimale du modèle.

Explanation

Une complexité trop élevée du paysage de perte peut entraîner des oscillations ou une stagnation lors de l'optimisation, rendant l'apprentissage difficile.

Question 10

10. Quelle est la principale différence entre la régularisation L1 et L2 selon la fiche?

L1 favorise la sparsité, L2 décourage les poids importants.

L1 pénalise en ajoutant la norme au carré, L2 la norme absolue.

L1 et L2 ont le même effet sur la sparsité.

L2 est utilisable uniquement avec la descente de gradient, L1 pas.

Explanation

La régularisation L1 favorise la sparsité des poids en ajoutant la norme absolue, alors que L2 pénalise la grandeur de tous les poids mais ne favorise pas la sparsité spécifiquement.

Quiz: Optimisation et Régularisation en Apprentissage Profond — 10 questions

Detailed questions and answers

1. Quelle est la principale fonction d'une régularisation en apprentissage profond ?

2. Quelle méthode est utilisée pour calculer de manière efficace les gradients dans un réseau de neurones ?

3. Quel est le rôle de la méthode de Dropout dans la régularisation des réseaux neuronaux ?

4. Selon la fiche, quels optimisateurs avancés combinent plusieurs techniques pour améliorer la convergence ?

5. Parmi les optimiseurs suivants, lequel combine à la fois la notion de momentum et une adaptation du taux d'apprentissage pour chaque paramètre ?

6. Quelle régularisation est recommandée pour encourager la sparsité dans les poids d'un réseau ?

7. Quel problème survient quand un modèle de réseau neuronal mémorise le bruit dans les données d'entraînement ?

8. Parmi les éléments suivants, quel est un composant clé qui rend un modèle de réseau non linéaire ?

9. Quel phénomène peut être causé par une complexité excessive du paysage de la perte ?

10. Quelle est la principale différence entre la régularisation L1 et L2 selon la fiche?

Review with flashcards

Study the revision sheet

Similar courses

Écosystème de l’esport et médiation numérique

Listes, piles, files et arbres

Algorithmique et structures de données

Gestion des fichiers en PHP

Identification utilisateur en PHP

Automated PCB Fault Diagnosis

Create your own quizzes