Scéance nº 4 (6/12/06): programmation
sous MegaWave2, mélange de Gaussiennes
Énoncé et fichier:
sample_gm.c Correction et fichier de correction:
sample_gm2.c
La validation se fait par un mini-projet: soit le sujet image,
soit un sujet pris dans la liste "Sujets SVM" (en vous efforçant
autant que possible, pour les "sujets SVM", de choisir des sujets
différents). Merci de nous
envoyer un message électronique à tous les deux dès que vous avez fait
votre choix pour nous en informer.
Sujets SVM
Les sujets SVM consistent en :
l'examen de l'une des bases de données contenues dans R
l'apprentissage (régression ou classification) de l'une des variables en fonction des autres
Un rapport manuscrit ou typographié de quelques pages détaillera les étapes de l'apprentissage et l'interprétation
des résultats. On poura en particulier discuter :
le découpage de la base
l'optimisation des paramètres
les mesures de performances
La soutenance consistera en une présentation (en salle machine) du code R correspondant à l'apprentissage.
Le rapport sera remis le jour de la soutenance en deux exemplaires.
Liste de sujets
Base Titanic. Estimation de la probabilité de survie en fonction de Class, Sex, Age.
Base Iris. Estimation du type en fonction des dimensions des pétales et sépales.
Base Theoph. Estimation de la concentration en theophylline en fonction de la dose administrée, du poids du sujet, etc.
Base ChickWeight. Estimation du poids d'un poulet en fonction de son age et de son régime.
Base swiss. Estimation de la fertilité en fonction de paramètres socio-économiques.
Base faithful. Estimation du temps entre éruptions en fonction de leur durée.
Pour avoir des informations sur une base donnée, taper sous R la commande
?base (exemple: ?Titanic pour la base Titanic). Pour utiliser la base,
son nom seul suffit (exemple: Titanic).
Sujet image
Le mini-projet image est dans la continuation de la séance nº6 (base
de chiffres manuscrits US Postal). Il consiste en la rédaction d'un
compte-rendu manuscrit ou typographié (réponses aux questions de
l'énoncé), accompagné impérativement du listing des programmes C demandés
(nn_image2.c et nn_image3.c) et de la liste de toutes les commandes
shell utilisées pour produire les résultats.
La soutenance consistera en une courte présentation du travail réalisé,
suivie de questions. Le rapport sera remis au moment de la soutenance
en deux exemplaires.
La salle et les horaires de passage seront actualisés prochainement
sur cette page. Si vous avez des contraintes pour votre horaire de passage,
merci de nous le signaler.