1 / 15

Projet Acquisition de connaissances

INSA de Rennes Département INFO 4 ième année – G2.1. Projet Acquisition de connaissances. Réalisé par Anne-Laure Berrée , Andra Maria Blaj , Stéphanie Charlet , Diana Dragusin , Daphné Dussaud , Emeline Escolivet , Nolwenn Poirier & Fanny Tollec. Encadré par Peggy CELLIER.

Télécharger la présentation

Projet Acquisition de connaissances

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. INSA de Rennes Département INFO 4ième année – G2.1 Projet Acquisition de connaissances Réalisé par Anne-Laure Berrée,Andra Maria Blaj, Stéphanie Charlet, Diana Dragusin, Daphné Dussaud, Emeline Escolivet, Nolwenn Poirier & Fanny Tollec Encadré par Peggy CELLIER

  2. Plan Contexte et objectifs Choix effectués Description de l’outil Comparaison avec Weka

  3. Contexte et objectifs Quelques rappels • Règles d’associations • SI condition(s) ALORS • fait(s) Weka • Objectif général • Extraire des règles • d’associations à • partir de données • de la forme Notre outil

  4. Contexte et objectifs Objectifs • Objectif n°1 • Transformer deux types de jeux de données en la matrice Transaction/Items • Objectif n°2 • Implémenter un algorithme from scratch effectuant un travail semblable à Apriori • Objectif n°3 • Implémenter différents calculs d’indice statistique • Objectif n°4 • Implémenter différents types d’itemsets • Objectif n°5 • Comparer les performances de l’outil avec Weka

  5. II. Choix effectués Langage Emeline Pourquoi Java ? • Langage orienté objet permettant une modélisation simple et rapide • Présence de structures de données facilement manipulables • Import des fichiers relativement aisé • Facilité de mise en place d’une interface graphique • Multiplateforme

  6. II. Choix effectués Algorithme Emeline/Andra Algorithme Apriori Algorithme FP-Growth

  7. II. Choix effectués Algorithme Emeline/Andra Comparaison des algorithmes

  8. II. Choix effectués Modélisation RègleAssociation Attribut • - Integerpremisse[] • int but • double valeurCritere • String attribut Moteur • boolean[][] matrix • double seuilSupportMin • double seuilCritereMin Indice AlgoApriori • Vector<Vector<Integer>> transactions • Vector<Integer> unItems • Vector<ItemSet> itemsFreq IndiceSupport IndiceConfiance IndiceLift

  9. III. Description de l’outil Import et mise en forme des données • Données non structurées : • articles de journaux • Données structurées : • tickets de caisse Attributs et objets : Tickets de caisse Attributs : Mots sous forme de liste + Phase de discrétisation des données Discrétisation d’attributs continus - Âge < 20 - 20 < Âge < 40 - 40 < Âge < 60 Discrétisation d’attributs nominaux -Homme -Femme Objets : Articles de journaux = =

  10. III. Description de l’outil Implémentation de l’algorithme 1. Transformation des données de matrice booléenne en transactions 2. Génération des un-imtemsetsfréquents 3. Génération des 2-itemsets fréquents

  11. III. Description de l’outil Implémentation de l’algorithme 4. Génération des k-itemsetsfréquents constructionkItemsSets ( entier k , entier supportMin ) si ( il y a eu des k-1 - i t emsets générés) alors pour chaque i temset i de taille k-1 faire pourchaqueitemset j de taille k-1 différent de i faire si ( i et j sont différents que par le dernier élément) alors kItem = i+dernier élément de j tri de kItem en ordre croissant des items supportItem = support de kItem si ( supportItem>=supportMin ) alors ajouter kItem et son support dans la liste des itemsetsfréquents finsi finsi fin pour fin pour si ( k+1 est inférieur au cardinal de la liste de 1- itemsets fréquents ) alors constructionkItemsSets ( k+1, support ) ; finsi finsi fin

  12. III. Description de l’outil Génération des itemsets • Anne-Laure

  13. III. Description de l’outil Exécution et affichage des résultats • Anne-Laure (on pourrait inclure la démo là!)

  14. IV. Comparaison avec Weka • Fanny

  15. Bilan • Difficultés rencontrées • Choix de modélisation • Mise en commun • Atouts de l’outil • Choix de modélisation • Mise en commun

More Related