|
 |
Jeudi 4 Avril
Heure: |
13:30 - 14:30 |
Lieu: |
Salle B107, bâtiment B, Université de Villetaneuse |
Résumé: |
Apprentissage automatique à partir de données complexes et dynamiques: Application aux données textuelles |
Description: |
Parisa RASTIN Les données actuelles sont de plus en plus variées et complexes et il est en général nécessaire dadapter les algorithmes danalyse à chaque type de description des données. Les algorithmes dapprentissage devraient cependant pouvoir être fonctionnels quel que soit le type des données et la métrique choisie. Nous présentons dans cet exposé un algorithme de clustering relationnel basée sur le système de Coordonnées Barycentriques pour homogénéiser la représentation des objets et des prototypes et traiter de grands ensembles de données complexes. Dans le système de Coordonnées Barycentriques, lespace de représentation est défini par un ensemble unique de points de support choisis parmi les objets de la base d'apprentissage. La définition dun prototype correspond au calcul dun objet dans lespace barycentrique. À partir de ces approches, nous proposons un algorithme d'apprentissage basé sur un réseau de neurones artificiel défini dans l'espace barycentrique, adapté aux flux de données textuelles et permettant un suivit dynamique de l'évolution des données au cours du temps. Nous présenterons une applications concrètes sur lextraction de domaines dintérêt extraits dURLS à partir de trace de navigation en ligne. |
|
|