Jeudi 31 Janvier


Retour à la vue des calendrier
Jeudi 31 Janvier
Heure: 12:15 - 13:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Approches génériques pour le traitement des données textuelles et numériques volumineuses, changeantes et multi-vues et des données en graphes
Description: Jean-Charles Lamirel Face à la croissance continue des informations numériques, de multiples natures, qui sont disponibles en ligne, un des challenges importants pour les linguistes et les analystes de l'information, afin de pouvoir formuler des hypothèses et de valider des modèles, est d'exploiter des outils efficaces pour l'analyse de données, capables de s'adapter à des volumes importants de données hétérogènes, changeantes et souvent et de nature distribuée et multi-vues.
Nous aborderons dans cette présentation les principes généraux de la maximisation des traits, une nouvelle approche statistique générique initialement dédiée au traitement des données textuelles volumineuses, mais généralisable à tout type de données numériques dynamiques et multi-vues ou à des données hybrides (textuelles-numériques) et à des données en graphe.
Nous reviendrons sur ses différentes applications à succès dans les deux cadres, supervisé et non supervisé, en comparant ses performances avec celles des méthodes de l’état de l’art sur des corpus de données de référence. Nous montrerons les avantages supplémentaires liés à son intégration dans un paradigme d’analyse multi-vues basé sur le raisonnement bayésien non supervisé. Nous mettrons finalement en évidence l’intérêt de cette méthode pour l’extraction d’information dans les grands graphes et pour la comparaison de graphes de taille et de densité variable.