|
|
Jeudi 31 Janvier
Heure: |
12:15 - 13:30 |
Lieu: |
Salle B107, bâtiment B, Université de Villetaneuse |
Résumé: |
Approches génériques pour le traitement des données textuelles et numériques volumineuses, changeantes et multi-vues et des données en graphes |
Description: |
Jean-Charles Lamirel Face à la croissance continue des informations numériques, de multiples natures, qui sont disponibles en ligne, un des challenges importants pour les linguistes et les analystes de l'information, afin de pouvoir formuler des hypothèses et de valider des modèles, est d'exploiter des outils efficaces pour l'analyse de données, capables de s'adapter à des volumes importants de données hétérogènes, changeantes et souvent et de nature distribuée et multi-vues. Nous aborderons dans cette présentation les principes généraux de la maximisation des traits, une nouvelle approche statistique générique initialement dédiée au traitement des données textuelles volumineuses, mais généralisable à tout type de données numériques dynamiques et multi-vues ou à des données hybrides (textuelles-numériques) et à des données en graphe. Nous reviendrons sur ses différentes applications à succès dans les deux cadres, supervisé et non supervisé, en comparant ses performances avec celles des méthodes de létat de lart sur des corpus de données de référence. Nous montrerons les avantages supplémentaires liés à son intégration dans un paradigme danalyse multi-vues basé sur le raisonnement bayésien non supervisé. Nous mettrons finalement en évidence lintérêt de cette méthode pour lextraction dinformation dans les grands graphes et pour la comparaison de graphes de taille et de densité variable. |
|
|