15 Avril - 21 Avril


Retour à la vue des calendrier
Lundi 15 Avril
Heure: 14:00 - 15:00
Lieu: Salle C311, bâtiment C, Université de Villetaneuse
Résumé: Accéder à l'information selon des critères temporels
Description: Charles Teissèdre La présentation portera sur la problématique de l'accès aux textes numériques, en particulier de l'accès à leur
« contenu informationnel » selon des critères temporels. Bien que les systèmes
de recherche d'information améliorent et enrichissent continuellement les fonctions
d'interrogation et de filtrage qu'ils proposent, il y a toutefois peu de
réalisations opérationnelles permettant de prendre en charge les informations
temporelles ; non pas tant celles autour
des documents (comme leur date de publication), mais celles exprimées dans les documents. Sous
l'angle de la représentation des connaissances, des difficultés
émergent lorsqu'il s'agit de représenter des informations temporelles:
(1) au niveau de la modélisation d'abord (comment représenter des
informations temporelles de natures très variées, parfois imprécises ?),
(2) au niveau des données elles-mêmes ensuite (comment tirer parti des
informations temporelles exprimées dans les textes pour enrichir par
exemple des entrepôts de données ?), et enfin (3) au niveau de
l'exploitation de ces données (comment les interroger ?).


On montrera que l'analyse linguistique des unités textuelles qui
contribuent de façon saillante à l'ancrage dans le temps des situations
décrites
dans les textes, les adverbiaux de localisation temporelle, peut
permettre d'apporter des éléments de réponse à ces difficultés.
L'approche sera illustrée par des réalisations expérimentales pour la
recherche d'information et l'acquisition d'information à partir des
textes.
Mardi 16 Avril
Heure: 14:00 - 17:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Sur l'arbre des semigroupes numériques
Description: Jean Fromentin Un semi-groupe numérique est une partie de N stable par addition et de complément fini.D'apparence simple, ces objets conduisent à de nombreux problèmes : problème de Frobenius (ou de rendu de monnaie), conjecture de Wilf, ...Les semi-groupes numériques peuvent être regroupés par genre, le genre d'un semi-groupe numérique étant le cardinal de son complémentaire dans N. Une question naturelle est alors de déterminer le nombre de semi-groupes numériques de genre donné.Les valeurs de n_g ont été calculés par Maria Bras Amoros pour g
Mercredi 17 Avril
Heure: 00:59 - 16:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Extraction de règles pour l'annotation automatique et problèmes d'incomplétude lexicale
Description: Damien Nouvel Les
quantités d'informations textuelles à analyser sont de plus en plus importantes et nécessitent de mettre au point des techniques robustes
afin de les traiter. Dans ce contexte, les travaux présentés portent sur
deux problématiques distinctes : la reconnaissance des entités nommées
(REN) et l'incomplétude lexicale. Pour la REN, une approche s'appuyant
sur la fouille de données sera exposée, appliquée à des transcriptions
d'émissions radiodiffusées ou télévisuelles. Celle-ci propose deux
contributions originales : l'utilisation de techniques de fouille de
données pour la REN (extraction de motifs séquentiels hiérarchiques de
segments comme règles d'annotation) et la formulation de la REN comme
positionnement de balises d'annotation (marqueurs, instructions). Les
performances obtenues dans le cadre de la campagne Etape seront
présentées. Pour ce qui concerne l'incomplétude lexicale, des travaux
récents réalisés dans le cadre du projet EDyLex seront exposés. Ils
montrent la possibilité d'acquérir automatiquement de nouvelles entrées
(hors entités nommées) pour ajout au lexique, par utilisation de
ressources externes et de règles de dérivation ou de composition.
Heure: 12:15 - 13:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Relations to improve motion understanding
Description: Cristina Manfredotti Many domains in the real world are richly structured, containingseveral distinct objects interacting with each other. This is the caseof many problems as, for example, multi-target tracking, activityrecognition, automatic surveillance and traffic monitoring. The commonground of these types of problems is the necessity of recognizing andunderstanding the scene, the activities that are going on, who are theactors, their role and estimate their positions. The explicitrepresentation of the interconnected behaviors of agents can providebetter models for capturing key elements of the activities in thescene.We develop a tracking framework that takes into account interactionsbetween objects allowing the recognition of complex activities. Incontrast to classic approaches that consider distinct phases oftracking and activity recognition, our framework performs these twotasks simultaneously. In particular, we adopt a Bayesian standpointwhere the system maintains a joint distribution of the positions, theinteractions and the possible activities. This turns out to beadvantageous, as information about the ongoing activities can be usedto improve the prediction step of the tracking, while, at the sametime, tracking information can be used for online activityrecognition. Moreover, the explicit recognition of the relationshipsbetween interacting objects improves the understanding of theirdynamic domain. Experimental results in two different settings showthat our approach 1) decreases the error rate and improves theidentity maintenance of the positional tracking and 2) identifies thecorrect activity with higher accuracy than standard approaches.In order to automatically learn thee transition models we propose amulti-layer framework, called LEMAIO that makes use of hierarchicalabstraction. LEMAIO can learn models of activities involving multipleinteracting objects from time sequences of data concerning theindividual objects. Experiments in the sea navigation domain yieldedlearned models that were then successfully applied to activityrecognition, activity simulation and multitarget tracking.
Jeudi 18 Avril
Heure: 00:59 - 11:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Sentiment Analysis on Italian Tweets
Description: Malvina Nissim Micro texts such as tweets are a precious mine for anyone who wants to grasp opinions of groups of people, possibly about a specific topic or product. Tweets are associated to several kinds of meta-data, such as geographical coordinates of where the tweet was sent from, the id of the sender, the time of the day, and so on --- all information that can be combined with text analysis to yield an even more accurate picture of who says what, and where, and when. Mining opinions, however, requires data and tools which are not necessarily available for all languages of interest. In this talk I will present TWITA, the first of corpus of tweets for Italian, collected in such a way that makes it possible to use the exact same strategy to build similar resources for other languages without any manual intervention. I will also show how we derive a polarity lexicon for Italian, organised by word senses, also using a fully automatic strategy which can replicated to obtain such a resource for other languages. Finally, I will discuss preliminary experiments on using the lexicon to automatically assign polarity to two subsets of the tweets in our corpus, namely a generic one, and a topic-specific one, and highlight limitations of a shallow approach and directions for improvement.
(joint work with Valerio Basile, Rijksuniversiteit Groningen)
Heure: 09:30 - 12:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Journée inaugurale du pôle MathSTIC de Paris 13
Description: Journée inaugurale du pôle MATHSTIC :3 laboratoires de l'Institut Galilée (Le LAGA, le LIPN, et le L2TI)s'associent pour proposer une journée inaugurale du POLE MATHSTIC,le 18 avril de 9h30 à 17h30 en Amphi A.9h30 Accueil9h45 Présentation du pôle (C. Fouqueré) Mots de C. Desfrançois VPCS et F. Dibos Directrice del'institut Galilée10h Présentation de l'axe 2 (L. Halpern) Architectures émergentes et passage à l'échelle d'applicationsparallèles (C. Coti) Déploiement de réseaux sans fil (N. Achir ) Méthodes de décomposition de domaine espace-temps (C. Japhet) Calculs performants pour la simulation d'écoulements à frontsraides (F. Benkhaldoun)12h Buffet (salle M100 de l'IUT)13h15 Présentation de l'axe 3 (A. Sportiello) Mots circulaires (B. Rittaud) Physique combinatoire : algèbres de Hopf - combinatoires enthéories quantiques de champs (A. Tanasa) Combinatoire et aléas (P. Marchal)15h15 pause café15h30 Présentation de l'axe 1 (R. Wolfler-Calvo) Les algorithmes de flots à la rescousse (L. Létocart) Compression d'images avec contrôle de qualité : au delà ( B. Matei) Améliorer la mobilité grâce aux Systèmes de TransportIntelligents (K. Boussetta)17h30 fin
Heure: 12:30 - 14:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Classification non-supervisée : de la multiplicité des données à la multiplicité des analyses
Description: Jacques-Henri Sublemontier La classification automatique non-supervisée est un problème majeur, aux frontières de multiples communautés issues del'Intelligence Artificielle, de l'Analyse de Données et des Sciences de la Cognition. Elle vise à formaliser et mécaniser la tâchecognitive de classification, afin de l'automatiser pour la rendre applicable à un grand nombre d'objets (ou individus) à classer.Des visées plus applicatives s'intéressent simplement à l'organisation automatique de grands ensembles d'objets en différentsgroupes partageant des caractéristiques communes. Les objets à classer peuvent être : des clients dans le cadre du marketing,des gènes ou des protéines dans le cadre de la biologie, des acteurs dans le cadre de la recherche de communautés dans les réseaux sociaux, ou bien encorede caractères manuscrits dans le cadre de la reconnaissanceautomatique de caractères. L'objet de ce séminaire est de s'intéresser à des méthodes de classification non-supervisées applicables lorsque lesobjets peuvent être décrits par plusieurs représentations indépendantes simultanément, ou lorsque plusieurs sourcesd'informations sont disponibles pour compléter et guider la recherche d'une ou plusieurs structures classificatoires des données.La notion de multiplicité devient alors proéminente, et celle-ci sera observée selon différents angles et à travers différentsparadigmes de l'apprentissage automatique et de la fouille de données.  Un exposé d'études récentes et de contributions autour des paradigmes du"clustering multi-vues", de l'"alternative clustering", du "clustering semi-supervisé" du "clustering ensemble" et plus généralementde la combinaison, coopération ou collaboration de clusterers (ou algorithmes de regroupement) sera présenté,tout en motivant la recherche de solutions unifiantes. Ce dernier thème de recherche permet d'apporter des propositions répondant à desproblèmes très actifs et actuels en Fouille de Données et en Extraction et Gestion des Connaissances.