Avril 2013


Retour à la vue des calendrier
Mardi 2 Avril
Heure: 14:00 - 17:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: A set of triangulations of manifolds in arbitrary dimensions from multi-graphs with colored edges
Description: Valentin Bonzom I will talk about families of triangulations of manifolds in arbitrary dimensions which can be represented by multi-graphs with colored edges.I will focus on an important family of such triangulations, called melonic triangulations, which controls the behavior of integrals over random tensors (a promising approach to quantum gravity). These integrals can be solved by an exact counting of the melonic triangulations. If time permits, I will describe the relation to loop models on random planar maps, and also an interesting family of colored triangulations related to meanders.
Jeudi 4 Avril
Heure: 12:30 - 13:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Classification croisée par approximations matricielles
Description: Lazhar Labiod Ce travail présente le problème de la classification croisée sous la forme d'un problème d'optimisation algébrique. Il propose trois approximations matricielles diachroniques pour le problème de minimisation de la fonction objective du double k-means. La première approximation consiste en la recherche de la meilleure approximation au sens de la norme de Frobenius via une SVD, la seconde est basée sur une tri-factorisation de matrice non négative et la troisième est une approximation par matrice bi-stochastique.
Vendredi 5 Avril
Heure: 10:30 - 11:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: LegalruleML pour la validation de normes juridiques dans le cadre d'un projet de brevet
Description: Naouel Karam Les revendications d'un brevet sont soumis à des tests de conformité
spécifiques à chaque système de brevet. Ces normes sont décrites en
langage naturel et peuvent être interprétées de différentes manières.
Dans le cadre de ce travail, nous proposons une formalisation des
directives applicables dans le système de brevet américain. Nous avons
choisi d'utiliser LegalRuleML, un standard XML pour la représentation
d'information légale basé sur RuleML. Afin de prendre en compte la
sémantique des normes, ce dernier est couplé à un traitement du langage
naturel et une annotation ontologique. Le raisonnement à base de règles
est ensuite transféré au moteur de règles Prova.
Lundi 8 Avril
Heure: 14:00 - 15:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Outiller l'annotation manuelle de corpus : le bon (la qualité), la brute (la rapidité) et le truand (les biais)
Description: Karën Fort L'annotation manuelle de corpus est devenue un enjeu fondamental pour le
Traitement Automatique des Langues (TAL).
En effet, les corpus annotés sont utilisés aussi bien pour créer que
pour évaluer des outils de TAL.
Or, le processus d'annotation manuelle est encore mal connu et les
outils proposés pour supporter ce processus sont souvent mal utilisés, ce qui
ne permet pas de garantir le niveau de qualité de ces annotations. Je
présenterai lors de ce séminaire une vue d'ensemble de mes travaux de
thèse, qui ont porté sur la mise au point d'une méthodologie pour
l'annotation manuelle de corpus pour le TAL. Je détaillerai ensuite mes
travaux concernant l'impact de la pré-annotation automatique sur la
qualité et la rapidité de correction humaine, à
travers une série d'expériences menées sur l'annotation
morpho-syntaxique de
l'anglais. Je finirai en proposant des pistes de recherche sur
l'annotation assistée par ordinateur.
Mardi 9 Avril
Heure: 14:00 - 17:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Pyramides et diamants
Description: Sylvie Corteel On cherche à énumérer des pavages par dominos d'une région obtenuspar flip à partir d'un pavage minimal unique.Pour cela, on utilise les diagrammes maya, les "vertex operators" etles fonctions de Schur supersymétriques. On obtient des formules type"équerre" ; dont des cas particuliers compte les pavages du diamantaztèque ou les partitions pyramides de Ben Young.[Travail en commun avec Jérémie Bouttier et Guillaume Chapuy)]
Mercredi 10 Avril
Heure: 14:00 - 15:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Représentation et exploitation des connaissances de domaine : vers un développement dirigé par les ontologies
Description: Samira Si-said Cherfi





Les ontologies, grâce à leur
popularité et aux avancées accomplies tant du point de vue de la maturité
que de celui des solutions techniques relatives à leur mise
en œuvre, peuvent constituer un véhicule à cette connaissance.

Il explore ensuite quelques directions
de recherche pouvant compléter l'approche proposée.
Jeudi 11 Avril
Heure: 12:00 - 13:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Contributions à la gestion et à la fouille de données spatiotemporelles imprécises
Description: Cyril de Runz Ce travail se positionne dans le cadre de la manipulation de données spatiotemporelles réelles en tenant compte de leur imperfection et plus particulièrement de leur imprécision. La démarche présentée s'inscrit dans la volonté d'aller vers une meilleure gestion de celles-ci tant pour leur représentation que pour leur analyse et leur visualisation. Dans ce contexte, nos contributions portent d'une part sur la gestion des données imprécises tant au niveau conception et construction des systèmes d'information géographique que de l'interrogation des données, et, d'autre part, sur l'exploration, possiblement visuelle, des bases ainsi construites. Nos méthodes se basent notamment sur la définition d'indices temporels flous, de graphes, de rangs, de coloriage guidé par les données, etc. La démarche sera illustrée autour d'applications sur des données issues de l'archéologie préventive et sur des cas d'études prospectifs en agronomie et en urbanisme.
Heure: 14:00 - 15:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Analyse de réseaux complexes
Description: Vincent Labatut Le but de cette présentation est de décrire l'activité de recherche de l'équipe compnet de l'université Galatasaray (Istanbul, Turquie). celle ci porte sur l'analyse de réseaux complexes, et plus particulièrement:- l'extraction de réseaux à partir de données brutes (notamment textuelles)- leur caractérisation à l'aide de mesures topologiques, et la définition de mesures adaptées au système étudié- la détection de communautés : évaluation, génération de données de test, exploitation d'attributs nodaux dans le processus de détectionles domaines d'application abordés sont les réseaux sociaux, les réseaux de capteurs sans fil et les réseaux de services web.
Lundi 15 Avril
Heure: 14:00 - 15:00
Lieu: Salle C311, bâtiment C, Université de Villetaneuse
Résumé: Accéder à l'information selon des critères temporels
Description: Charles Teissèdre La présentation portera sur la problématique de l'accès aux textes numériques, en particulier de l'accès à leur
« contenu informationnel » selon des critères temporels. Bien que les systèmes
de recherche d'information améliorent et enrichissent continuellement les fonctions
d'interrogation et de filtrage qu'ils proposent, il y a toutefois peu de
réalisations opérationnelles permettant de prendre en charge les informations
temporelles ; non pas tant celles autour
des documents (comme leur date de publication), mais celles exprimées dans les documents. Sous
l'angle de la représentation des connaissances, des difficultés
émergent lorsqu'il s'agit de représenter des informations temporelles:
(1) au niveau de la modélisation d'abord (comment représenter des
informations temporelles de natures très variées, parfois imprécises ?),
(2) au niveau des données elles-mêmes ensuite (comment tirer parti des
informations temporelles exprimées dans les textes pour enrichir par
exemple des entrepôts de données ?), et enfin (3) au niveau de
l'exploitation de ces données (comment les interroger ?).


On montrera que l'analyse linguistique des unités textuelles qui
contribuent de façon saillante à l'ancrage dans le temps des situations
décrites
dans les textes, les adverbiaux de localisation temporelle, peut
permettre d'apporter des éléments de réponse à ces difficultés.
L'approche sera illustrée par des réalisations expérimentales pour la
recherche d'information et l'acquisition d'information à partir des
textes.
Mardi 16 Avril
Heure: 14:00 - 17:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Sur l'arbre des semigroupes numériques
Description: Jean Fromentin Un semi-groupe numérique est une partie de N stable par addition et de complément fini.D'apparence simple, ces objets conduisent à de nombreux problèmes : problème de Frobenius (ou de rendu de monnaie), conjecture de Wilf, ...Les semi-groupes numériques peuvent être regroupés par genre, le genre d'un semi-groupe numérique étant le cardinal de son complémentaire dans N. Une question naturelle est alors de déterminer le nombre de semi-groupes numériques de genre donné.Les valeurs de n_g ont été calculés par Maria Bras Amoros pour g
Mercredi 17 Avril
Heure: 00:59 - 16:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Extraction de règles pour l'annotation automatique et problèmes d'incomplétude lexicale
Description: Damien Nouvel Les
quantités d'informations textuelles à analyser sont de plus en plus importantes et nécessitent de mettre au point des techniques robustes
afin de les traiter. Dans ce contexte, les travaux présentés portent sur
deux problématiques distinctes : la reconnaissance des entités nommées
(REN) et l'incomplétude lexicale. Pour la REN, une approche s'appuyant
sur la fouille de données sera exposée, appliquée à des transcriptions
d'émissions radiodiffusées ou télévisuelles. Celle-ci propose deux
contributions originales : l'utilisation de techniques de fouille de
données pour la REN (extraction de motifs séquentiels hiérarchiques de
segments comme règles d'annotation) et la formulation de la REN comme
positionnement de balises d'annotation (marqueurs, instructions). Les
performances obtenues dans le cadre de la campagne Etape seront
présentées. Pour ce qui concerne l'incomplétude lexicale, des travaux
récents réalisés dans le cadre du projet EDyLex seront exposés. Ils
montrent la possibilité d'acquérir automatiquement de nouvelles entrées
(hors entités nommées) pour ajout au lexique, par utilisation de
ressources externes et de règles de dérivation ou de composition.
Heure: 12:15 - 13:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Relations to improve motion understanding
Description: Cristina Manfredotti Many domains in the real world are richly structured, containingseveral distinct objects interacting with each other. This is the caseof many problems as, for example, multi-target tracking, activityrecognition, automatic surveillance and traffic monitoring. The commonground of these types of problems is the necessity of recognizing andunderstanding the scene, the activities that are going on, who are theactors, their role and estimate their positions. The explicitrepresentation of the interconnected behaviors of agents can providebetter models for capturing key elements of the activities in thescene.We develop a tracking framework that takes into account interactionsbetween objects allowing the recognition of complex activities. Incontrast to classic approaches that consider distinct phases oftracking and activity recognition, our framework performs these twotasks simultaneously. In particular, we adopt a Bayesian standpointwhere the system maintains a joint distribution of the positions, theinteractions and the possible activities. This turns out to beadvantageous, as information about the ongoing activities can be usedto improve the prediction step of the tracking, while, at the sametime, tracking information can be used for online activityrecognition. Moreover, the explicit recognition of the relationshipsbetween interacting objects improves the understanding of theirdynamic domain. Experimental results in two different settings showthat our approach 1) decreases the error rate and improves theidentity maintenance of the positional tracking and 2) identifies thecorrect activity with higher accuracy than standard approaches.In order to automatically learn thee transition models we propose amulti-layer framework, called LEMAIO that makes use of hierarchicalabstraction. LEMAIO can learn models of activities involving multipleinteracting objects from time sequences of data concerning theindividual objects. Experiments in the sea navigation domain yieldedlearned models that were then successfully applied to activityrecognition, activity simulation and multitarget tracking.
Jeudi 18 Avril
Heure: 00:59 - 11:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Sentiment Analysis on Italian Tweets
Description: Malvina Nissim Micro texts such as tweets are a precious mine for anyone who wants to grasp opinions of groups of people, possibly about a specific topic or product. Tweets are associated to several kinds of meta-data, such as geographical coordinates of where the tweet was sent from, the id of the sender, the time of the day, and so on --- all information that can be combined with text analysis to yield an even more accurate picture of who says what, and where, and when. Mining opinions, however, requires data and tools which are not necessarily available for all languages of interest. In this talk I will present TWITA, the first of corpus of tweets for Italian, collected in such a way that makes it possible to use the exact same strategy to build similar resources for other languages without any manual intervention. I will also show how we derive a polarity lexicon for Italian, organised by word senses, also using a fully automatic strategy which can replicated to obtain such a resource for other languages. Finally, I will discuss preliminary experiments on using the lexicon to automatically assign polarity to two subsets of the tweets in our corpus, namely a generic one, and a topic-specific one, and highlight limitations of a shallow approach and directions for improvement.
(joint work with Valerio Basile, Rijksuniversiteit Groningen)
Heure: 09:30 - 12:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Journée inaugurale du pôle MathSTIC de Paris 13
Description: Journée inaugurale du pôle MATHSTIC :3 laboratoires de l'Institut Galilée (Le LAGA, le LIPN, et le L2TI)s'associent pour proposer une journée inaugurale du POLE MATHSTIC,le 18 avril de 9h30 à 17h30 en Amphi A.9h30 Accueil9h45 Présentation du pôle (C. Fouqueré) Mots de C. Desfrançois VPCS et F. Dibos Directrice del'institut Galilée10h Présentation de l'axe 2 (L. Halpern) Architectures émergentes et passage à l'échelle d'applicationsparallèles (C. Coti) Déploiement de réseaux sans fil (N. Achir ) Méthodes de décomposition de domaine espace-temps (C. Japhet) Calculs performants pour la simulation d'écoulements à frontsraides (F. Benkhaldoun)12h Buffet (salle M100 de l'IUT)13h15 Présentation de l'axe 3 (A. Sportiello) Mots circulaires (B. Rittaud) Physique combinatoire : algèbres de Hopf - combinatoires enthéories quantiques de champs (A. Tanasa) Combinatoire et aléas (P. Marchal)15h15 pause café15h30 Présentation de l'axe 1 (R. Wolfler-Calvo) Les algorithmes de flots à la rescousse (L. Létocart) Compression d'images avec contrôle de qualité : au delà ( B. Matei) Améliorer la mobilité grâce aux Systèmes de TransportIntelligents (K. Boussetta)17h30 fin
Heure: 12:30 - 14:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Classification non-supervisée : de la multiplicité des données à la multiplicité des analyses
Description: Jacques-Henri Sublemontier La classification automatique non-supervisée est un problème majeur, aux frontières de multiples communautés issues del'Intelligence Artificielle, de l'Analyse de Données et des Sciences de la Cognition. Elle vise à formaliser et mécaniser la tâchecognitive de classification, afin de l'automatiser pour la rendre applicable à un grand nombre d'objets (ou individus) à classer.Des visées plus applicatives s'intéressent simplement à l'organisation automatique de grands ensembles d'objets en différentsgroupes partageant des caractéristiques communes. Les objets à classer peuvent être : des clients dans le cadre du marketing,des gènes ou des protéines dans le cadre de la biologie, des acteurs dans le cadre de la recherche de communautés dans les réseaux sociaux, ou bien encorede caractères manuscrits dans le cadre de la reconnaissanceautomatique de caractères. L'objet de ce séminaire est de s'intéresser à des méthodes de classification non-supervisées applicables lorsque lesobjets peuvent être décrits par plusieurs représentations indépendantes simultanément, ou lorsque plusieurs sourcesd'informations sont disponibles pour compléter et guider la recherche d'une ou plusieurs structures classificatoires des données.La notion de multiplicité devient alors proéminente, et celle-ci sera observée selon différents angles et à travers différentsparadigmes de l'apprentissage automatique et de la fouille de données.  Un exposé d'études récentes et de contributions autour des paradigmes du"clustering multi-vues", de l'"alternative clustering", du "clustering semi-supervisé" du "clustering ensemble" et plus généralementde la combinaison, coopération ou collaboration de clusterers (ou algorithmes de regroupement) sera présenté,tout en motivant la recherche de solutions unifiantes. Ce dernier thème de recherche permet d'apporter des propositions répondant à desproblèmes très actifs et actuels en Fouille de Données et en Extraction et Gestion des Connaissances.
Lundi 22 Avril
Heure: 00:59 - 15:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Analyse et Etude de l'Evolution Temporelle des Réseaux Sociaux et du Web
Description: Mario Cataldi Au cours des dernières années, la quantité des informations disponibles (dans le Web et non) a énormément augmenté. Pour
cela, il est important d'analyser automatiquement ces grands ensembles
de données afin de fournir des nouveaux mécanismes pour analyser,
extraire, indexer et explorer leurs contenus.Pour ce faire,
afin de faciliter l'analyse des contenus textuels générés par les
utilisateurs (disponibles maintenant en très grande quantité),  dans ce
séminaire,  je montrerai de nouveaux mécanismes pour la détection de
thèmes (Topic Detection and Tracking, TDT) pour analyser et suivre
efficacement l'évolution de l'information textuelle exprimée dans un
réseau social et dans le Web. En particulier, je montrerai de nouvelles
mesures pour identifier les relations qui existent entre les
utilisateurs et entre les contenus et, par conséquent, des techniques
pour modéliser ces informations comme un graphe social où il est
possible de suivre les thèmes de discussion les plus émergents dans une
communauté. Afin de mieux évaluer la nature dynamique de ces
contenus, on introduira de nouveaux paramètres de nature temporelle qui
permettent de suivre en temps réel le flux d'information à l'intérieur
d'un réseau social. De plus, pour améliorer l'analyse de ces
contenus dynamiques, je montrerai de nouveaux mécanismes pour modéliser
l'influence parmi les utilisateurs et estimer leur réputation dans la
communauté en question.
Mercredi 24 Avril
Heure: 12:00 - 13:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Machine Learning as New Tool for Predicting Radiotherapy Response: Current Challenges and Future directions
Description: Issam El Naqa More than half all cancer patients receive radiation treatment (radiotherapy) as part of their treatment and it is the main treatment modality at advance stages of disease. Radiotherapy outcomes are determined by complex interactions between treatment dosimetric techniques, cancer pathology, and patient‐related physiological and biological factors. A common obstacle to building maximally predictive treatment outcome models for clinical practice in radiation oncology is the failure to capture this complexity of heterogeneous variable interactions and the ability to translate outcome models across different multi‐institutional data. Methods based on machine learning can identify data patterns, variable interactions, and higher order relationships among prognostic variables. In addition, they have the ability to generalize to unseen data before. However, within the plethora of machine learning techniques one needs to tailor these methods to radiotherapy outcomes. Off-shelf techniques may not be sufficient to address the current questions faithfully. In this presentation, we will provide examples of the application of machine learning to radiotherapy from our own work and highlight the current challenges, stir discussion between the radiation oncology and the machine learning communities to improve potential application of this promising technology to improve response prediction of radiotherapy outcomes.
Jeudi 25 Avril
Heure: 00:59 - 11:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Ressources sémantiques et Recherche d'Information (RI)
Description: Ourdia Ressad-Bouidghaghen Cette présentation, comprendra un aperçu de mes travaux de recherche
précédents autour de la thématique de la RI en exploitant des ressources
sémantiques. Je vous présenterai une méthode d'extraction de vues
sémantiques à partir de textes fondée sur la ressource
linguistique WordNet, en particulier les liens sémantiques exploités,
la méthode de désambiguïsation utilisée et la méthode adoptée pour la
pondération des termes.
Puis, un modèle de représentation d'un profil sémantique de
l'utilisateur, exploitant la taxonomie ODP, sera présenté en montrant
son exploitation pour le ré-ordonnancement des résultats de la recherche
pour les personnaliser pour un utilisateur mobile.
Je vous donnerais ensuite un aperçu de mes travaux en cours au
post-doctorat dans l'équipe, autour de la construction collaborative de
ressources sémantiques à partir de textes dans le cadre du projet
Légilocal.
Vendredi 26 Avril
Heure: 10:30 - 11:30
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Coopération de la fouille de données et du traitement automatique des langues pour l'accès à l'information
Description: Thierry Charnois Dans cet exposé, je présenterai nos travaux visant à intégrer les
techniques de fouille de données dans les méthodes de TAL pour l'accès à
l'information. L'idée est de tirer parti de la capacité des techniques
de fouille à faire émerger des connaissances sous forme de régularités
dans les données volumineuses de type base de données. Je montrerai
comment nous avons adapté ces techniques à la donnée textuelle, et sur
des problématiques de TAL. Dans un premier temps, je présenterai
comment la fouille de motifs séquentiels permet d'acquérir des patrons
linguistiques pour des tâches d'extraction d'information, par exemple
pour l'extraction de relations entre entités nommées dans les textes
biologiques ou médicaux. Dans un second temps, je montrerai un autre
type d'application portant sur l'utilisation de la fouille, en
particulier sur des textes à valeur littéraire, historique,
sociololgique, etc., pour faciliter le travail des linguistiques,
notamment pour l'exploration de grands textes ou l'analyse stylistique
de ceux-ci.