equipes:rcln:ancien_wiki:projets:cartographie_diaspora_savoirs_fouille_semantique

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
equipes:rcln:ancien_wiki:projets:cartographie_diaspora_savoirs_fouille_semantique [2019/04/04 16:35]
rosse [Identification du sujet et état des connaissances]
equipes:rcln:ancien_wiki:projets:cartographie_diaspora_savoirs_fouille_semantique [2020/11/23 18:42] (Version actuelle)
garciaflores ↷ Liens modifiés en raison d'un déplacement.
Ligne 1: Ligne 1:
 ====== Cartographie de la diaspora des savoirs par fouille sémantique des résultats de recherches sur le web ====== ====== Cartographie de la diaspora des savoirs par fouille sémantique des résultats de recherches sur le web ======
  
-//[[Cartografía|de la diáspora calificada aplicando técnicas de minería semántica a resultados de búsquedas en la web]]//+//[[equipes:rcln:ancien_wiki:projets:cartographie_diaspora_savoirs_fouille_semantique:es]]//
  
 **Projet accepté pour financement par le comité [[http://www.univ-paris13.fr/cofecub-ecos/ecos-nord|Ecos Nord]] (2016-2019)** **Projet accepté pour financement par le comité [[http://www.univ-paris13.fr/cofecub-ecos/ecos-nord|Ecos Nord]] (2016-2019)**
Ligne 53: Ligne 53:
 ===== Formation doctorale ===== ===== Formation doctorale =====
 ==== Au Mexique ==== ==== Au Mexique ====
-  *  Nous sommes à la recherche d'un doctorant mexicain apte à partir en France avec une bourse Conacyt dans le cadre de notre projet ([[equipes:rcln:poste:doctorado_francia_tecnologias_lenguaje|appel ici]])+  *  Nous sommes à la recherche d'un doctorant mexicain apte à partir en France avec une bourse Conacyt dans le cadre de notre projet ([[equipes:rcln:ancien_wiki:poste:doctorado_francia_tecnologias_lenguaje|appel ici]])
  
 ==== En France ==== ==== En France ====
Ligne 73: Ligne 73:
  
 ==== Originalité ==== ==== Originalité ====
-L’originalité de notre approche repose sur le fait d’appliquer des méthodes de pointe en TAL, fouille sémantique du web et //machine reading// au problème bien ancrée dans la réalité : celui de la recherche d’experts appartenant à la diaspora des savoirs. L’apport des résultats escomptés aurait un impacte épistémologique double : en technologies sémantiques il permettrait de produire une nouvelle génération d’outils en recherche d’experts qui prennent en compte le contexte biographique des experts ; en sociologie ils permettraient de produire une nouvelle source des données possible pour l’étude des migrations hautement qualifiés. Au delà de l’objectif particulier de cartographier de façon individuelle la trajectoire géographique et thématique des hautement qualifiés, il serait intéressant de chercher une corrélation statistique entre les experts de notre corpus et les tendances nationales rapportées par les organismes internationaux comme l’OCDE et l’ONU. Ce résultat permettrait de répondre à la question posée par les méthodes numériques : jusqu’à quelle point la réalité sur le web permet de répondre à des questions sur la réalité du terrain ? [[Rogers|2010]]+L’originalité de notre approche repose sur le fait d’appliquer des méthodes de pointe en TAL, fouille sémantique du web et //machine reading// au problème bien ancrée dans la réalité : celui de la recherche d’experts appartenant à la diaspora des savoirs. L’apport des résultats escomptés aurait un impacte épistémologique double : en technologies sémantiques il permettrait de produire une nouvelle génération d’outils en recherche d’experts qui prennent en compte le contexte biographique des experts ; en sociologie ils permettraient de produire une nouvelle source des données possible pour l’étude des migrations hautement qualifiés. Au delà de l’objectif particulier de cartographier de façon individuelle la trajectoire géographique et thématique des hautement qualifiés, il serait intéressant de chercher une corrélation statistique entre les experts de notre corpus et les tendances nationales rapportées par les organismes internationaux comme l’OCDE et l’ONU. Ce résultat permettrait de répondre à la question posée par les méthodes numériques : jusqu’à quelle point la réalité sur le web permet de répondre à des questions sur la réalité du terrain ? %%[%%Rogers 2010%%]%%
  
 Un mot est ici nécessaire sur l’originalité de notre consortium. Le LIPN possède une expertise approfondie en méthodes combinées de traitement automatique des langues et de représentation de connaissances. Cette vocation à produire des représentations sémantiques à partir des annotations textuelles s’est vue renforcé avec l’intégration du système FRED et des méthodes de //machine reading// aux activités quotidiennes de recherche du labo. Cette expérience en représentation de phrases courtes en langage naturelle sous forme des graphes RDF/OWL, tout en faisant appel à des ressources structurés comme DBPedia comme base de connaissances extralinguistiques, permet d’envisager un traitement sémantique poussé pour les résultats de recherches sur le web considérés comme pertinents dans la trajectoire professionnelle d’une personne. De plus, le labo possède également une bonne connaissance en production massive de requêtes et fouille des résultats des moteurs de recherche, puisque la toute dernière version du système Unoporuno a été produite au sein du LIPN. La participation annuelle de l’équipe à la tâche de similarité sémantique dans la campagne SEMEVAL (où le LIPN et l'IIMAS ont soumis système développé  conjointement) permet aussi d’envisage l’intégration aisée des techniques de calcul de proximité sémantique aux méthodes de clustering des résultats. Quant à la pertinence sociologique des cartographies des diasporas des savoirs produites, l’équipe de l’ENST Télécom ParisTech, pionnière dans ce domaine, est incontournable. De son côté, les équipes mexicaine de l'IIIMAS possède une expérience confirmée en classifieurs statistiques, apprentissage automatique et techniques de //clustering//: des méthodes incontournables dans la production des cartographies à partir des données issues de la fouille du web. En fin, la présence de Jean Baptiste Meyer et de Fernando Lozano Ascencio dans le consortium permettra de valider la pertinence sociologique des résultats d'une recherche interdisciplinaire. Un mot est ici nécessaire sur l’originalité de notre consortium. Le LIPN possède une expertise approfondie en méthodes combinées de traitement automatique des langues et de représentation de connaissances. Cette vocation à produire des représentations sémantiques à partir des annotations textuelles s’est vue renforcé avec l’intégration du système FRED et des méthodes de //machine reading// aux activités quotidiennes de recherche du labo. Cette expérience en représentation de phrases courtes en langage naturelle sous forme des graphes RDF/OWL, tout en faisant appel à des ressources structurés comme DBPedia comme base de connaissances extralinguistiques, permet d’envisager un traitement sémantique poussé pour les résultats de recherches sur le web considérés comme pertinents dans la trajectoire professionnelle d’une personne. De plus, le labo possède également une bonne connaissance en production massive de requêtes et fouille des résultats des moteurs de recherche, puisque la toute dernière version du système Unoporuno a été produite au sein du LIPN. La participation annuelle de l’équipe à la tâche de similarité sémantique dans la campagne SEMEVAL (où le LIPN et l'IIMAS ont soumis système développé  conjointement) permet aussi d’envisage l’intégration aisée des techniques de calcul de proximité sémantique aux méthodes de clustering des résultats. Quant à la pertinence sociologique des cartographies des diasporas des savoirs produites, l’équipe de l’ENST Télécom ParisTech, pionnière dans ce domaine, est incontournable. De son côté, les équipes mexicaine de l'IIIMAS possède une expérience confirmée en classifieurs statistiques, apprentissage automatique et techniques de //clustering//: des méthodes incontournables dans la production des cartographies à partir des données issues de la fouille du web. En fin, la présence de Jean Baptiste Meyer et de Fernando Lozano Ascencio dans le consortium permettra de valider la pertinence sociologique des résultats d'une recherche interdisciplinaire.
Ligne 79: Ligne 79:
 ==== Objectifs ==== ==== Objectifs ====
   -  Développer des méthodes computationnelles qui permettent de cartographier automatiquement la trajectoire professionnelle des membres la diaspora des savoirs de manière individuelle. De même, cette méthode permettra de retrouver des experts à partir des compétences spécifiques tout en prenant compte du contexte biographique de l’expert (example : trouver un expert en freinage par courants de Foucault d’origine mexicaine et formé en France)   -  Développer des méthodes computationnelles qui permettent de cartographier automatiquement la trajectoire professionnelle des membres la diaspora des savoirs de manière individuelle. De même, cette méthode permettra de retrouver des experts à partir des compétences spécifiques tout en prenant compte du contexte biographique de l’expert (example : trouver un expert en freinage par courants de Foucault d’origine mexicaine et formé en France)
-  -  Établir une séquence de traitement automatique des langues et machine reading qui permette de passer d’un texte court à une représentation structurée en RDF en faisant appel à des méthodes d’apprentissage automatique et de clustering par WSI [[Di|Marco & Navigli 2013]]. Cette représentation sera la base pour cartographier la trajectoire des experts.+  -  Établir une séquence de traitement automatique des langues et machine reading qui permette de passer d’un texte court à une représentation structurée en RDF en faisant appel à des méthodes d’apprentissage automatique et de clustering par WSI %%[%%Di Marco & Navigli 2013%%]%%. Cette représentation sera la base pour cartographier la trajectoire des experts.
   -  Agréger les cartographies individuelles pour en dégager des tendances à niveau national et calculer la corrélation statistiques entre les statistiques issues du web et celles publiées par les organismes internationaux comme l’OCDE ou l’ONU.   -  Agréger les cartographies individuelles pour en dégager des tendances à niveau national et calculer la corrélation statistiques entre les statistiques issues du web et celles publiées par les organismes internationaux comme l’OCDE ou l’ONU.
 === Objectifs scientifiques === === Objectifs scientifiques ===
   -  Prendre les corpus et les ressources méthodologiques développés par des projets en sociologie des diasporas hautement qualifiées (en particulier CIDESAL) comme base empirique pour la construction des cartographies individuelles des experts.   -  Prendre les corpus et les ressources méthodologiques développés par des projets en sociologie des diasporas hautement qualifiées (en particulier CIDESAL) comme base empirique pour la construction des cartographies individuelles des experts.
   -  Fouilles sémantiquement les contextes sémantiquement riches des noms des personnes (par exemple : un fiche bibliographique où une patente) pour en extraire des organisations, des toponymes et des sujets de recherche ou d’expertise qui puissent être combinés au nom pour générer des requêtes web à caractère biographique pour un moteur de recherche.   -  Fouilles sémantiquement les contextes sémantiquement riches des noms des personnes (par exemple : un fiche bibliographique où une patente) pour en extraire des organisations, des toponymes et des sujets de recherche ou d’expertise qui puissent être combinés au nom pour générer des requêtes web à caractère biographique pour un moteur de recherche.
-  -  Intégrer l’outil de deep machine reading FRED [[Etzioni|et al. 2006 ; Gangemi et al. 2014]au système de recherche des membres de la diaspora hautement qualifiée Unoporuno [[Garcia|Flores et al. 2012]pour étendre ses fonctionnalités au cas d’utilisation classique de la recherche d’experts (expert finding) [[Bordea|& Buitelaar 2012]].+  -  Intégrer l’outil de deep machine reading FRED %%[%%Etzioni et al. 2006 ; Gangemi et al. 2014%%]%% au système de recherche des membres de la diaspora hautement qualifiée Unoporuno %%[%%Garcia Flores et al. 2012%%]%% pour étendre ses fonctionnalités au cas d’utilisation classique de la recherche d’experts (expert finding) %%[%%Bordea & Buitelaar 2012%%]%%.
   -  Renforcer la découverte des éléments sémantiques dans les résultats des moteurs de recherche par des méthodes d’apprentissage automatique.   -  Renforcer la découverte des éléments sémantiques dans les résultats des moteurs de recherche par des méthodes d’apprentissage automatique.
   -  Évaluer les cartographies individuelles des experts de la diaspora hautement qualifiée avec le corpus et les méthodes proposés par CIDESAL.   -  Évaluer les cartographies individuelles des experts de la diaspora hautement qualifiée avec le corpus et les méthodes proposés par CIDESAL.
Ligne 120: Ligne 120:
   -  La sortie actuelle d’Unoporuno sera considérée comme une référence minimale de comparaison (//baseline//) pour mesurer l’efficacité de la nouvelle approche.   -  La sortie actuelle d’Unoporuno sera considérée comme une référence minimale de comparaison (//baseline//) pour mesurer l’efficacité de la nouvelle approche.
   -  Expériences et évaluation des diverses possibilités méthodologiques et technologiques de chaines de TAL, fouille sémantique et apprentissage automatique pour déceler la chaîne de traitement optimale.   -  Expériences et évaluation des diverses possibilités méthodologiques et technologiques de chaines de TAL, fouille sémantique et apprentissage automatique pour déceler la chaîne de traitement optimale.
-  -  Modélisation du champ épistémologique d’expertise en se basant sur les techniques courantes en recherche d’experts [[Aleman-Meza|et al. 2007 ; Li et al. 2006]]. Expériences et évaluation. +  -  Modélisation du champ épistémologique d’expertise en se basant sur les techniques courantes en recherche d’experts %%[%%Aleman-Meza et al. 2007 ; Li et al. 2006%%]%%. Expériences et évaluation. 
-  -  Intégration d’Unoporuno dans la chaîne de transformation d’annotations sémantique en représentations RDF avec FRED. Cette étape représente un défi majeur en traitement multilingue étant donné que FRED traite seulement des textes en langue anglaise et qu’Unoporuno travaille avec des données multilingues propres aux parcours multinationaux des hautement qualifiés. Il faudra envisager alors une étape translinguistique où les analyses en anglais soient « transposées » à l’espagnol, l’allemand et le français [[Banea|et al. 2008]].+  -  Intégration d’Unoporuno dans la chaîne de transformation d’annotations sémantique en représentations RDF avec FRED. Cette étape représente un défi majeur en traitement multilingue étant donné que FRED traite seulement des textes en langue anglaise et qu’Unoporuno travaille avec des données multilingues propres aux parcours multinationaux des hautement qualifiés. Il faudra envisager alors une étape translinguistique où les analyses en anglais soient « transposées » à l’espagnol, l’allemand et le français %%[%%Banea et al. 2008%%]%%.
   -  Évaluation du processus d’extraction des informations minimales pour reconstruire une trajectoire professionnelle : origine, formation élémentaire, formation spécialisée, domaine d’expertise, événements marquants.   -  Évaluation du processus d’extraction des informations minimales pour reconstruire une trajectoire professionnelle : origine, formation élémentaire, formation spécialisée, domaine d’expertise, événements marquants.
   -  Structuration des données sous forme de graphes RDF   -  Structuration des données sous forme de graphes RDF
Ligne 129: Ligne 129:
  
 ==== Références ==== ==== Références ====
-**[[Aleman-Meza|et al. 2007]]** Boanerges Aleman-Meza , Uldis Bojars , Harold Boley , John G. Breslin , Malgorzata Mochol , Lyndon Jb Nixon , Axel Polleres , Anna V. Zhdanova. Combining RDF vocabularies for expert finding. In Proceedings of the 4th European Semantic Web Conference (ESWC2007), number 4519 in Lecture Notes in Computer Science, (2007).+**%%[%%Aleman-Meza et al. 2007%%]%%** Boanerges Aleman-Meza , Uldis Bojars , Harold Boley , John G. Breslin , Malgorzata Mochol , Lyndon Jb Nixon , Axel Polleres , Anna V. Zhdanova. Combining RDF vocabularies for expert finding. In Proceedings of the 4th European Semantic Web Conference (ESWC2007), number 4519 in Lecture Notes in Computer Science, (2007).
  
-**[[Banea|et al. 2008]]** Carmen Banea, Rada Mihalcea, Janyce Wiebe and Samer Hassan, Multilingual Subjectivity Analysis Using Machine Translation, in Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP 2008), Honolulu, Hawaii, October 2008.+**%%[%%Banea|et al. 2008%%]%%** Carmen Banea, Rada Mihalcea, Janyce Wiebe and Samer Hassan, Multilingual Subjectivity Analysis Using Machine Translation, in Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP 2008), Honolulu, Hawaii, October 2008.
  
-**[[CIDESAL,|2014]]** CIDESAL : Construction d’Incubateurs des Diasporas du Savoir en Amérique Latine.+**%%[%%CIDESAL,|2014%%]%%** CIDESAL : Construction d’Incubateurs des Diasporas du Savoir en Amérique Latine.
  
 Rapport final d’activité. EuroAid/Commission Européenne, 2014 (in press) Rapport final d’activité. EuroAid/Commission Européenne, 2014 (in press)
  
-**[[Bordea|& Buitelaar 2012]]** Georgeta Bordea, Paul Buitelaar. Expertise Mining. Proceedings of the 21st National Conference on Artificial Intelligence and Cognitive Science, Galway, Ireland, 2010.+**%%[%%Bordea & Buitelaar 2012%%]%%** Georgeta Bordea, Paul Buitelaar. Expertise Mining. Proceedings of the 21st National Conference on Artificial Intelligence and Cognitive Science, Galway, Ireland, 2010.
  
-**[[Di|Marco & Navigli 2013]]** Antonio Di Marco, Roberto Navigli: Clustering and Diversifying Web Search Results with Graph-Based Word Sense Induction. Computational Linguistics 39(3): 709-754 (2013)+**%%[%%Di Marco & Navigli 2013%%]%%** Antonio Di Marco, Roberto Navigli: Clustering and Diversifying Web Search Results with Graph-Based Word Sense Induction. Computational Linguistics 39(3): 709-754 (2013)
  
-**[[Diminescu|2008]]** Diminescu D. The connected migrant: an epistemological manifesto. Social Science Information (December 2008) vol. 47 no. 4 565-579+**%%[%%Diminescu 2008%%]%%** Diminescu D. The connected migrant: an epistemological manifesto. Social Science Information (December 2008) vol. 47 no. 4 565-579
  
-**[[Etzioni|et al. 2006]]** Oren Etzioni, Michele Banko and Michael J Cafarella. Machine Reading. AAAI Conference on Artificial Intelligence, 2006.+**%%[%%Etzioni et al. 2006%%]%%** Oren Etzioni, Michele Banko and Michael J Cafarella. Machine Reading. AAAI Conference on Artificial Intelligence, 2006.
  
-**[[Gangemi|et al. 2014]]** Aldo Gangemi, Valentina Presutti, Diego Reforgiato Recupero. Frame-based detection of opinion holders and topics: a model and a tool. IEEE Computational Intelligence, 9(1), 2014+**%%[%%Gangemi et al. 2014%%]%%** Aldo Gangemi, Valentina Presutti, Diego Reforgiato Recupero. Frame-based detection of opinion holders and topics: a model and a tool. IEEE Computational Intelligence, 9(1), 2014
  
-**[[Garcia|Flores et al. 2012]]** J. J. Garcia Flores, Pierre Zwigenbaum, Zhao Yue and W.A. Turner (2012) Tracking Researcher Mobility on the Web Using Snippet Semantic Analysis. In H. Ishara & K. Kanzaki, Advances in Natural Language Processing 8th International Conference on NLP, October 22-24, Kanazawa, Japan. (JapTAL 2012) Springer Lecture Notes in Computer Sciences, vol. 7614, ISBN 978-3-642-33983-7, pp. 180-191.+**%%[%%Garcia Flores et al. 2012%%]%%** J. J. Garcia Flores, Pierre Zwigenbaum, Zhao Yue and W.A. Turner (2012) Tracking Researcher Mobility on the Web Using Snippet Semantic Analysis. In H. Ishara & K. Kanzaki, Advances in Natural Language Processing 8th International Conference on NLP, October 22-24, Kanazawa, Japan. (JapTAL 2012) Springer Lecture Notes in Computer Sciences, vol. 7614, ISBN 978-3-642-33983-7, pp. 180-191.
  
-**[[Li|et al. 2006]]** Jie Li, Harold Boley, Virendrakumar C. Bhavsar, and Jing Mei. Expert Finding for eCollaboration Using FOAF with RuleML Rules. Montreal Conference on eTechnologies MCTECH, (May 17, 2006)+**%%[%%Li et al. 2006%%]%%** Jie Li, Harold Boley, Virendrakumar C. Bhavsar, and Jing Mei. Expert Finding for eCollaboration Using FOAF with RuleML Rules. Montreal Conference on eTechnologies MCTECH, (May 17, 2006)
  
-**[[Monaghan|et al. 2010]]** Fergal Monaghan, Georgeta Bordea, Krystian Samp, Paul Buitelaar (2010)+**%%[%%Monaghan et al. 2010%%]%%** Fergal Monaghan, Georgeta Bordea, Krystian Samp, Paul Buitelaar (2010)
  
 Exploring Your Research: Sprinkling some Saffron on Semantic Web Dog Food, 9th International Semantic Web Conference (ISWC), Semantic Web Challenge, Shanghai, China. Exploring Your Research: Sprinkling some Saffron on Semantic Web Dog Food, 9th International Semantic Web Conference (ISWC), Semantic Web Challenge, Shanghai, China.
  
-**[[OECD,|2002]]** International Mobility of the Highly Skilled. Policy Brief, OECD, 2002, Paris.+**%%[%%OECD, 2002%%]%%** International Mobility of the Highly Skilled. Policy Brief, OECD, 2002, Paris.
  
-**[[Rogers|2010]]** Richard Rogers, "Internet Research: The Question of Method," Journal of Information Technology and Politics 7 (2010): 241-260.+**%%[%%Rogers 2010%%]%%** Richard Rogers, "Internet Research: The Question of Method," Journal of Information Technology and Politics 7 (2010): 241-260.
  
-**[[Shokhenmayer|2010]]** Evgeny Shokhenmayer Cartography in onomastic research / TRANS vol.18; Virtual INST World Conference. CCKS: Cities, Cultures, Knowledge Societies. Section ‘Cartographic Science as a Reflection of Knowledge Societies and Cultures’, 2010+**%%[%%Shokhenmayer 2010%%]%%** Evgeny Shokhenmayer Cartography in onomastic research / TRANS vol.18; Virtual INST World Conference. CCKS: Cities, Cultures, Knowledge Societies. Section ‘Cartographic Science as a Reflection of Knowledge Societies and Cultures’, 2010
  
-**[[Tummarello|et al. 2010]]** Giovanni Tummarello, Richard Cyganiak, Michele Catasta, Szymon Danielczyk, Renaud Delbru, Stefan Decker "Sig.ma: Live views on the Web of Data", Journal of Web Semantics: Science, Services and Agents on the World Wide Web - Volume 8, Issue 4, November 2010, Pages 355-364+**%%[%%Tummarello et al. 2010%%]%%** Giovanni Tummarello, Richard Cyganiak, Michele Catasta, Szymon Danielczyk, Renaud Delbru, Stefan Decker "Sig.ma: Live views on the Web of Data", Journal of Web Semantics: Science, Services and Agents on the World Wide Web - Volume 8, Issue 4, November 2010, Pages 355-364
  
-**[[Yates|et al. 2007]]** Alexander Yates, Michael Cafarella, Michele Banko, Oren Etzioni, Matthew Broadhead, and Stephen Soderland. 2007. TextRunner: open information extraction on the web. In Proceedings of Human Language Technologies: The Annual Conference of the North American Chapter of the Association for Computational Linguistics: Demonstrations (NAACL-Demonstrations '07)+**%%[%%Yates et al. 2007%%]%%** Alexander Yates, Michael Cafarella, Michele Banko, Oren Etzioni, Matthew Broadhead, and Stephen Soderland. 2007. TextRunner: open information extraction on the web. In Proceedings of Human Language Technologies: The Annual Conference of the North American Chapter of the Association for Computational Linguistics: Demonstrations (NAACL-Demonstrations '07)
  
 ===== Calendrier du projet ===== ===== Calendrier du projet =====
-{|border="1" cellspacing="0" + 
-!Année +Année Activités But ^ 
-!Activités +| 1 | <WRAP>
-!But +
-|- +
-|1 +
-|+
   *  État de l’art   *  État de l’art
   *  Testbed à partir des corpus CIDESAL (Conacyt + Conicet + Colciencias)   *  Testbed à partir des corpus CIDESAL (Conacyt + Conicet + Colciencias)
Ligne 179: Ligne 175:
   *  Charte éthique pour la manipulation de données biographiques extraites du web   *  Charte éthique pour la manipulation de données biographiques extraites du web
   *  Cas d’utilisation   *  Cas d’utilisation
-|Développer un cadre théorique, méthodologique et technologique d’analyse et d’évaluation de la qualité des données pour le projet. +</WRAP> | Développer un cadre théorique, méthodologique et technologique d’analyse et d’évaluation de la qualité des données pour le projet. | 
-|- +| 2 | <WRAP>
-|2 +
-|+
   *  Clustering des résultats d’Unoporuno par WSI (Word Sense Induction)   *  Clustering des résultats d’Unoporuno par WSI (Word Sense Induction)
   *  Ontologie des savoirs / Vocabulaires / compilation de ressources épistémiques appropriées (lexiques, dictionnaires, thésaurus)   *  Ontologie des savoirs / Vocabulaires / compilation de ressources épistémiques appropriées (lexiques, dictionnaires, thésaurus)
   *  Annotation des entités nommées + évaluation * Extraction d’évènements + évaluation   *  Annotation des entités nommées + évaluation * Extraction d’évènements + évaluation
   *  Grammaire formelle pour reconnaitre les noms des personnes en espagnol, français, anglais et allemand + évaluation   *  Grammaire formelle pour reconnaitre les noms des personnes en espagnol, français, anglais et allemand + évaluation
-|Chaine de traitement TAL + //Machine reading// +</WRAP> | Chaine de traitement TAL + //Machine reading// | 
-|- +| 3 | <WRAP>
-|3 +
-|+
   *  Intégration Unoporuno+FRED   *  Intégration Unoporuno+FRED
   *  Crosslingual FRED * Production de RDF + évaluation   *  Crosslingual FRED * Production de RDF + évaluation
   *  Premières cartographies individuelles   *  Premières cartographies individuelles
-|Développer une chaine multilangue, le graphe RDF et les premières cartographies individuelles. +</WRAP> | Développer une chaine multilangue, le graphe RDF et les premières cartographies individuelles. | 
-|- +| 4 | <WRAP>  
-|4 +  * Graphes agrégées  
-|* Graphes agrégées * Statistiques agrégées * Correlation entre les données du web et les données du terrain (OCDE) * Évaluation |Cartographies à plus grande échelle. Statistiques a plus grande échelle. +  * Statistiques agrégées  
-|Corrélation web vs terrain +  * Correlation entre les données du web et les données du terrain (OCDE)  
-|}+  * Évaluation  
 +</WRAP> | Cartographies à plus grande échelle. Statistiques a plus grande échelle. | Corrélation web vs terrain |
 ==== Actions ==== ==== Actions ====
-{|border="1" cellspacing="0" +Année Actions ^ 
-!Année +| 1 | <WRAP>
-!Actions +
-|- +
-|1 +
-|+
   * Une mission de 15 jours pour 2 chercheurs mexicains en France.   * Une mission de 15 jours pour 2 chercheurs mexicains en France.
   * Une mission de 15 jours pour 2 chercheurs français au Mexique   * Une mission de 15 jours pour 2 chercheurs français au Mexique
   * Une mission d’un mois pour un doctorant français au Mexique   * Une mission d’un mois pour un doctorant français au Mexique
   * Publication conjointe d’un article de prise de position   * Publication conjointe d’un article de prise de position
-|- +</WRAP> 
-|2 +| 2 | <WRAP>
-|+
   * Une mission de 15 jours pour 2 chercheurs mexicains en France.   * Une mission de 15 jours pour 2 chercheurs mexicains en France.
   * Une mission de 15 jours pour 2 chercheurs français au Mexique   * Une mission de 15 jours pour 2 chercheurs français au Mexique
   * Publication conjointe des résultats préliminaires   * Publication conjointe des résultats préliminaires
-|- +</WRAP> 
-|3 +| 3 | <WRAP>
-|+
   * Une mission de 15 jours pour 2 chercheurs mexicains en France.   * Une mission de 15 jours pour 2 chercheurs mexicains en France.
   * Une mission de 15 jours pour 2 chercheurs français au Mexique   * Une mission de 15 jours pour 2 chercheurs français au Mexique
   * Publication conjointe des résultats préliminaires   * Publication conjointe des résultats préliminaires
-|- +</WRAP> 
-|4 +| 4 | <WRAP>
-|+
   * Une mission de 15 jours pour 2 chercheurs mexicains en France.   * Une mission de 15 jours pour 2 chercheurs mexicains en France.
   * Une mission de 15 jours pour 2 chercheurs français au Mexique   * Une mission de 15 jours pour 2 chercheurs français au Mexique
Ligne 231: Ligne 217:
   * Participation conjointe dans le jury de thèse du doctorant mexicain financé par CONACYT.   * Participation conjointe dans le jury de thèse du doctorant mexicain financé par CONACYT.
   * Publication conjointe des résultats du projet dans un journal   * Publication conjointe des résultats du projet dans un journal
-|}+</WRAP>|
  
 ===== Résultats escomptés au terme de l'action ===== ===== Résultats escomptés au terme de l'action =====
Ligne 319: Ligne 305:
  
 ===== Liens ===== ===== Liens =====
-  *  Dossier du projet soumis à l'appel [[ECOS|Nord 2014]] +  *  Dossier du projet soumis à l'appel [[equipes:rcln:ancien_wiki:projets:cartographie_diaspora_savoirs_fouille_semantique:ecos_nord_2014]] 
-  *  [[Reingeniería de una aplicación de minería de datos para el rastreo del talento altamente calificado en la Web|Reenginering of a data mining application for tracing highly qualified inmigrants]] +  *  [[equipes:rcln:ancien_wiki:outils:unoporuno:reenginering_of_data_mining_app|Reenginering of a data mining application for tracing highly qualified inmigrants]]
 ===== ToDo ===== ===== ToDo =====
   -  To confirm the intrest of all the consortium members (DONE)   -  To confirm the intrest of all the consortium members (DONE)
  • Dernière modification: il y a 5 ans