equipes:rcln:ancien_wiki:projets:cartographie_diaspora_savoirs_fouille_semantique

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
equipes:rcln:ancien_wiki:projets:cartographie_diaspora_savoirs_fouille_semantique [2019/04/04 16:37]
rosse [Objectifs]
equipes:rcln:ancien_wiki:projets:cartographie_diaspora_savoirs_fouille_semantique [2020/11/23 18:42] (Version actuelle)
garciaflores ↷ Liens modifiés en raison d'un déplacement.
Ligne 1: Ligne 1:
 ====== Cartographie de la diaspora des savoirs par fouille sémantique des résultats de recherches sur le web ====== ====== Cartographie de la diaspora des savoirs par fouille sémantique des résultats de recherches sur le web ======
  
-//[[Cartografía|de la diáspora calificada aplicando técnicas de minería semántica a resultados de búsquedas en la web]]//+//[[equipes:rcln:ancien_wiki:projets:cartographie_diaspora_savoirs_fouille_semantique:es]]//
  
 **Projet accepté pour financement par le comité [[http://www.univ-paris13.fr/cofecub-ecos/ecos-nord|Ecos Nord]] (2016-2019)** **Projet accepté pour financement par le comité [[http://www.univ-paris13.fr/cofecub-ecos/ecos-nord|Ecos Nord]] (2016-2019)**
Ligne 53: Ligne 53:
 ===== Formation doctorale ===== ===== Formation doctorale =====
 ==== Au Mexique ==== ==== Au Mexique ====
-  *  Nous sommes à la recherche d'un doctorant mexicain apte à partir en France avec une bourse Conacyt dans le cadre de notre projet ([[equipes:rcln:poste:doctorado_francia_tecnologias_lenguaje|appel ici]])+  *  Nous sommes à la recherche d'un doctorant mexicain apte à partir en France avec une bourse Conacyt dans le cadre de notre projet ([[equipes:rcln:ancien_wiki:poste:doctorado_francia_tecnologias_lenguaje|appel ici]])
  
 ==== En France ==== ==== En France ====
Ligne 120: Ligne 120:
   -  La sortie actuelle d’Unoporuno sera considérée comme une référence minimale de comparaison (//baseline//) pour mesurer l’efficacité de la nouvelle approche.   -  La sortie actuelle d’Unoporuno sera considérée comme une référence minimale de comparaison (//baseline//) pour mesurer l’efficacité de la nouvelle approche.
   -  Expériences et évaluation des diverses possibilités méthodologiques et technologiques de chaines de TAL, fouille sémantique et apprentissage automatique pour déceler la chaîne de traitement optimale.   -  Expériences et évaluation des diverses possibilités méthodologiques et technologiques de chaines de TAL, fouille sémantique et apprentissage automatique pour déceler la chaîne de traitement optimale.
-  -  Modélisation du champ épistémologique d’expertise en se basant sur les techniques courantes en recherche d’experts [[Aleman-Meza|et al. 2007 ; Li et al. 2006]]. Expériences et évaluation. +  -  Modélisation du champ épistémologique d’expertise en se basant sur les techniques courantes en recherche d’experts %%[%%Aleman-Meza et al. 2007 ; Li et al. 2006%%]%%. Expériences et évaluation. 
-  -  Intégration d’Unoporuno dans la chaîne de transformation d’annotations sémantique en représentations RDF avec FRED. Cette étape représente un défi majeur en traitement multilingue étant donné que FRED traite seulement des textes en langue anglaise et qu’Unoporuno travaille avec des données multilingues propres aux parcours multinationaux des hautement qualifiés. Il faudra envisager alors une étape translinguistique où les analyses en anglais soient « transposées » à l’espagnol, l’allemand et le français [[Banea|et al. 2008]].+  -  Intégration d’Unoporuno dans la chaîne de transformation d’annotations sémantique en représentations RDF avec FRED. Cette étape représente un défi majeur en traitement multilingue étant donné que FRED traite seulement des textes en langue anglaise et qu’Unoporuno travaille avec des données multilingues propres aux parcours multinationaux des hautement qualifiés. Il faudra envisager alors une étape translinguistique où les analyses en anglais soient « transposées » à l’espagnol, l’allemand et le français %%[%%Banea et al. 2008%%]%%.
   -  Évaluation du processus d’extraction des informations minimales pour reconstruire une trajectoire professionnelle : origine, formation élémentaire, formation spécialisée, domaine d’expertise, événements marquants.   -  Évaluation du processus d’extraction des informations minimales pour reconstruire une trajectoire professionnelle : origine, formation élémentaire, formation spécialisée, domaine d’expertise, événements marquants.
   -  Structuration des données sous forme de graphes RDF   -  Structuration des données sous forme de graphes RDF
Ligne 129: Ligne 129:
  
 ==== Références ==== ==== Références ====
-**[[Aleman-Meza|et al. 2007]]** Boanerges Aleman-Meza , Uldis Bojars , Harold Boley , John G. Breslin , Malgorzata Mochol , Lyndon Jb Nixon , Axel Polleres , Anna V. Zhdanova. Combining RDF vocabularies for expert finding. In Proceedings of the 4th European Semantic Web Conference (ESWC2007), number 4519 in Lecture Notes in Computer Science, (2007).+**%%[%%Aleman-Meza et al. 2007%%]%%** Boanerges Aleman-Meza , Uldis Bojars , Harold Boley , John G. Breslin , Malgorzata Mochol , Lyndon Jb Nixon , Axel Polleres , Anna V. Zhdanova. Combining RDF vocabularies for expert finding. In Proceedings of the 4th European Semantic Web Conference (ESWC2007), number 4519 in Lecture Notes in Computer Science, (2007).
  
-**[[Banea|et al. 2008]]** Carmen Banea, Rada Mihalcea, Janyce Wiebe and Samer Hassan, Multilingual Subjectivity Analysis Using Machine Translation, in Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP 2008), Honolulu, Hawaii, October 2008.+**%%[%%Banea|et al. 2008%%]%%** Carmen Banea, Rada Mihalcea, Janyce Wiebe and Samer Hassan, Multilingual Subjectivity Analysis Using Machine Translation, in Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP 2008), Honolulu, Hawaii, October 2008.
  
-**[[CIDESAL,|2014]]** CIDESAL : Construction d’Incubateurs des Diasporas du Savoir en Amérique Latine.+**%%[%%CIDESAL,|2014%%]%%** CIDESAL : Construction d’Incubateurs des Diasporas du Savoir en Amérique Latine.
  
 Rapport final d’activité. EuroAid/Commission Européenne, 2014 (in press) Rapport final d’activité. EuroAid/Commission Européenne, 2014 (in press)
  
-**[[Bordea|& Buitelaar 2012]]** Georgeta Bordea, Paul Buitelaar. Expertise Mining. Proceedings of the 21st National Conference on Artificial Intelligence and Cognitive Science, Galway, Ireland, 2010.+**%%[%%Bordea & Buitelaar 2012%%]%%** Georgeta Bordea, Paul Buitelaar. Expertise Mining. Proceedings of the 21st National Conference on Artificial Intelligence and Cognitive Science, Galway, Ireland, 2010.
  
-**[[Di|Marco & Navigli 2013]]** Antonio Di Marco, Roberto Navigli: Clustering and Diversifying Web Search Results with Graph-Based Word Sense Induction. Computational Linguistics 39(3): 709-754 (2013)+**%%[%%Di Marco & Navigli 2013%%]%%** Antonio Di Marco, Roberto Navigli: Clustering and Diversifying Web Search Results with Graph-Based Word Sense Induction. Computational Linguistics 39(3): 709-754 (2013)
  
-**[[Diminescu|2008]]** Diminescu D. The connected migrant: an epistemological manifesto. Social Science Information (December 2008) vol. 47 no. 4 565-579+**%%[%%Diminescu 2008%%]%%** Diminescu D. The connected migrant: an epistemological manifesto. Social Science Information (December 2008) vol. 47 no. 4 565-579
  
-**[[Etzioni|et al. 2006]]** Oren Etzioni, Michele Banko and Michael J Cafarella. Machine Reading. AAAI Conference on Artificial Intelligence, 2006.+**%%[%%Etzioni et al. 2006%%]%%** Oren Etzioni, Michele Banko and Michael J Cafarella. Machine Reading. AAAI Conference on Artificial Intelligence, 2006.
  
-**[[Gangemi|et al. 2014]]** Aldo Gangemi, Valentina Presutti, Diego Reforgiato Recupero. Frame-based detection of opinion holders and topics: a model and a tool. IEEE Computational Intelligence, 9(1), 2014+**%%[%%Gangemi et al. 2014%%]%%** Aldo Gangemi, Valentina Presutti, Diego Reforgiato Recupero. Frame-based detection of opinion holders and topics: a model and a tool. IEEE Computational Intelligence, 9(1), 2014
  
-**[[Garcia|Flores et al. 2012]]** J. J. Garcia Flores, Pierre Zwigenbaum, Zhao Yue and W.A. Turner (2012) Tracking Researcher Mobility on the Web Using Snippet Semantic Analysis. In H. Ishara & K. Kanzaki, Advances in Natural Language Processing 8th International Conference on NLP, October 22-24, Kanazawa, Japan. (JapTAL 2012) Springer Lecture Notes in Computer Sciences, vol. 7614, ISBN 978-3-642-33983-7, pp. 180-191.+**%%[%%Garcia Flores et al. 2012%%]%%** J. J. Garcia Flores, Pierre Zwigenbaum, Zhao Yue and W.A. Turner (2012) Tracking Researcher Mobility on the Web Using Snippet Semantic Analysis. In H. Ishara & K. Kanzaki, Advances in Natural Language Processing 8th International Conference on NLP, October 22-24, Kanazawa, Japan. (JapTAL 2012) Springer Lecture Notes in Computer Sciences, vol. 7614, ISBN 978-3-642-33983-7, pp. 180-191.
  
-**[[Li|et al. 2006]]** Jie Li, Harold Boley, Virendrakumar C. Bhavsar, and Jing Mei. Expert Finding for eCollaboration Using FOAF with RuleML Rules. Montreal Conference on eTechnologies MCTECH, (May 17, 2006)+**%%[%%Li et al. 2006%%]%%** Jie Li, Harold Boley, Virendrakumar C. Bhavsar, and Jing Mei. Expert Finding for eCollaboration Using FOAF with RuleML Rules. Montreal Conference on eTechnologies MCTECH, (May 17, 2006)
  
-**[[Monaghan|et al. 2010]]** Fergal Monaghan, Georgeta Bordea, Krystian Samp, Paul Buitelaar (2010)+**%%[%%Monaghan et al. 2010%%]%%** Fergal Monaghan, Georgeta Bordea, Krystian Samp, Paul Buitelaar (2010)
  
 Exploring Your Research: Sprinkling some Saffron on Semantic Web Dog Food, 9th International Semantic Web Conference (ISWC), Semantic Web Challenge, Shanghai, China. Exploring Your Research: Sprinkling some Saffron on Semantic Web Dog Food, 9th International Semantic Web Conference (ISWC), Semantic Web Challenge, Shanghai, China.
  
-**[[OECD,|2002]]** International Mobility of the Highly Skilled. Policy Brief, OECD, 2002, Paris.+**%%[%%OECD, 2002%%]%%** International Mobility of the Highly Skilled. Policy Brief, OECD, 2002, Paris.
  
-**[[Rogers|2010]]** Richard Rogers, "Internet Research: The Question of Method," Journal of Information Technology and Politics 7 (2010): 241-260.+**%%[%%Rogers 2010%%]%%** Richard Rogers, "Internet Research: The Question of Method," Journal of Information Technology and Politics 7 (2010): 241-260.
  
-**[[Shokhenmayer|2010]]** Evgeny Shokhenmayer Cartography in onomastic research / TRANS vol.18; Virtual INST World Conference. CCKS: Cities, Cultures, Knowledge Societies. Section ‘Cartographic Science as a Reflection of Knowledge Societies and Cultures’, 2010+**%%[%%Shokhenmayer 2010%%]%%** Evgeny Shokhenmayer Cartography in onomastic research / TRANS vol.18; Virtual INST World Conference. CCKS: Cities, Cultures, Knowledge Societies. Section ‘Cartographic Science as a Reflection of Knowledge Societies and Cultures’, 2010
  
-**[[Tummarello|et al. 2010]]** Giovanni Tummarello, Richard Cyganiak, Michele Catasta, Szymon Danielczyk, Renaud Delbru, Stefan Decker "Sig.ma: Live views on the Web of Data", Journal of Web Semantics: Science, Services and Agents on the World Wide Web - Volume 8, Issue 4, November 2010, Pages 355-364+**%%[%%Tummarello et al. 2010%%]%%** Giovanni Tummarello, Richard Cyganiak, Michele Catasta, Szymon Danielczyk, Renaud Delbru, Stefan Decker "Sig.ma: Live views on the Web of Data", Journal of Web Semantics: Science, Services and Agents on the World Wide Web - Volume 8, Issue 4, November 2010, Pages 355-364
  
-**[[Yates|et al. 2007]]** Alexander Yates, Michael Cafarella, Michele Banko, Oren Etzioni, Matthew Broadhead, and Stephen Soderland. 2007. TextRunner: open information extraction on the web. In Proceedings of Human Language Technologies: The Annual Conference of the North American Chapter of the Association for Computational Linguistics: Demonstrations (NAACL-Demonstrations '07)+**%%[%%Yates et al. 2007%%]%%** Alexander Yates, Michael Cafarella, Michele Banko, Oren Etzioni, Matthew Broadhead, and Stephen Soderland. 2007. TextRunner: open information extraction on the web. In Proceedings of Human Language Technologies: The Annual Conference of the North American Chapter of the Association for Computational Linguistics: Demonstrations (NAACL-Demonstrations '07)
  
 ===== Calendrier du projet ===== ===== Calendrier du projet =====
-{|border="1" cellspacing="0" + 
-!Année +Année Activités But ^ 
-!Activités +| 1 | <WRAP>
-!But +
-|- +
-|1 +
-|+
   *  État de l’art   *  État de l’art
   *  Testbed à partir des corpus CIDESAL (Conacyt + Conicet + Colciencias)   *  Testbed à partir des corpus CIDESAL (Conacyt + Conicet + Colciencias)
Ligne 179: Ligne 175:
   *  Charte éthique pour la manipulation de données biographiques extraites du web   *  Charte éthique pour la manipulation de données biographiques extraites du web
   *  Cas d’utilisation   *  Cas d’utilisation
-|Développer un cadre théorique, méthodologique et technologique d’analyse et d’évaluation de la qualité des données pour le projet. +</WRAP> | Développer un cadre théorique, méthodologique et technologique d’analyse et d’évaluation de la qualité des données pour le projet. | 
-|- +| 2 | <WRAP>
-|2 +
-|+
   *  Clustering des résultats d’Unoporuno par WSI (Word Sense Induction)   *  Clustering des résultats d’Unoporuno par WSI (Word Sense Induction)
   *  Ontologie des savoirs / Vocabulaires / compilation de ressources épistémiques appropriées (lexiques, dictionnaires, thésaurus)   *  Ontologie des savoirs / Vocabulaires / compilation de ressources épistémiques appropriées (lexiques, dictionnaires, thésaurus)
   *  Annotation des entités nommées + évaluation * Extraction d’évènements + évaluation   *  Annotation des entités nommées + évaluation * Extraction d’évènements + évaluation
   *  Grammaire formelle pour reconnaitre les noms des personnes en espagnol, français, anglais et allemand + évaluation   *  Grammaire formelle pour reconnaitre les noms des personnes en espagnol, français, anglais et allemand + évaluation
-|Chaine de traitement TAL + //Machine reading// +</WRAP> | Chaine de traitement TAL + //Machine reading// | 
-|- +| 3 | <WRAP>
-|3 +
-|+
   *  Intégration Unoporuno+FRED   *  Intégration Unoporuno+FRED
   *  Crosslingual FRED * Production de RDF + évaluation   *  Crosslingual FRED * Production de RDF + évaluation
   *  Premières cartographies individuelles   *  Premières cartographies individuelles
-|Développer une chaine multilangue, le graphe RDF et les premières cartographies individuelles. +</WRAP> | Développer une chaine multilangue, le graphe RDF et les premières cartographies individuelles. | 
-|- +| 4 | <WRAP>  
-|4 +  * Graphes agrégées  
-|* Graphes agrégées * Statistiques agrégées * Correlation entre les données du web et les données du terrain (OCDE) * Évaluation |Cartographies à plus grande échelle. Statistiques a plus grande échelle. +  * Statistiques agrégées  
-|Corrélation web vs terrain +  * Correlation entre les données du web et les données du terrain (OCDE)  
-|}+  * Évaluation  
 +</WRAP> | Cartographies à plus grande échelle. Statistiques a plus grande échelle. | Corrélation web vs terrain |
 ==== Actions ==== ==== Actions ====
-{|border="1" cellspacing="0" +Année Actions ^ 
-!Année +| 1 | <WRAP>
-!Actions +
-|- +
-|1 +
-|+
   * Une mission de 15 jours pour 2 chercheurs mexicains en France.   * Une mission de 15 jours pour 2 chercheurs mexicains en France.
   * Une mission de 15 jours pour 2 chercheurs français au Mexique   * Une mission de 15 jours pour 2 chercheurs français au Mexique
   * Une mission d’un mois pour un doctorant français au Mexique   * Une mission d’un mois pour un doctorant français au Mexique
   * Publication conjointe d’un article de prise de position   * Publication conjointe d’un article de prise de position
-|- +</WRAP> 
-|2 +| 2 | <WRAP>
-|+
   * Une mission de 15 jours pour 2 chercheurs mexicains en France.   * Une mission de 15 jours pour 2 chercheurs mexicains en France.
   * Une mission de 15 jours pour 2 chercheurs français au Mexique   * Une mission de 15 jours pour 2 chercheurs français au Mexique
   * Publication conjointe des résultats préliminaires   * Publication conjointe des résultats préliminaires
-|- +</WRAP> 
-|3 +| 3 | <WRAP>
-|+
   * Une mission de 15 jours pour 2 chercheurs mexicains en France.   * Une mission de 15 jours pour 2 chercheurs mexicains en France.
   * Une mission de 15 jours pour 2 chercheurs français au Mexique   * Une mission de 15 jours pour 2 chercheurs français au Mexique
   * Publication conjointe des résultats préliminaires   * Publication conjointe des résultats préliminaires
-|- +</WRAP> 
-|4 +| 4 | <WRAP>
-|+
   * Une mission de 15 jours pour 2 chercheurs mexicains en France.   * Une mission de 15 jours pour 2 chercheurs mexicains en France.
   * Une mission de 15 jours pour 2 chercheurs français au Mexique   * Une mission de 15 jours pour 2 chercheurs français au Mexique
Ligne 231: Ligne 217:
   * Participation conjointe dans le jury de thèse du doctorant mexicain financé par CONACYT.   * Participation conjointe dans le jury de thèse du doctorant mexicain financé par CONACYT.
   * Publication conjointe des résultats du projet dans un journal   * Publication conjointe des résultats du projet dans un journal
-|}+</WRAP>|
  
 ===== Résultats escomptés au terme de l'action ===== ===== Résultats escomptés au terme de l'action =====
Ligne 319: Ligne 305:
  
 ===== Liens ===== ===== Liens =====
-  *  Dossier du projet soumis à l'appel [[ECOS|Nord 2014]] +  *  Dossier du projet soumis à l'appel [[equipes:rcln:ancien_wiki:projets:cartographie_diaspora_savoirs_fouille_semantique:ecos_nord_2014]] 
-  *  [[Reingeniería de una aplicación de minería de datos para el rastreo del talento altamente calificado en la Web|Reenginering of a data mining application for tracing highly qualified inmigrants]] +  *  [[equipes:rcln:ancien_wiki:outils:unoporuno:reenginering_of_data_mining_app|Reenginering of a data mining application for tracing highly qualified inmigrants]]
 ===== ToDo ===== ===== ToDo =====
   -  To confirm the intrest of all the consortium members (DONE)   -  To confirm the intrest of all the consortium members (DONE)
  • Dernière modification: il y a 5 ans