Logiciels

ACL-RelAcS

C’est un corpus conçu pour l’acquisition de relations sémantiques semantic RELation ACquiSition (extraction et classification) dans le domaine scientifique. Il est annoté avec des concepts du domaine et des relations sémantiques. Le corpus est composé d’environ 11.000 articles venant du corpus ACL Anthology. Le corpus est sous licence Creative Commons développé par Kata Gabor. 

https://lipn.univ-paris13.fr/~gabor/Relacs/

  • Contact : @
  • Laboratoire d'origine : LIPN
  • Réferences :
    Kata Gábor, Haïfa Zargayouna, Isabelle Tellier, Davide Buscaldi, Thierry Charnois: A Typology of Semantic Relations Dedicated to Scientific Literature Analysis. SAVE-SD Workshop at the 25th World Wide Web Conference. 2016

    Kata Gábor, Haïfa Zargayouna, Davide Buscaldi, Isabelle Tellier, Thierry Charnois: Semantic Annotation of the ACL Anthology Corpus for the Automatic Analysis of Scientific Literature. Proceedings of the LREC 2016 Conference, Portoroz, Slovenia, May 2016.


AlphaGalicia

Le logiciel AlphaGalicia est une extension de la plateforme Galicia, que nous avons développée afin d'implémenter les notions de « projection Alpha » et de « règles Alpha » présentées dans Ventos et Soldano (2005). Dans ce cadre, ce logiciel permet de construire des treillis de Galois projetés par fusion de treillis (Soldano et al., 2010). Il permet en outre la visualisation et l'exploration des ces treillis.

http://lipn.univ-paris13.fr/~champesme/alphabetagalicia/

  • Contact : @
  • Réferences :
    • H. Soldano, V. Ventos, M. Champesme, and D. Forge. Incremental construction of alpha lattices and association rules. In Proc. of the 14th Int. Conf. on Knowledge-Based and Intelligent Information and Engineering Systems (KES 2010), LNCS 6277: 351-360. Springer, 2010.
    • V. Ventos et H. Soldano. Treillis de Galois Alpha. Revue d'intelligence artificielle RSTI série RIA 19(4-5): 799-227, 2005.


Annotator

Annotator est un plugin eclipse permettant d’annoter un texte au regard d’ontologies OWL et d’un thesaurus SKOS. L’annotation consiste à marquer les unités textuelles correspondant à des éléments de l’ontologie (concept, instance). Le thesaurus contient les unités terminologiques associées aux éléments de l’ontologie. Le texte annoté en RDFA peut être visualisé dans un navigateur. L’annotateur est intégré à l’outil SemEx et à la plateforme Terminae. Cet annotateur a été développé par Abdoulaye Guissé, François Lévy et Sylvie Szulman.

http://www-lipn.univ-paris13.fr/~szulman/Annotator/annotator.html

  • Réferences :


Bibliothèque QCG-OMPI

QCG-OMPI est une bibliothèque de communications pour applications parallèles spécialisée pour les grilles, se concentrant sur la connectivité inter-sites et l'exposition à l'application de la topologie physique sous-jacente.

http://www-lipn.univ-paris13.fr/~coti/QosCosGrid/qcgompi.php

  • Contact : Camille Coti
  • Réferences :


BNI

Plateforme BNI (Bibliothèque Numérique des Idées) C’est une plateforme numérique d’accès sémantique réalisée dans le cadre du projet BNI (voir section 4.4). L’interface web permet une navigation par auteur, par concept ou notion philosophique. Une recherche par mot clés est aussi possible via le moteur de recherche Apache SolR. 

http://tal.lipn.univ-paris13.fr/bni/

  • Contact : @
  • Laboratoire d'origine : LIPN
  • Réferences :


Cartographies sonores de langues du monde

C’est une application web de valorisation des recherches du Labex EFL. Le site montre sur une carte la diversité des langues étudiées au sein du Labex EFL, et permet de parcourir un paysage sonore, c’est à dire, de parcourir la carte en écoutant une chanson, un récit où une blague dans ces langues. On peut également approfondir dans la description d’une langue, où enregistrer sa propre langue maternelle et la situer sur la carte. 

http://tal.lipn.univ-paris13.fr/cartographies/


Clustering4Ever - C4E

Its  Big Data Clustering Library (API) gathering clustering algorithms and quality indexes in Scala and Spark/Scala. Don't hesitate to ask questions or make recommendations in our Gitter
https://gitter.im/Clustering4Ever/Lobby

https://github.com/Clustering4Ever/Clustering4Ever

  • Contact : Gael Beck, Florent Forest, Mustapha LEBBAH et Hanane Azzag
  • Laboratoire d'origine : LIPN
  • Réferences :


Contribution à parallel.py

PAR is a PARallel and distributed job crusher. Bag-of-Tasks (BoT) applications are commonly encountered in bioinformatics. They consist of a large number of independent computation-intensive tasks. PAR is a scalable, dynamic, parallel and distributed execution engine for Bag-of-Tasks. PAR is aimed at multi-core architectures and small clusters.

http://savannah.nongnu.org/projects/par

  • Contact : Camille Coti
  • Laboratoire d'origine : Zhang Initiative Research Unit, Riken, Japon
  • Réferences :


CosyVerif

CosyVerif  is a software environment whose goal is the formal specification and verification of dynamic systems.

It has been designed in order to:

  • support different formalisms with the ability to easily create new ones,
  • provide a graphical interface for every formalism,
  • include verification tools called via the interface as a web service,
  • offer the possibility for a developer to integrate his/her own tool, also allowing it to interact with the other tools.

This environment consists of two software tools: Coloane, the graphical interface, and Alligator, an integration framework based web services. It is enlarged with the existing verification tools developed in our laboratories (founding members or partners).

http://www.cosyverif.org/

  • Contact : Laure Petrucci
  • Laboratoire d'origine : LIPN / LSV / LIP6
  • Réferences :


FMR

ROADEF/EURO Challenge 2012: Machine Reassignment                
 * http://challenge.roadef.org/2012/en/                           
 * Team S26

http://www.lipn.univ-paris13.fr/~butelle/s26.tgz

  • Contact : @
  • Laboratoire d'origine : LIPN
  • Réferences :
    F. Butelle, L. ALfandari, C. Coti, L. Finta, L. Létocart, G. Plateau, F. Roupin, A. Rozenknop and Roberto Wolfler Calvo.
    Fast Machine Reassignment.
    Annals OR, 242(1): 133--160, 2016.
    DOI : 10.1007/s10479-015-2082-3


Framester

Plate-forme de partage de ressources linguistiques ouvertes et liées, à mi chemin de FrameNet, WordNet, VerbNet, BabelNet, DBpedia, Yago, DOLCE-Zero. Ce système permet de créer un graph de connaissances fortement connecté ainsi que d'appliquer un traitement formelle basée sur la sémantique des cadres de Fillmore, ce qui donne à un utilisateur la possibilité d'exprimer des requêtes OWL et de raisonner sur le graph de connaissances crée. Il a été développée par Mewish Alam et Aldo Gangemi. 


http://lipn.univ-paris13.fr/framester/

  • Contact : @
  • Laboratoire d'origine : LIPN
  • Réferences :
    Framester: A Wide Coverage Linguistic Linked Data Hub. Aldo Gangemi, Mehwish Alam, Luigi Asprino, Valentina Presutti, Diego Reforgiato Recupero. EKAW 2016.


FRED.lipn

C’est un système de machine reading capable d’analyser une phrase en langage naturel, d’en extraire les entités et les relations sémantiques, et de les connecter aux connaissances existantes dans le Web des Données. Cette fork française de la version italienne (développée par Aldo Gangemi à l’ISTC-CNR - Conseil Nationale de Recherches, Rome) voudrait devenir code ouvert à moyen terme. 

http://tal.lipn.univ-paris13.fr/fred/

  • Contact : @
  • Laboratoire d'origine : ISTC-CNR
  • Réferences :
    "Semantic Web Machine Reading with FRED". Aldo Gangemi, Valentina Presutti, Diego Reforgiato Recupero, Andrea Giovanni Nuzzolese, Francesco Draicchio, and Misael Mongiovì. Semantic Web, vol. Preprint, no. Preprint, pp. to appear, 2016


Golfred

C’est un système de génération de récits d’expérience pour un robot de service. Il permet de décrire et de résumer les tâches faites par un robot. Il dépend de FRED (système de machine reading) et le générateur de texte Géni (LORIA). Le système est le résultat d'un projet AUF-PIRAT avec l'IIMAS-UNAM (Mexique), le LORIA et le LIPN. 

https://github.com/rcln/Golfred

  • Contact : @
  • Laboratoire d'origine : LIPN / IIMAS-UNAM
  • Réferences :
    Meza, I., Garcia-Flores, J., Gangemi, A. Pineda, L.:Towards narrative generation of spatial experiences in service robots. Proceedings of IJCAI 2016 WS Autonomous Mobile Service Robots. pp. 4. 2016.


IMITATOR

Vérification paramétrée de systèmes temps-réel, modélisés par des automates temporisés paramétrés.

http://www.imitator.fr/

  • Contact : Étienne André
  • Laboratoire d'origine : LSV
  • Réferences :
    Étienne André, Laurent Fribourg, Ulrich Kühne and Romain Soulat. IMITATOR 2.5: A Tool for Analyzing Robustness in Scheduling Problems. In Dimitra Giannakopoulou and Dominique Méry (eds.), FM’12, LNCS 7436, Springer, pages 33–36, August 2012.

    Étienne André and Romain Soulat. The Inverse Method. ISTE Ltd and John Wiley & Sons Inc. ISBN: 9781848214477. January 2013.


Intergiciels de grille : BonjourGrid

BonjourGrid is an example of a middleware to coordinate multiple instances of desktop grids that we are developing in my research group in the context of an international collaboration with Tunisia. A BonjourGrid virtual machine based on Xen for the use with Boinc, Condor and XtremWeb can be downloaded from Sourceforge.

PastryGrid is another desktop Grid middleware able to execute on the fly task graphs with dependencies as well as bag of tasks. PastryGrid is built on top of Pastry, it scales well and is also fault-tolerant.

http://www-lipn.univ-paris13.fr/~cerin/

  • Contact : Christophe Cérin
  • Réferences :


LEAR

Lear est un système d'apprentissage de concepts relationnels.
 Il apprend un ensemble de règles d'ordre 1 à partir d'exemples ambigus représentés par des théories clausales.

http://lipn.univ-paris13.fr/~bouthinon/softwares/lear/lear.html

  • Contact : @
  • Réferences :
    • D. Bouthinon, H. Soldano, and V. Ventos. Concept learning from (very) ambiguous examples. In Proc. of the 6th Int. Conf. on Machine Learning and Data Mining in Pattern Recognition (MLDM 2009), LNCS 5632: 465-478. Springer, 2009.


Lorg.lipn

Lorg.lipn Un analyseur syntaxique et un extracteur de grammaires pour les PCFG-LA, grammaires algébriques probabilistes à annotations latentes (en C++) 

http://github.com/jihelhere/LORG-Release/

  • Contact : @
  • Laboratoire d'origine : NCLT at Dublin City University
  • Réferences :
    [1] "Handling Unknown Words in Statistical Latent-Variable Parsing
      Models for Arabic, English and French", Mohammed Attia, Jennifer
      Foster, Deirdre Hogan, Joseph Le Roux, Lamia Tounsi and Josef van
      Genabith, Proceedings of SPMRL 2010.

    [2] "Improved Inference for Unlexicalized Parsing", Slav Petrov and
    Dan Klein, HLT-NAACL 2007

    [3] "Language-Independent Parsing with Empty Elements", Shu Cai,
    David Chiang and Yoav Goldberg, ACL-2011 (Short Paper)


MinerLC

Extraction de motifs clos dans les graphes attribués.

https://lipn.univ-paris13.fr/MinerLC/

  • Contact : Henry Soldano, Dominique Bouthinon, Guillaume Santini
  • Laboratoire d'origine : LIPN CNRS UMR 7030
  • Réferences :
    • Hub-Authority Cores and Attributed Directed Network Mining
      Henry Soldano and Guillaume Santini and Dominique Bouthinon and Emmanuel Lazega
      IEEE 29th International Conference on Tools with Artificial Intelligence (ICTAI 2017), Boston, MA, USA, IEEE Computer Society, 2017
    • Local knowledge discovery in attributed graphs
      Henry Soldano and Guillaume Santini and Dominique Bouthinon
      27th IEEE International Conference on Tools with Artificial Intelligence (ICTAI 2015), Vietri sul Mare, Italy, 250–257, Anna Esposito, IEEE Computer Society, 2015
    • Graph abstraction for closed pattern mining in attributed network
      Soldano Henry and Santini Guillaume
      European Conference in Artificial Intelligence (ECAI), 849–854, Torsten Schaub and Gerhard Friedrich and Barry O’Sullivan, IOS Press, Frontiers in Artificial Intelligence and Applications, 263, 2014


Modeleur et solveur SDP SDP_S

SDP_S is a stand-alone program which formulates mechanically and solves semidefinite relaxations for any 0-1 quadratic problem. It runs on Linux and other unix like systems. It uses a modified version of the Spectral Bundle method written by C. Helmberg to solve the semidefinite programs.

http://lipn.univ-paris13.fr/~roupin/index.php#projets

  • Contact : Frédéric Roupin
  • Laboratoire d'origine : CEDRIC (CNAM)
  • Réferences :


Neoveille

Plateforme NEOVEILLE La plateforme web permet de gérer les différents modules du projet : gestionnaire des corpus, gestionnaire des néologismes de forme-candidats, gestionnaire de description linguistique des néologismes, gestionnaire des néologismes sémantiques. Un moteur de recherche à fonctionnalités étendues, basé sur Apache Solr permet d’explorer le corpus dynamique, et un module de veille néologisme permet de visualiser le cycle de vie des néologismes selon plusieurs paramètres : évolution fréquencielle temporelle, par types de journaux, par domaines, par pays. Le projet NEOVEILLE a également développé trois programmes permettant la récupération de corpus (sept langues), le repérage automatique des néologismes de forme, le calcul des profils combinatoires des lexies sur gros corpus, et le calcul des innovations
sémantiques.

http://tal.lipn.univ-paris13.fr/neoveille/

  • Contact : @
  • Laboratoire d'origine : LIPN
  • Réferences :
    https://lipn.univ-paris13.fr/~cartier/index.php?id=neoveille


OMTAT

Omtat est un outil d’annotation qui permet d’annoter des fragments discontinus (ex : ne. . . pas) et de les associer dans des structures relationnelles. Il permet aussi de marquer des zones fonctionnelles (ex : titre de section, motivations du jugement). Il dispose enfin d’une interface de visualisation des relations entre annotations et d’une sélection de celles-ci par requètes. L’outil est réalisé par une application java sous Eclipse (18000 lignes de code). Il est développé par François Levy et Sylvie Szulman.

http://tal.lipn.univ-paris13.fr/omtat/

  • Contact : @
  • Laboratoire d'origine : LIPN
  • Réferences :


Platanne

Plateforme d’annotation développée en utilisant le framework de développement Apache-UIMA. Cette plateforme repose sur un système de types générique qui met l’accent sur la nature des annotations à représenter (segmentation, étiquette, relation...) et qui supporte les annotations conflictuelles.

Actuellement, cette plateforme contient des composants permettant d’encapsuler les outils suivants : TagEN, TreeTagger, LIA tools et YaTeA . Elle est développée par Erwan MoreauLaurent Audibert et Jorge Garcia Flores dans le cadre du programme Quaero.

Code source ouvert: https://github.com/rcln/platanne

https://lipn.univ-paris13.fr/rcln/wiki/index.php/Platanne

  • Contact : @
  • Réferences :


POSH (Paris OpenSHMEM)

POSH (Paris OpenSHMEM) is an open-source implementation of the OpenSHMEM specification.

It was released under the GPLv3 library.

http://lipn.univ-paris13.fr/~coti/POSH/

  • Contact : Camille Coti
  • Réferences :


RDOS

RDOS est un ensemble d'outils pour la génération aléatoire d'objets combinatoires, qui réunit des méthodes récentes issues de différents auteurs.
RDOS regroupe des algorithmes de génération aléatoire pour de nombreux objets combinatoires tels que les séquences, les arbres, les automates, les permutations...
Les algorithmes sous-jacents se fondent sur des avancées récentes en génération aléatoire, dont certaines ont été appuyées par le projet ANR MAGNUM.

https://lipn.univ-paris13.fr/rdos/

  • Contact : @
  • Laboratoire d'origine : LIPN LIX
  • Réferences :


SCHUR

Schur is a stand alone C program for interactively calculating properties of Lie groups and symmetric functions...

http://schur.sourceforge.net/

  • Contact : @
  • Laboratoire d'origine : LIPN
  • Réferences :
    J. Nzeutchap, F. Toumazet and F. Butelle.
    Kostka Numbers and Littlewood -- Richardson Coefficients: Distributed Computation.
    In Symmetry, Spectroscopy and SCHUR (Proc. of Pr Brian G. Wybourne Commemorative Meeting), pages 211--221. Nicolaus Copernicus University Press, 2006. ISBN: 83-231-1901-5.


SDMC

SDMC, Sequential Data Mining under Multiple Constraints est un outil fondé sur des techniques de fouille de données séquentielles sous contraintes pour découvrir à partir de textes bruts des connaissances sous forme de motifs séquentiels. Il est utilisable librement en ligne avec une interface simplifiée pour les non informaticiens.

http://tal.lipn.univ-paris13.fr/sdmc/

  • Contact : @
  • Laboratoire d'origine : GREYC
  • Réferences :


SemEx

SemEx est une plateforme d’aide à la construction et à l’exploration d’un modèle métier à partir de textes réglementaires et procéduraux. SemEx repose sur les standards du W3C (SKOS, RDF, RDFa, SPARQL) et s’appuie sur le moteur sémantique CORESE 3.

https://lipn.univ-paris13.fr/~levy/semex/

  • Contact : logiciel développé dans le cadre du projet ONTORULE par Abdoulaye Guissé.
  • Réferences :


Solveur BiqCrunch

BiqCrunch permet de résoudre tout problème quadratique en variables 0-1. Ce solveur utilise les nouvelles bornes semidéfinies présentées dans http://hal.archives-ouvertes.fr/hal-00662367.
 
Le site web BiqCrunch http://www-lipn.univ-paris13.fr/BiqCrunch/ propose un solveur online avec des versions spécifiques pour plusieurs problèmes combinatoires : max-cut, k-cluster, programme quadratique quelconque en 0-1.

http://www-lipn.univ-paris13.fr/BiqCrunch/

  • Contact : Nathan Krislock, Jérôme Malick, Frédéric Roupin
  • Réferences :
    Voir site.


SOPA-Semeval

C’est un système de calcul de similarité sémantique entre deux phrases basé sur un modèle de régression linéaire et développé pour participer dans la tâche Semantic Textual Similarity de Semeval.

https://github.com/dbuscaldi/SOPA

  • Contact : @
  • Laboratoire d'origine : LIPN
  • Réferences :
    Buscaldi, D., Garcia, J., Meza, I. Rodriguez, I.:SOPA: Random Forests Regression for the Semantic Textual Similarity task. Proceedings of SemEval-2015. pp. 132--137. 2015.


Spartakus (Spark-clustering-notebook)

Its introduces somme clustering algorithms and describes its current implementation in the software using since 2012 Spark and Spark-notebook. This notebook has a dual purpose: teaching and research.
https://lipn.univ-paris13.fr/bigdata

https://github.com/Spark-clustering-notebook/coliseum/wiki

  • Contact : Mustapha LEBBAH et Hanane Azzag
  • Laboratoire d'origine : LIPN CNRS UMR 7030, Machine Learning team
  • Réferences :
    • Tarn Duong, Gael Beck, Hanene Azzag, Mustapha Lebbah. Nearest neighbour estimators of density derivatives, with application to mean shift clustering. Pattern Recognition Letters (2016). http://dx.doi.org/10.1016/j.patrec.2016.06.021
    • Mohammed Ghesmoune, Mustapha Lebbah, and Hanane Azzag. state-of-the-art on clustering data stream (invited paper). Big Data Analytics journal, 2016
    • Tugdual Sarazin, Mustapha Lebbah, and Hanane Azzag. Biclustering using spark- mapreduce. In 2014 IEEE International Conference on Big Data, Big Data 2014, Washington, DC, USA, October 27-30, 2014, pages 58–60, 2014.


Terminae

Terminae est une plateforme d’aide à la construction de ressources termino-ontologiques à partir de sources textuelles. Elle met en œuvre la méthodologie Terminae qui guide l’ingénieur de la connaissance dans le travail de construction d’une ontologie. Elle s’appuie sur un niveau termino-conceptuel intermédiaire pour permettre le passage du texte et des connaissances terminologiques qui en sont extraites au niveau conceptuel (l’ontologie). Cette plateforme permet de visualiser les résultats d’outils de traitement automatique des langues (des extracteurs de termes et des outils de reconnaissance d’entités nommées, notamment) et de les utiliser pour construire des ressources termino-ontologiques (terminologies, thésaurus, ontologies) où les éléments conceptuels disposent d’un ancrage linguistique.

La plateforme est réalisée par une application Eclipse. Elle supporte l’import/export en SKOS et en OWL. Dans la version actuelle, le niveau conceptuel est réalisé par le plugin Neon Toolkit 2.4. Les versions disponibles permettent de travailler à partir de textes français et anglais. Terminae est développé par Sylvie Szulman.

http://lipn.univ-paris13.fr/terminae

  • Réferences :


Termometer

Termometer est un utilitaire permettant d’évaluer une liste de termes au regard d’une référence. La mesure de distance terminologique sur laquelle il repose permet de tenir compte de l’aspect graduel de la pertinence terminologique dans l’évaluation des sorties d’extracteur de termes.

Termometer a été développé par Thibault Mondary et Jonathan van Puymbrouck dans le cadre du programme Quaero où il est utilisé dans des campagnes d’évaluation. Cet utilitaire est disponible sur SourceForge, sous licence GPLv3.

http://sourceforge.net/projects/termometerxd/

  • Réferences :


Terrier SIR

Terrier SIR est une plateforme OpenSource qui enrichit la plateforme de recherche d’information Terrier IR de fonctionnalités sémantiques modulaires. Elle favorise aussi bien l’implémentation et le test de méthodes de recherche d’informations sémantique que leurs éventuelles mises à jour ou adaptations.

La plateforme est développée par Ines Bannour dans le cadre du projet Legilocal. Elle est en phase de test et sa diffusion est prévue fin 2012.

https://github.com/rcln/TerrierSIR

  • Contact : @
  • Laboratoire d'origine : LIPN
  • Réferences :


UnoporunO

Système de localisation d’experts sur le web par extraction de connaissances sémantiques. Actuellement il est utilisé par des sociologues de la migration pour la localisation des diasporas latino-américaines hautement qualifiées (projet Ecos Nord avec le Mexique). 

http://tal.lipn.univ-paris13.fr/unoporuno/

  • Contact : @
  • Laboratoire d'origine : LIMSI
  • Réferences :
    J. J. Garcia Flores, Pierre Zweigenbaum, Zhao Yue and W.A. Turner (2012) Tracking Researcher Mobility on the Web Using Snippet Semantic Analysis. In H. Ishara & K. Kanzaki, Advances in Natural Language Processing 8th International Conference on NLP, October 22-24, Kanazawa, Japan. (JapTAL 2012) Springer Lecture Notes in Computer Sciences, vol. 7614, ISBN 978-3-642-33983-7, pp. 180-191.


ValiTerms

ValiTerms est un outil qui a pour objectif de faciliter la validation d’une liste de termes. ValiTerms propose une interface web qui prend en compte un corpus étiqueté morpho-syntaxiquement et une liste de termes. À l’aide de cette interface, l’expert est en mesure d’analyser rapidement les termes dans leur contexte (la phrase) et de décider de leur validité. La gestion de session permet de reprendre un travail en cours et de stocker les résultats à toutes les étapes du travail.

ValiTerms est développé par Thibault Mondary dans le cadre du programme Quaero. Il est utilisé par des experts de l’INIST pour l’enrichissement de thesaurus et durant la phase d’adjudication des campagnes d’évaluation. Cet outil est disponible sur SourceForge, sous licence GPLv3.

http://sourceforge.net/projects/valiterms

  • Réferences :


YaSemIR

YaSemIR est un moteur de recherche d’information sémantique qui enrichit Lucene avec l’intégration de concepts et des calculs de similarité sémantique. Le moteur est disponible en code source ouvert

https://github.com/dbuscaldi/YaSemIR/

  • Contact : @
  • Laboratoire d'origine : RCLN
  • Réferences :


YaTeA

YaTeA (Yet another Term extrActor) identifie et extrait des groupes nominaux pou- vant être des termes, i.e. des termes candidats. Chaque terme candidat est analysé syntaxiquement pour faire apparaître sa structure sous la forme de relations tête-modifieur. L’extraction de termes candidats repose sur une stratégie hybride par laquelle l’extraction à partir de patrons syntaxiques construits manuellement peut être guidée et corrigée à l’aide de ressources terminologiques existantes (désambiguïsation exogène). Ces termes attestés aident au repérage des groupes, à leur analyse syntaxique et participent également à l’extraction des termes candidats.

YaTeA, qui a été développé par Thierry Hamon et Sophie Aubin, est disponible sous licence GPL sous la forme d’un module CPAN.

http://search.cpan.org/~thhamon/Lingua-YaTeA/

  • Contact : @
  • Laboratoire d'origine : LIPN
  • Réferences :


Retour vers le haut