Logiciels
ACL-RelAcSC’est un corpus conçu pour l’acquisition de relations sémantiques semantic RELation ACquiSition (extraction et classification) dans le domaine scientifique. Il est annoté avec des concepts du domaine et des relations sémantiques. Le corpus est composé d’environ 11.000 articles venant du corpus ACL Anthology. Le corpus est sous licence Creative Commons développé par Kata Gabor.
https://lipn.univ-paris13.fr/~gabor/Relacs/
|
AnnotatorAnnotator est un plugin eclipse permettant d’annoter un texte au regard d’ontologies OWL et d’un thesaurus SKOS. L’annotation consiste à marquer les unités textuelles correspondant à des éléments de l’ontologie (concept, instance). Le thesaurus contient les unités terminologiques associées aux éléments de l’ontologie. Le texte annoté en RDFA peut être visualisé dans un navigateur. L’annotateur est intégré à l’outil SemEx et à la plateforme Terminae. Cet annotateur a été développé par Abdoulaye Guissé, François Lévy et Sylvie Szulman.
http://www-lipn.univ-paris13.fr/~szulman/Annotator/annotator.html
|
BNIPlateforme BNI (Bibliothèque Numérique des Idées) C’est une plateforme numérique d’accès sémantique réalisée dans le cadre du projet BNI (voir section 4.4). L’interface web permet une navigation par auteur, par concept ou notion philosophique. Une recherche par mot clés est aussi possible via le moteur de recherche Apache SolR.
http://tal.lipn.univ-paris13.fr/bni/
|
Cartographies sonores de langues du mondeC’est une application web de valorisation des recherches du Labex EFL. Le site montre sur une carte la diversité des langues étudiées au sein du Labex EFL, et permet de parcourir un paysage sonore, c’est à dire, de parcourir la carte en écoutant une chanson, un récit où une blague dans ces langues. On peut également approfondir dans la description d’une langue, où enregistrer sa propre langue maternelle et la situer sur la carte.
http://tal.lipn.univ-paris13.fr/cartographies/
|
FramesterPlate-forme de partage de ressources linguistiques ouvertes et liées, à mi chemin de FrameNet, WordNet, VerbNet, BabelNet, DBpedia, Yago, DOLCE-Zero. Ce système permet de créer un graph de connaissances fortement connecté ainsi que d'appliquer un traitement formelle basée sur la sémantique des cadres de Fillmore, ce qui donne à un utilisateur la possibilité d'exprimer des requêtes OWL et de raisonner sur le graph de connaissances crée. Il a été développée par Mewish Alam et Aldo Gangemi.
http://lipn.univ-paris13.fr/framester/
|
FRED.lipnC’est un système de machine reading capable d’analyser une phrase en langage naturel, d’en extraire les entités et les relations sémantiques, et de les connecter aux connaissances existantes dans le Web des Données. Cette fork française de la version italienne (développée par Aldo Gangemi à l’ISTC-CNR - Conseil Nationale de Recherches, Rome) voudrait devenir code ouvert à moyen terme.
http://tal.lipn.univ-paris13.fr/fred/
|
GolfredC’est un système de génération de récits d’expérience pour un robot de service. Il permet de décrire et de résumer les tâches faites par un robot. Il dépend de FRED (système de machine reading) et le générateur de texte Géni (LORIA). Le système est le résultat d'un projet AUF-PIRAT avec l'IIMAS-UNAM (Mexique), le LORIA et le LIPN.
https://github.com/rcln/Golfred
|
Lorg.lipnLorg.lipn Un analyseur syntaxique et un extracteur de grammaires pour les PCFG-LA, grammaires algébriques probabilistes à annotations latentes (en C++) Code source ouvert : https://github.com/jihelhere/LORG-Release
http://github.com/jihelhere/LORG-Release/
|
NeoveillePlateforme NEOVEILLE La plateforme web permet de gérer les différents modules du projet : gestionnaire des corpus, gestionnaire des néologismes de forme-candidats, gestionnaire de description linguistique des néologismes, gestionnaire des néologismes sémantiques. Un moteur de recherche à fonctionnalités étendues, basé sur Apache Solr permet d’explorer le corpus dynamique, et un module de veille néologisme permet de visualiser le cycle de vie des néologismes selon plusieurs paramètres : évolution fréquencielle temporelle, par types de journaux, par domaines, par pays. Le projet NEOVEILLE a également développé trois programmes permettant la récupération de corpus (sept langues), le repérage automatique des néologismes de forme, le calcul des profils combinatoires des lexies sur gros corpus, et le calcul des innovations sémantiques.
http://tal.lipn.univ-paris13.fr/neoveille/
|
OMTATOmtat est un outil d’annotation qui permet d’annoter des fragments discontinus (ex : ne. . . pas) et de les associer dans des structures relationnelles. Il permet aussi de marquer des zones fonctionnelles (ex : titre de section, motivations du jugement). Il dispose enfin d’une interface de visualisation des relations entre annotations et d’une sélection de celles-ci par requètes. L’outil est réalisé par une application java sous Eclipse (18000 lignes de code). Il est développé par François Levy et Sylvie Szulman.
http://tal.lipn.univ-paris13.fr/omtat/
|
PlatannePlateforme d’annotation développée en utilisant le framework de développement Apache-UIMA. Cette plateforme repose sur un système de types générique qui met l’accent sur la nature des annotations à représenter (segmentation, étiquette, relation...) et qui supporte les annotations conflictuelles. Actuellement, cette plateforme contient des composants permettant d’encapsuler les outils suivants : TagEN, TreeTagger, LIA tools et YaTeA . Elle est développée par Erwan Moreau, Laurent Audibert et Jorge Garcia Flores dans le cadre du programme Quaero. Code source ouvert: https://github.com/rcln/platanne
https://lipn.univ-paris13.fr/rcln/wiki/index.php/Platanne
|
SDMCSDMC, Sequential Data Mining under Multiple Constraints est un outil fondé sur des techniques de fouille de données séquentielles sous contraintes pour découvrir à partir de textes bruts des connaissances sous forme de motifs séquentiels. Il est utilisable librement en ligne avec une interface simplifiée pour les non informaticiens.
http://tal.lipn.univ-paris13.fr/sdmc/
|
SemExSemEx est une plateforme d’aide à la construction et à l’exploration d’un modèle métier à partir de textes réglementaires et procéduraux. SemEx repose sur les standards du W3C (SKOS, RDF, RDFa, SPARQL) et s’appuie sur le moteur sémantique CORESE 3.
https://lipn.univ-paris13.fr/~levy/semex/
|
SOPA-SemevalC’est un système de calcul de similarité sémantique entre deux phrases basé sur un modèle de régression linéaire et développé pour participer dans la tâche Semantic Textual Similarity de Semeval.
https://github.com/dbuscaldi/SOPA
|
TerminaeTerminae est une plateforme d’aide à la construction de ressources termino-ontologiques à partir de sources textuelles. Elle met en uvre la méthodologie Terminae qui guide l’ingénieur de la connaissance dans le travail de construction d’une ontologie. Elle s’appuie sur un niveau termino-conceptuel intermédiaire pour permettre le passage du texte et des connaissances terminologiques qui en sont extraites au niveau conceptuel (l’ontologie). Cette plateforme permet de visualiser les résultats d’outils de traitement automatique des langues (des extracteurs de termes et des outils de reconnaissance d’entités nommées, notamment) et de les utiliser pour construire des ressources termino-ontologiques (terminologies, thésaurus, ontologies) où les éléments conceptuels disposent d’un ancrage linguistique. La plateforme est réalisée par une application Eclipse. Elle supporte l’import/export en SKOS et en OWL. Dans la version actuelle, le niveau conceptuel est réalisé par le plugin Neon Toolkit 2.4. Les versions disponibles permettent de travailler à partir de textes français et anglais. Terminae est développé par Sylvie Szulman.
http://lipn.univ-paris13.fr/terminae
|
TermometerTermometer est un utilitaire permettant d’évaluer une liste de termes au regard d’une référence. La mesure de distance terminologique sur laquelle il repose permet de tenir compte de l’aspect graduel de la pertinence terminologique dans l’évaluation des sorties d’extracteur de termes. Termometer a été développé par Thibault Mondary et Jonathan van Puymbrouck dans le cadre du programme Quaero où il est utilisé dans des campagnes d’évaluation. Cet utilitaire est disponible sur SourceForge, sous licence GPLv3.
http://sourceforge.net/projects/termometerxd/
|
Terrier SIRTerrier SIR est une plateforme OpenSource qui enrichit la plateforme de recherche d’information Terrier IR de fonctionnalités sémantiques modulaires. Elle favorise aussi bien l’implémentation et le test de méthodes de recherche d’informations sémantique que leurs éventuelles mises à jour ou adaptations. La plateforme est développée par Ines Bannour dans le cadre du projet Legilocal. Elle est en phase de test et sa diffusion est prévue fin 2012.
https://github.com/rcln/TerrierSIR
|
UnoporunOSystème de localisation d’experts sur le web par extraction de connaissances sémantiques. Actuellement il est utilisé par des sociologues de la migration pour la localisation des diasporas latino-américaines hautement qualifiées (projet Ecos Nord avec le Mexique).
http://tal.lipn.univ-paris13.fr/unoporuno/
|
ValiTermsValiTerms est un outil qui a pour objectif de faciliter la validation d’une liste de termes. ValiTerms propose une interface web qui prend en compte un corpus étiqueté morpho-syntaxiquement et une liste de termes. À l’aide de cette interface, l’expert est en mesure d’analyser rapidement les termes dans leur contexte (la phrase) et de décider de leur validité. La gestion de session permet de reprendre un travail en cours et de stocker les résultats à toutes les étapes du travail. ValiTerms est développé par Thibault Mondary dans le cadre du programme Quaero. Il est utilisé par des experts de l’INIST pour l’enrichissement de thesaurus et durant la phase d’adjudication des campagnes d’évaluation. Cet outil est disponible sur SourceForge, sous licence GPLv3.
http://sourceforge.net/projects/valiterms
|
YaSemIRYaSemIR est un moteur de recherche d’information sémantique qui enrichit Lucene avec l’intégration de concepts et des calculs de similarité sémantique. Le moteur est disponible en code source ouvert
https://github.com/dbuscaldi/YaSemIR/
|
YaTeAYaTeA (Yet another Term extrActor) identifie et extrait des groupes nominaux pou- vant être des termes, i.e. des termes candidats. Chaque terme candidat est analysé syntaxiquement pour faire apparaître sa structure sous la forme de relations tête-modifieur. L’extraction de termes candidats repose sur une stratégie hybride par laquelle l’extraction à partir de patrons syntaxiques construits manuellement peut être guidée et corrigée à l’aide de ressources terminologiques existantes (désambiguïsation exogène). Ces termes attestés aident au repérage des groupes, à leur analyse syntaxique et participent également à l’extraction des termes candidats. YaTeA, qui a été développé par Thierry Hamon et Sophie Aubin, est disponible sous licence GPL sous la forme d’un module CPAN.
http://search.cpan.org/~thhamon/Lingua-YaTeA/
|