Nom du processusskos:prefLabel

Unitex-CasSys

Documentation des processusskos:definition

Unitex est un ensemble de logiciels permettant de traiter des textes en langues naturelles en utilisant des ressources linguistiques issues de travaux initiés sur le français par Maurice Gross au Laboratoire d’Automatique Documentaire et Linguistique (LADL). Le LADL est un laboratoire du CNRS.

Les ressources utilisées sont:

  • des dictionnaires électroniques qui décrivent les mots simples et composés d’une langue en leur associant un lemme ainsi qu’une série de codes grammaticaux, sémantiques et flexionnels ;
  • des grammaires qui sont des représentations de phénomènes linguistiques par réseaux de transitions récursifs (RTN), un formalisme proche de celui des automates à états finis ;
  • des tables de lexique-grammaire qui sont des matrices décrivant les propriétés de certains mots.

Unitex est un moteur permettant d’exploiter ces ressources linguistiques. La cascade de transducteurs CasEN pour la reconnaissance des entités nommées est implantée sous le logiciel CasSys de la plate-forme Unitex et est librement mise a disposition des utilisateurs sous licence LGPL-LR.

CasSys est développé par le Laboratoire d’Informatique de l’Université de Tours et a été optimisé par le Société Ergonotics de Lille dans le cadre d'ISTEX.

fr
Type d'enrichissementistex:enrichmentType
Reconnaissance d'entités nommées
Contraintesistex:constraint
Langues traitées : anglais, français.
Laboratoire d'Informatique de l'Université François Rabelais de Tours. 
    Documentation des ressourcesdcterms:description

    Les ressources utilisées par Unitex se présentent sous la forme de dictionnaires électroniques, de grammaires et de tables de lexique-grammaire.

    fr
    Nom de la facettedcterms:isReferencedBy
    unitex
    Requête Istexistex:query
    ark:/67375/R0H-3VW5C617-L
    Powered by Lodex 8.18.6