Package medite :: Package MediteAppli :: Module synthetic :: Class TaggerExtension

Class TaggerExtension

object --+
         |
        TaggerExtension

Classe gérant l'étiquetage des textes

Instance Methods

[hide private]

__init__(self, res)
Constructeur

source code

etiquetage(self)
Lance l'étiqueteur sur le texte et renvoie une liste [(token,tag)]

source code

_printTaggerOutput(self, liste, nom)

source code

extractLTokenPos_(self)
Extrait à partir du texte original une liste [(token, position)]

source code

extractLTokenPos__(self, texte, debutTexte)
Extrait à partir du texte original une liste [(token, position)]

source code

alignement(self)
Aligne la liste (token,tag) et la liste (token,position) en une liste [(debutToken,finToken,tag)]

source code

alignement_(self, lTokenPos, lTokenTag)
Aligne les 2 listes en créant une liste [(debutToken,finToken,tag)]...

source code

post_traitement_alignement(self, liste)
Conversion de la liste [(debut,fin,tag)] en dictionnaire pre: isinstance(liste,list) post: isinstance(__return__,dict)

source code

calcul_frequences(self, la, da)
Crée la matrice de fréquences...

source code

__sum_tag(self, liste, da, p=False)
Prend une liste [(deb,fin)] et renvoie un array des fréquences des tags dans celle-ci...

source code

__filtre(self, liste, deb, fin)
Renvoie la sous-liste des items de liste compris entre deb et fin

source code

run(self)
post: assert_(isinstance(__return__,FrequencyMatrix))

source code

Inherited from object: __delattr__, __getattribute__, __hash__, __new__, __reduce__, __reduce_ex__, __repr__, __setattr__, __str__

Properties

[hide private]

Inherited from object: __class__

Method Details

[hide private]

init(self, res)
(Constructor)

source code

Constructeur

pre: isinstance(res,Donnees.resultatAppli.Resultat)

Overrides: object.__init__

etiquetage(self)

source code

Lance l'étiqueteur sur le texte et renvoie une liste [(token,tag)]

On traite les 2 fichiers séparément car si le 1er ne se termine pas par un séparateur, son denier mot est concaténé au 1er du 2e fichier.

post: isinstance(__return__,list)

extractLTokenPos_(self)

source code

Extrait à partir du texte original une liste [(token, position)]

Traite le texte source puis le texte cible

post: isinstance(__return__,list)

extractLTokenPos__(self, texte, debutTexte)

source code

Extrait à partir du texte original une liste [(token, position)]

pre: isinstance(texte,str) and isinstance(debutTexte,int) and debutTexte>=0 post: isinstance(__return__,list)

alignement(self)

source code

Aligne la liste (token,tag) et la liste (token,position) en une liste [(debutToken,finToken,tag)]

post: isinstance(__return__,list)

alignement_(self, lTokenPos, lTokenTag)

source code

Aligne les 2 listes en créant une liste [(debutToken,finToken,tag)]

pre: isinstance(lTokenTag, list)
     isinstance(lTokenPos, list)
post: isinstance(__return__,list)

calcul_frequences(self, la, da)

source code

Crée la matrice de fréquences
pre: isinstance(la,list)
     isinstance(da,dict)
post: isinstance(__return__,TagFrequencyMatrix)

__sum_tag(self, liste, da, p=False)

source code

Prend une liste [(deb,fin)] et renvoie un array des fréquences des tags dans celle-ci

pre: isinstance(da,dict)
     isinstance(liste,list)
     forall([x in liste], isintance(x[0],int) and isinstance(x[1],int))
post: forall([0<=__return__[i]<=len(liste) for i in arrayrange(__return__)])

Class TaggerExtension

__init__(self, res) (Constructor)

etiquetage(self)

extractLTokenPos_(self)

extractLTokenPos__(self, texte, debutTexte)

alignement(self)

alignement_(self, lTokenPos, lTokenTag)

calcul_frequences(self, la, da)

__sum_tag(self, liste, da, p=False)

init(self, res)
(Constructor)