Package medite :: Package MediteAppli :: Module synthetic :: Class TaggerExtension
[hide private]
[frames] | no frames]

Class TaggerExtension

source code

object --+
         |
        TaggerExtension

Classe gérant l'étiquetage des textes

Instance Methods [hide private]
 
__init__(self, res)
Constructeur
source code
 
etiquetage(self)
Lance l'étiqueteur sur le texte et renvoie une liste [(token,tag)]
source code
 
_printTaggerOutput(self, liste, nom) source code
 
extractLTokenPos_(self)
Extrait à partir du texte original une liste [(token, position)]
source code
 
extractLTokenPos__(self, texte, debutTexte)
Extrait à partir du texte original une liste [(token, position)]
source code
 
alignement(self)
Aligne la liste (token,tag) et la liste (token,position) en une liste [(debutToken,finToken,tag)]
source code
 
alignement_(self, lTokenPos, lTokenTag)
Aligne les 2 listes en créant une liste [(debutToken,finToken,tag)]...
source code
 
post_traitement_alignement(self, liste)
Conversion de la liste [(debut,fin,tag)] en dictionnaire pre: isinstance(liste,list) post: isinstance(__return__,dict)
source code
 
calcul_frequences(self, la, da)
Crée la matrice de fréquences...
source code
 
__sum_tag(self, liste, da, p=False)
Prend une liste [(deb,fin)] et renvoie un array des fréquences des tags dans celle-ci...
source code
 
__filtre(self, liste, deb, fin)
Renvoie la sous-liste des items de liste compris entre deb et fin
source code
 
run(self)
post: assert_(isinstance(__return__,FrequencyMatrix))
source code

Inherited from object: __delattr__, __getattribute__, __hash__, __new__, __reduce__, __reduce_ex__, __repr__, __setattr__, __str__

Properties [hide private]

Inherited from object: __class__

Method Details [hide private]

__init__(self, res)
(Constructor)

source code 

Constructeur

pre: isinstance(res,Donnees.resultatAppli.Resultat)
Overrides: object.__init__

etiquetage(self)

source code 

Lance l'étiqueteur sur le texte et renvoie une liste [(token,tag)]

On traite les 2 fichiers séparément car si le 1er ne se termine pas par un séparateur, son denier mot est concaténé au 1er du 2e fichier.

post: isinstance(__return__,list)

extractLTokenPos_(self)

source code 

Extrait à partir du texte original une liste [(token, position)]

Traite le texte source puis le texte cible

post: isinstance(__return__,list)

extractLTokenPos__(self, texte, debutTexte)

source code 

Extrait à partir du texte original une liste [(token, position)]

pre: isinstance(texte,str) and isinstance(debutTexte,int) and debutTexte>=0 post: isinstance(__return__,list)

alignement(self)

source code 

Aligne la liste (token,tag) et la liste (token,position) en une liste [(debutToken,finToken,tag)]

post: isinstance(__return__,list)

alignement_(self, lTokenPos, lTokenTag)

source code 
Aligne les 2 listes en créant une liste [(debutToken,finToken,tag)]

pre: isinstance(lTokenTag, list)
     isinstance(lTokenPos, list)
post: isinstance(__return__,list)

calcul_frequences(self, la, da)

source code 
Crée la matrice de fréquences
pre: isinstance(la,list)
     isinstance(da,dict)
post: isinstance(__return__,TagFrequencyMatrix)

__sum_tag(self, liste, da, p=False)

source code 
Prend une liste [(deb,fin)] et renvoie un array des fréquences des tags dans celle-ci

pre: isinstance(da,dict)
     isinstance(liste,list)
     forall([x in liste], isintance(x[0],int) and isinstance(x[1],int))
post: forall([0<=__return__[i]<=len(liste) for i in arrayrange(__return__)])