Chaque racine est transformée en une colonne et lorsque la racine apparaît dans un texte, sa présence peut être codée selon une des méthodes suivantes :
TFIDF = TF*log10(TotalNumberOfDocuments/NumberOfDocumentsContainingTheRoot)
TCIDF = TC*log10(TotalNumberOfDocuments/NumberOfDocumentsContainingTheRoot)