Cada raíz se convierte en una variable y, cuando la raíz aparece en un texto, su presencia se puede codificar de tres maneras:
TFIDF = TF*log10(TotalNumberOfDocuments/NumberOfDocumentsContainingTheRoot)
TCIDF = TC*log10(TotalNumberOfDocuments/NumberOfDocumentsContainingTheRoot)