Was bedeutet query-basierte
Klassifikation?
Bei der query-basierten Klassifikation
werden Dokumente in die vorgegebenen Kategorien einer Taxonomie aufgrund von
Suchanfragen (Queries) eingeordnet. Entspricht ein Dokument einer solchen
Suchanfrage, dann wird es in die dazugehörige Kategorie eingeordnet. Die
Suchanfrage kann aus einem einzelnen Wort oder auch aus einer Folge von Worten
bestehen, die durch boolesche Operatoren (AND und OR) verknüpft werden können
(siehe
Was ist
eine query-basierte Taxonomie?).
Da eine Taxonomie eine hierarchische Struktur hat, enthalten die Kategorien oben in der Hierarchie allgemeinere Informationen als die Kategorien der untergeordneten Ebenen. Je tiefer Sie also in die Taxonomie navigieren, desto spezifischer werden die Informationen. Die Suchanfragen werden daher auch entsprechend dieser hierarchischen Ordnung – von oben nach unten – vom System abgearbeitet: Damit ein Dokument in einer Kategorie klassifiziert wird, muss es auch die Suchanfragen der übergeordneten Kategorien erfüllen. Ein Dokument wird also nur dann in einer speziellen Kategorie klassifiziert, wenn es zunächst auch in die übergeordneten, allgemeineren Kategorien passt.


Bei der query-basierten Klassifikation gibt es – im Gegensatz zur beispielbasierten Klassifikation – keine graduell abgestufte Ähnlichkeit zwischen einer Kategorie und den Dokumenten, die in die Kategorie klassifiziert werden sollen: Denn ein Dokument enthält entweder die Worte der Suchanfrage oder nicht und gehört dementsprechend in die Kategorie, die durch die Suchanfrage definiert wurde, oder nicht.