Wörterbuch-Erstellungsparameter

Das Wörterbuch besteht aus Stämmen, d.h. bedeutungsvollen Wörtern oder Termini. Sie können folgende Parameter für die Wörterbuchkonstruktion festlegen:

  • Entfernen von Stoppwörtern

    Wenn diese Option markiert ist, werden die Stoppwörter aus der Liste der Stämme entfernt.

  • Stammbildungskürzung

    Wenn diese Option markiert ist, werden die Affixe entfernt, um die Anzahl der Stämme zu begrenzen.

  • Begriffszusammenführung

    Bei dieser Option können Sie eine externe Datei verwenden, um Termini (d.h. Gruppen von Wörtern, die für ein einzelnes Konzept stehen, z.B. "Weißes Haus") mit Konzepten zu verknüpfen. Da hierbei Gruppen von Wörtern behandelt werden, wird diese Option vor der Entfernung der Stoppwörter und der Stammbildung angewendet. Sie können Ihr eigenes Konzeptwörterbuch anlegen, indem Sie eine Textdatei mit der Bezeichnung ConceptList_<Sprachcode> (ohne Erweiterung) erstellen, die auf jeder Zeile eine Gruppe von Wörtern und das zugehörige Konzept enthält. Beispielsweise können Sie eine Konzeptliste für eine Fluggesellschaft erstellen:

    word=concept

    business-class=BusinessClass

    first-class=FirstClass

    flying-blue=FlyingBlue

    Sie können auch das Konzept "Kreditkarte" auf eine beliebige Kreditkarte anwenden (z.B. "American Express", "Visa Card" usw.):

    credit-card=creditcard

    american-express=creditcard

    visa-card=creditcard

    mastercard=creditcard

    Sie müssen ein Gleichheitszeichen "=" zwischen Wörtern und Konzepten setzen, die Leerstellen durch dashes (Gedankenstriche) ersetzen und die Wörter in Kleinbuchstaben schreiben (da die Begriffszusammenführung nach Entfernen aller Großbuchstaben erfolgt).

    Beachten Sie außerdem, die Begriffszusammenführung für die Singular- und Pluralform der Wörter durchzuführen, um alle Vorkommen abzudecken.

    Die Verwendung der Konzeptliste ist sprachabhängig. Die geeignete Liste wird automatisch ausgewählt, sobald die Sprache entweder automatisch erkannt oder durch den Benutzer festgelegt wurde.

  • Synonymersetzung

    Bei dieser Option können Sie eine externe Datei zum Definieren synonymer Stämme verwenden. Sie wird verwendet, um bestimmte Stämme durch einen vom Benutzer ausgewählten Stamm zu ersetzen. Diese Option wird angewendet, nachdem die Stoppwörter entfernt und die Stammbildungsregeln angewendet wurden. Sie können Ihr eigenes Synonymwörterbuch anlegen, indem Sie eine Textdatei mit der Bezeichnung SynonymList_<Sprachcode> erstellen, die in jeder Zeile einen von der Textcodierung gefundenen Stamm verbunden mit dem Synonymstamm enthält, z.B.:

    <found root>=<replacement root>

    Hinweis

    Stämme und Synonyme werden durch ein Gleichheitszeichen (=) getrennt.

    Die Verwendung von Synonymen ist sprachabhängig. Die geeignete Liste wird automatisch ausgewählt, sobald die Sprache entweder automatisch erkannt oder durch den Benutzer festgelegt wurde.

  • Maximale generierte Stammanzahl

    Mithilfe dieser Option können Sie festlegen, wie viele Stämme im Wörterbuch enthalten sein dürfen. Standardmäßig werden die Stämme mit der größten Häufigkeit beibehalten. Sie können jedoch einen Prozentanteil der häufigsten, auszuschließenden Stämme festlegen, indem Sie Erweitert wählen.