Indizierung von Dokumenten
Der Prozess Indizierung von Dokumenten beinhaltet Konfigurationsschritte, die das Implementierungsteam durchführt.
Das Crawlen von Repositories und die Indizierung der enthaltenen Dokumente sind Grundlage für Suche und Klassifikation.
Dieser IT-Prozess ist Bestandteil des folgenden IT-Szenarios:
IT-Szenario |
Szenariovariante |
● Ein oder mehrere Repositories sind angelegt.
● Die benötigten Services sind aktiv.
● Eigenschaften und Ressourcentypen sind angelegt.
● Sie haben Überlegungen durchgeführt, wie viele Indizes benötigt werden und welche Repositories diesen Indizes zugeordnet sein sollen.
Der folgende IT-Prozess läuft in der Verwendungsart Enterprise Portal (EP) ab. Dabei wird auf die Standalone-Engine Search and Classification (TREX) zugegriffen.
...
1. Crawler konfigurieren
Die verschiedenen Repositories müssen vor der Indizierung gecrawlt werden. Crawler können dabei je nach Einsatz unterschiedlich konfiguriert werden. Zum Crawlen von Web-Repositories sollten sie z. B. Crawler konfigurieren, die Links nur bis zu einer bestimmten Tiefe verfolgen.
2. Indizes anlegen
In der Index-Administration legen Sie neue Indizes an. Wählen Sie als Service TREX Search and Classification und die zuvor angelegten Crawler-Parameter aus. Dieser Service wird für den Folgeprozess „Erstellung von Taxonomien“ benötigt.
3. Repositories den Indizes zuordnen
In der Index-Administration weisen Sie jedem Index ein oder mehrere Repositories als Datenquellen zu. Um den Inhalt der Indizes aktuell zu halten, können Sie die Datenquellen periodisch re-indizieren lassen.

Jedes Repository kann genau einem Index zugeordnet werden. Mehrfach-Zuordnungen sind nicht möglich.
4. Indizierung starten und überwachen
Mit dem Indizierungsmonitor überwachen Sie das Crawling und die Indizierung.
Die im Szenario verfügbaren Repositories wurden indiziert. Die Suche nach und Klassifikation von Dokumenten kann durchgeführt werden.