Datenquellen zuordnen

Verwendung

Sie ordnen einem Index eine oder mehrere Datenquellen zu, um den Content interner oder externer Repositorys zu indizieren.

Sie können einem Index eine oder mehrere Datenquellen der folgenden Arten zuordnen:

Hierarchisches Repository

Wenn Sie einen Teil eines hierarchischen Repositorys indizieren möchten, können Sie innerhalb des Repositorys navigieren und den Ordner markieren, den Sie indizieren möchten. Das System indiziert den Content dieses Ordners einschließlich des Contents aller Unterordner.

Beachten Sie, dass ein Ordner nicht mehreren Indizes zugleich zugeordnet werden kann.
Web-Repository

In Web-Repositorys können Sie nicht navigieren. Sie können einem Index nur ein vollständiges Repository zuordnen. Sie können jedoch eine Startseite für den Crawler definieren.

Hinweis
Der Crawler durchsucht nur Websites oder Teile von Websites, die nicht durch Robot-Anweisungen geschützt sind. Robot-Anweisungen sind Bestandteil von Internetstandards. Sie ermöglichen Inhabern von Websites, das Crawling ihrer Websites oder Teilen davon zu gestatten oder zu untersagen.

Crawler-Parameter

Abhängig von der Art des Repositorys müssen Sie gegebenenfalls einen Crawler und einen Zeitplan einrichten.

Für Web-Repositorys wird der Index mithilfe von Crawlern aktualisiert. Wenn Sie einem Index zum ersten Mal ein Web-Repository zuordnen, wird dieses unverzüglich indiziert. Danach müssen Sie einen regelmäßigen Zeitplan für die Ausführung des Crawlers festlegen, damit der Index aktualisiert wird.
In hierarchischen Repositorys wird der Index mithilfe von Ereignissen aktualisiert. Daher ist es nicht unbedingt notwendig, dass der Crawler in regelmäßigen Abständen ausgeführt wird. Sie können den Crawler jedoch in regelmäßigen Abständen ausführen, um Änderungen am Index vorzunehmen, für die kein Ereignis ausgelöst wird. Dies kann der Fall sein, wenn Dokumente direkt im Dateisystem ohne Verwendung von Knowledge Management angelegt, geändert oder gelöscht wurden.

Startseite (nur Web-Repositorys)

Die Startseite ist die Seite, auf der der Crawler den Crawling-Vorgang beginnt. Sie können den Namen einer HTML-Seite oder einen vollständigen Pfad angeben. Die Zeichenkette, die Sie im Feld Startseite eingeben, wird zur URL hinzugefügt, die in der Konfiguration des Web-Repositorys definiert ist.

Beispiel

Die folgende URL wird bei der Konfiguration eines Web-Repositorys definiert:

http://www.<my-website>.com/

Die erste Zugangsseite für diese Website, die Links für die Navigation der gesamten Website enthält, ist die Datei main.html. Die vollständige URL für diese Seite lautet http://www.<my-website>.com/main.html .

Geben Sie im Feld Startseite einfach den Teil der URL ein, der nicht in der Konfiguration des Web-Repositorys definiert ist.

main.html

Hinweis

Ein Web-Repository kann nur einem Index zugeordnet werden. Es ist jedoch möglich, ein Web-Repository demselben Index mehrmals zuzuordnen. Dabei wird bei jeder Zuordnung eine andere Startseite angegeben.

Wenn Sie die Startseite zu einem späteren Zeitpunkt ändern, löscht das System die Zuordnung des Indexordners zum Index und legt eine neue Zuordnung an.

Scheduler

Der Scheduler definiert mindestens ein Zeitintervall, in dem der Crawler ausgeführt wird.

Hinweis

Sie richten beispielsweise zwei Zeitintervalle ein, wenn Sie den Crawler jeden Montag um 15.00 Uhr und jeden Donnerstag um 15.00 Uhr ausführen möchten.

Für Crawling-Vorgänge gilt die Uhrzeit des lokalen Servers. Die Zeitzone des Servers und die aktuelle Uhrzeit des lokalen Servers werden im iView angezeigt.

Voraussetzungen

Die zu indizierenden Dokumente befinden sich in einem Repository, das in der Konfiguration des Content Management eingerichtet wurde. Wenn Sie eine externe Website indizieren möchten, müssen Sie zunächst ein Web-Repository konfigurieren.

Zur Klassifizierung in Taxonomien wird der Application-Property-Service ( properties ) in dem Repository aktiviert, der die zu klassifizierenden Objekte enthält.

Sie haben Crawler-Parameter in der Konfiguration des Content Management ( Global Services ) konfiguriert. Weitere Informationen finden Sie unter Crawler und Crawler-Parameter .

Vorgehensweise

Sie befinden sich im iView Index-Administration iView (standardmäßig im Workset KM-Admin ).

Markieren Sie eine oder mehrere Datenquellen.

Standardmäßig ordnet das System den Datenquellen die Crawler-Parameter des Index (Dialogfenster Eigenschaften ) zu.
Wählen Sie gegebenenfalls einen weiteren Crawler.
Geben Sie gegebenenfalls eine Startseite ein (nur für Web-Repositorys).
Sichern Sie die Datenquelle.

Das System führt sofort die initiale Indizierung aus.

Danach wird der Crawler nur dann erneut ausgeführt, wenn Sie einen Zeitplan definiert haben.
Definieren Sie einen Zeitplan.

Die Drucktaste Zeitplan definieren wird erst angezeigt, nachdem Sie die Datenquelle gesichert haben.

Nachdem Sie einen Zeitplan definiert haben, gelangen Sie zum gleichen Dialogfenster, indem Sie Zeitplan ändern wählen.

Die Einstellungen für Ihren Zeitplan treten sofort in Kraft. Sie müssen die Datenquellen nicht erneut sichern.