Anfang des Inhaltsbereichs

Funktionsdokumentation Zuordnen von Datenquellen  Dokument im Navigationsbaum lokalisieren

Verwendung

Sie ordnen dem Index eine oder mehrere Datenquellen zu, um den Inhalt von internen oder externen Repositorys zu indizieren.

 

Voraussetzungen

Die zu indizierenden Dokumente liegen in einem Repository, das in der Konfiguration des Content-Managements eingestellt ist. Wenn Sie eine externe Web-Site indizieren wollen, müssen Sie zunächst ein Web-Repository konfigurieren.

Für die Klassifikation in Taxonomien ist im Repository, das die zu klassifizierenden Objekte enthält, der Application-Property-Service (properties) aktiviert.

In der Konfiguration des Content Management (Globale Services) haben Sie Crawler-Parameter konfiguriert (siehe Crawler und Crawler-Parameter).

 

Funktionsumfang

Sie können einem Index eine oder mehrere Datenquellen der folgenden Typen zuordnen:

      Hierarchisches Repository

Wenn Sie nur einen Teil eines hierarchischen Repositorys indizieren wollen, können Sie im Repository navigieren und einen Ordner auswählen. Das System indiziert den Inhalt dieses Ordners einschließlich aller Unterordner.

Beachten Sie, dass ein Ordner maximal einem Index zugeordnet werden kann.

      Web-Repository

In Web-Repositorys ist keine Navigation möglich. Sie können nur ein komplettes Repository zuordnen. Sie können jedoch eine Startseite für den Crawler festlegen.

Hinweis

Der Crawler durchsucht ausschließlich Web-Sites bzw. Teile von Web-Sites, die nicht durch Robot-Anweisungen geschützt sind. Robot-Anweisungen gehören zu den Internetstandards. Sie ermöglichen es dem Betreiber einer Web-Site, das Crawlen seiner Site oder einzelner Teile davon zuzulassen oder zu verbieten.

 

Crawler-Parameter

Es hängt vom Typ des Repositorys ab, ob das Einstellen eines Crawlers und Zeitplans erforderlich ist:

      Für Web-Repositorys wird der Index mit Hilfe eines Crawlers aktualisiert. Wenn Sie ein Web-Repository erstmalig einem Index zuordnen, wird es sofort indiziert. Anschließend ist das regelmäßige Einplanen eines Crawlers erforderlich, damit der Index aktualisiert wird. 

      Für hierarchische Repositorys wird der Index über Events aktualisiert. Das regelmäßige Starten eines Crawlers ist daher nicht zwingend erforderlich. Sie können dennoch einen Crawler regelmäßig starten, um Änderungen im Index zu erfassen, für die keine Events ausgelöst wurden. Das kann beispielsweise der Fall sein, wenn Dokumente direkt auf dem Dateisystem unter Umgehung des Knowledge Managements angelegt, geändert oder gelöscht wurden.

 

Startseite (nur Web-Repositorys)

Die Startseite ist die Seite, bei der der Crawler mit dem Crawling-Vorgang beginnt. Sie können den Namen einer HTML-Seite oder einen kompletten Pfad angeben. Die Zeichenkette, die Sie im Feld Start Page angeben, wird an die URL angehängt, die in der Konfiguration des Web-Repositorys definiert ist.

Beispiel

Beispiel:

In der Konfiguration eines Web-Repositorys ist eine URL definiert:

http://www.<my-website>.com/

Die Einstiegsseite dieser Site, die Links für die Navigation in der gesamten Site bereitstellt, ist die Datei main.html. Die vollständige URL dieser Seite ist http://www.<my-website>.com/main.html.

Im Feld Start Page geben Sie lediglich den Teil der URL an, der nicht in der Konfiguration des Web-Repositorys definiert ist:

main.html

Hinweis

Ein Web-Repository kann nur einem einzigen Index zugeordnet werden. Es ist jedoch möglich, ein Web-Repository mehrfach dem gleichen Index zuzuordnen und verschiedene Startseiten anzugeben.

Wenn Sie die Startseite nachträglich ändern, löscht das System die Zuordnung des Index-Ordners zum Index und legt eine neue Zuordnung an.

 

Zeitplan

Der Zeitplan legt ein oder mehrere Zeitintervalle fest, in denen der Crawler gestartet wird.

Hinweis

Beispielsweise legen Sie zwei Zeitintervalle an, wenn Sie den Crawler wöchentlich, montags um 3:00 Uhr und wöchentlich, donnerstags um 3:00 Uhr starten wollen.

Beachten Sie, dass das Crawling zur lokalen Serverzeit durchgeführt wird. Die Zeitzone des Servers und die aktuelle lokale Serverzeit werden im iView angezeigt.

 

Aktivitäten

Sie befinden sich im iView Index-Administration(standardmäßig im Workset KM-Admin).

...

       1.      Wählen Sie eine oder mehrere Datenquellen aus.

Standardmäßig ordnet das System den Datenquellen die Crawler-Parameter des Indizes (Eigenschaften-Dialogfenster) zu.

       2.      Wählen Sie gegebenenfalls einen anderen Crawler aus.

       3.      Geben Sie gegebenenfalls eine Startseite an (nur bei Web-Repositorys).

       4.      Sichern Sie die Datenquellen.

Das System startet sofort die erste Indizierung.

Danach wird der Crawler nur noch gestartet, wenn Sie einen Zeitplan definieren.

       5.      Definieren Sie einen Zeitplan.

Die Drucktaste Zeitplan definieren wird erst angezeigt, nachdem Sie die Datenquellen gesichert haben.

Nachdem Sie einen Zeitplan definiert haben, gelangen Sie auf das gleiche Dialogfenster, indem Sie auf die Drucktaste Zeitplan ändern klicken.

Die Einstellungen für den Zeitplan werden sofort wirksam. Ein nochmaliges Sichern der Datenquellen ist nicht notwendig.

 

 

 

Ende des Inhaltsbereichs