Native-Spark-Modellierung einstellen

Durch Spark können Modelle von Automated Analytics auf Hadoop mit besserer Performance, höherer Skalierbarkeit und fast ohne Datentransfers ausgeführt werden. Für Modelle, die Hadoop als Datenquelle verwenden, werden Berechnungen des Modelltrainings (falls möglich) automatisch an die Spark-Engine auf Hadoop delegiert.

Für die Trainingsdelegierung müssen folgende Bedingungen erfüllt sein: Wenn keine Delegierung möglich ist, oder wenn die Option deaktiviert wurde, erfolgen die Trainingsberechnungen durch die Modeling-Engine von Automated Analytics.

  • SAP Predictive Analytics Version 2.5 oder höher muss installiert sein.
  • Auf Hadoop muss eine große Datenumgebung verfügbar sein.
  • Eine Verbindung mit Hadoop mit Hive-ODBC-Treiber muss wie im Handbuch Connecting to your Database Management System beschrieben konfiguriert sein.
  • Die installierten Versionen von Hadoop (Hive und Spark) müssen mit den in der PAMAuf SAP-Site veröffentlichte Informationen aufgeführten identisch sein.
  • Die als "Spark Connectivity" bezeichneten JAR- und Verbindungsdateien, die mit der Installation von SAP Predictive Analytics bereitgestellt werden, müssen wie im Handbuch Connecting to your Database Management System beschrieben konfiguriert sein.
Hinweis

Weitere Informationen über die Einrichtung der Verbindung mit Hive und der Native-Park-Modelierung finden Sie im Konfigurationsleitfaden Connecting to your Database Management System auf dem SAP Help Portal unter http://help.sap.com/pa#section5

Einschränkung

Automated Analytics unterstützt die Native-Spark-Modelierung nur für das Training von Klassifizierungsmodellen mit Einzelziel und mit zufälliger Unterteilungsstrategie. Bei allen anderen Modelltypen und erweiterten Funktionen schaltet die Anwendung in den Standardmodellierungsprozess.

Um das Standardverhalten zu deaktivieren:

  1. Wählen Sie Anfang des Navigationspfads Datei Nächster Navigationsschritt Einstellungen Ende des Navigationspfads, oder drücken Sie die F2-Taste.
  2. Deaktivieren Sie im Bereich Delegierung des Modelltrainings die Option Wenn möglich Native-Spark-Modellierung verwenden.
  3. Wählen Sie OK, um Ihre Änderungen zu sichern.

    Bei der Bearbeitung der Einstellungen können Sie die Originaleinstellungen über die Drucktaste Zurücksetzen wiederherstellen.