Configuration de la modélisation native Spark

Grâce à Spark, les modèles Automated Analytics peuvent s'exécuter sous Hadoop avec de meilleures performances, une plus grande évolutivité et pratiquement aucun transfert de données. Pour les modèles utilisant Hadoop en tant que source de données, les calculs d'entraînement des modèles par défaut sont délégués au moteur Spark sous Hadoop (lorsque cela est possible).

Les conditions décrites ci-dessous doivent être remplies pour que la délégation d'entraînement puisse avoir lieu. Si la délégation n'est pas possible ou si l'option n'est pas désélectionnée, le moteur de modélisation Automated Analytics effectue les calculs d'entraînement.

  • Vous devez installer SAP Predictive Analytics 2.5 ou une version plus récente.
  • Un environnement Big data doit être disponible sur Hadoop.
  • Une connexion à Hadoop utilisant les pilotes ODBC Hive doit être configurée selon ce qu'indiquent les guides Connecting to your Database Management System.
  • Dans les versions installées de la distribution Hadoop, Hive et Spark doivent être identiques à ceux mentionnés dans le PAM.Informations disponibles sur le site SAP
  • Les fichiers jar et de connexion "Spark Connectivity" fournis avec l'installation de SAP Predictive Analytics doivent être correctement configurés, tel qu'indiqué dans les guides Connecting to your Database Management System
Remarque

Pour en savoir plus sur la configuration de la connexion à Hive et la modélisation native Spark, voir les guides de configuration Connecting to your Database Management System sur le SAP Help Portal à l'adresse : http://help.sap.com/pa#section5

Restriction

Automated Analytics prend uniquement en charge la modélisation native Spark pour les modèles de classement d'entraînement avec cible unique et stratégie de découpage aléatoire. Pour tous les autres types de modèles et les fonctionnalités avancées, l'application bascule au processus de modélisation standard.

Pour désélectionner le comportement par défaut :

  1. Sélectionnez Début du chemin de navigation Fichier Étape de navigation suivante Préférences Fin du chemin de navigation, ou appuyez sur la touche F2.
  2. Dans le panneau Délégation de l'entrainement, désélectionnez Utiliser modélisation native Spark si possible.
  3. Cliquez sur OK pour enregistrer vos modifications.

    Lors de la modification des préférences, il est possible de restaurer les paramètres d'origine en cliquant sur le bouton Réinitialiser.