En fonction de votre sélection dans la liste Générer, les données générées contiendront (en plus de toutes les variables clés) les éléments ci-dessous :
| Si vous choisissez l'option... | les données générées contiendront dans chaque ligne... |
|---|---|
| Valeur prédite | Uniquement la valeur prédite des observations (rr_TargetVariableName) |
| Probabilité |
|
| Contributions individuelles |
|
| Décision |
En sélectionnant l'option Décision dans la liste déroulante Générer, vous pouvez spécifier le nombre d'observations que le modèle doit détecter après l'application du nouveau jeu de données. |
| Paramètres avancés | Cette option vous permet de sélectionner les données de sortie qui figureront dans le fichier de résultats. |
| Utiliser l'application directe dans la base de données | Lorsque cette option est cochée, le mode optimisé Application in-database sera utilisé et les données seront générées directement dans la base de données. |
| Ajouter un écart de score | Cette option vous permet de vérifier, pour chaque variable et chaque catégorie de variable, les écarts entre le modèle et le jeu de données d'entrée utilisé pour l'application du modèle. |
Mode Application in-database
Ce mode optimisé permet d'appliquer le modèle directement dans la base de données. Cela évite d'avoir à extraire les données de la base de données et accélère le processus d'écriture des données de sortie du modèle. Ce mode peut être utilisé si toutes les conditions suivantes sont remplies :
Lorsque vous cochez l'option Utiliser l'application directe dans la base de données, l'option Ajouter les scores d'écart est automatiquement cochée.
| Si vous choisissez l'option... | les données générées contiendront dans chaque ligne... |
|---|---|
| Valeur prédite |
|
| Codage disjonctif des numéros de clusters |
le codage disjonctif des numéros de clusters, c'est-à-dire que pour chaque cluster une variable booléenne indiquant si l'observation appartient à ce cluster (valeur 1) ou non (valeur 0) est créée. |
| Codage disjonctif et recopie des var. explicatives |
le codage disjonctif des numéros de clusters (voir ci-dessus) c'est-à-dire que pour chaque cluster une variable booléenne indiquant si l'observation appartient à ce cluster (valeur 1) ou non (valeur 0) est créée.
|
| Moyenne de la cible pour les clusters |
|
| Si vous choisissez l'option... | les données générées contiendront dans chaque ligne... |
|---|---|
| Codage vectoriel | Toutes les colonnes présentes dans le jeu de données d'origine. Et pour chaque champ textuel :
|
| Reconnaissance de la langue | Pour chaque champ textuel :
|
| Mode transactionnel |
Ce mode transforme chaque enregistrement en une série de transactions, créant ainsi un jeu de données utilisable dans l'analyseur de séquences. |
| Générer seulement les racines | Pour chaque champ textuel :
|
Options de génération
| Si vous choisissez l'option... | les données générées contiendront dans chaque nœud... |
|---|---|
| Mode par défaut |
|
| Mode cercle |
|
| Mode centralité |
|
| Mode voisinage |
|
| Mode description |
|
| Mode communauté |
|
| Mode appariement |
|
| Paramètres avancés |
|
Note sur le jeu de données d'application
Pour pouvoir appliquer un modèle social sur un jeu de données, celui-ci doit contenir les variables suivantes :
la variable kxComIndex contenant les identifiants de communautés. Il doit s'agir d'un entier nominal.
Cette variable vous permet d'appliquer le modèle sur les graphes de communautés (détection des communautés voisines, liste des nœuds d'une communauté, statistiques agrégées, ...) Vous pouvez utiliser cette colonne pour fournir une liste d'identifiants de communautés pour lesquelles vous souhaitez effectuer des calculs. Si vous n'appliquez pas le modèle sur un graphe de communauté, cette variable ne sera pas utilisée, vous pouvez donc laissez cette colonne vide ou, dans le cas d'une base de données, utiliser une valeur factice.
Utilisez la fonctionnalité de correspondance disponible dans le panneau Appliquer le modèle pour garantir la cohérence des jeux de données.
Mode Application in-database
Ce mode optimisé permet d'appliquer le modèle directement dans la base de données. Cela évite d'avoir à extraire les données de la base de données et accélère le processus d'écriture des données de sortie du modèle. Ce mode peut être utilisé si toutes les conditions suivantes sont remplies :
Si le modèle n'a pas été enregistré, un avertissement est affiché et Automated Analytics passe automatiquement au processus d'application standard.
| Si vous choisissez l'option... | les données générées contiendront dans chaque ligne... |
|---|---|
| Valeur prédite | les données de sortie simplifiées :
|
| Conséquents optimisés par KI | les données de sortie simplifiées Si plusieurs règles indiquent le même conséquent pour une session, la règle présentant la meilleure capacité prédictive (KI) sera sélectionnée. |
| Conséquents optimisés par confiance | les données de sortie simplifiées Si plus d'une règle indiquent le même conséquent pour une session, la règle pour laquelle l'indice de confiance est le plus élevé sera sélectionnée. |
| Valeur prédite avec description complète des règles | les données de sortie complètes
|
| Conséquents optimisés par KI avec description complète des règles | les données de sortie complètes Si plusieurs règles indiquent le même conséquent pour une session, la règle présentant la meilleure capacité prédictive (KI) sera sélectionnée. |
| Conséquents optimisés par confiance avec description complète des règles | les données de sortie complètes Si plus d'une règle indiquent le même conséquent pour une session, la règle pour laquelle l'indice de confiance est le plus élevé sera sélectionnée. |
| Si vous sélectionnez l'option... | Le fichier de résultat contiendra... |
|---|---|
| Valeur prédite |
|
| les prévisions avec leurs composantes |
|
| les prévisions avec leurs composantes et leurs résidus |
|
| uniquement la première colonne des prévisions avec leurs intervalles de prédiction |
|