La normalisation est une primitive de manipulation des données standard qui est utilisée en PMML (Predictive Model Markup Language), langage de spécification du data mining défini par le Data Mining Group (DMG). La normalisation est fréquemment appliquée aux variables numériques avant l'extraction des données. Il s'agit d'une transformation linéaire par morceau dont la variable résultante varie généralement entre 0 et 1. Elle peut être utilisée pour des transformations de rangs dans lesquelles le résultat représente la proportion approximative (percentile) de valeurs inférieures à la valeur d'entrée. Une autre possibilité consiste à convertir un champ en fonction de l'écart-type d'une valeur par rapport à la moyenne du champ. La normalisation comprend également l'indication de la valeur à utiliser quand une valeur d'entrée numérique est inconnue ou à l'extérieur du jeu de données d'entraînement.
Si deux points au moins ont été définis, le graphique correspondant s'affiche dans la section Aperçu en bas du panneau.
| Comportement | les valeurs extrêmes correspondent à ... | Courbe correspondante |
|---|---|---|
| Valeur constante | la valeur de la borne | IMAGE ICI |
| Pente | la suite vers l'infini de la droite passant par la dernière borne | IMAGE ICI |
| Défini par l'utilisateur | une valeur définie par l'utilisateur. Pour paramétrer une valeur, saisissez-la dans le champ de texte et cliquez sur le bouton d'actualisation. |
IMAGE ICI |
| Valeur nulle | la valeur nulle. Ce qui signifie que les valeurs extrêmes n'apparaissent pas sur le graphique. | IMAGE ICI |
Si le nom saisi existe déjà, un message s'affiche et le bouton OK est désactivé.