Nouvelle normalisation

La normalisation est une primitive de manipulation des données standard qui est utilisée en PMML (Predictive Model Markup Language), langage de spécification du data mining défini par le Data Mining Group (DMG). La normalisation est fréquemment appliquée aux variables numériques avant l'extraction des données. Il s'agit d'une transformation linéaire par morceau dont la variable résultante varie généralement entre 0 et 1. Elle peut être utilisée pour des transformations de rangs dans lesquelles le résultat représente la proportion approximative (percentile) de valeurs inférieures à la valeur d'entrée. Une autre possibilité consiste à convertir un champ en fonction de l'écart-type d'une valeur par rapport à la moyenne du champ. La normalisation comprend également l'indication de la valeur à utiliser quand une valeur d'entrée numérique est inconnue ou à l'extérieur du jeu de données d'entraînement.

  • Pour créer une normalisation
    1. Sélectionnez un champ dans la liste déroulante Choisissez un champ à normaliser. Seuls les champs de type entier ou réel sont affichés.
    2. Pour chaque point à ajouter à la normalisation :
      1. saisissez sa valeur dans le champ Entrée de la section Ajoutez des point à la normalisation,
      2. Saisissez la valeur de sortie correspondante dans le champ Sortie.
      3. Cliquez sur le bouton + pour ajouter le point défini à la normalisation. Le point s'affiche dans la liste.

        Si deux points au moins ont été définis, le graphique correspondant s'affiche dans la section Aperçu en bas du panneau.

    3. Dans la liste Valeurs minimales de la section Définir le comportement aux limites, sélectionnez le comportement à appliquer aux valeurs inférieures au point le plus bas défini. Les valeurs disponibles sont détaillées dans le tableau ci-dessous.
      Comportement les valeurs extrêmes correspondent à ... Courbe correspondante
      Valeur constante la valeur de la borne IMAGE ICI
      Pente la suite vers l'infini de la droite passant par la dernière borne IMAGE ICI
      Défini par l'utilisateur

      une valeur définie par l'utilisateur.

      Pour paramétrer une valeur, saisissez-la dans le champ de texte et cliquez sur le bouton d'actualisation.

      IMAGE ICI
      Valeur nulle la valeur nulle. Ce qui signifie que les valeurs extrêmes n'apparaissent pas sur le graphique. IMAGE ICI
    4. Cliquez sur le bouton Suivant. La fenêtre Entrez le nom du champ calculé s'affiche.
    5. Saisissez le nom du nouveau champ dans le champ Nom.
      Remarque

      Si le nom saisi existe déjà, un message s'affiche et le bouton OK est désactivé.

    6. Cliquez sur le bouton OK. La liste Champs est affichée avec le nouveau champ.