Utilisez ce panneau pour créer ou modifier une population estampillée.
Définition
Une population estampillée est une liste de paires <identifiers; time stamps> : la signification sémantique d'une telle construction peut être associée aux instantanés des entités et à un moment donné. De manière générale, une entité donnée peut figurer dans une même population estampillée à des moments différents.
Création ou modification d'une population estampillée
- Pour créer ou modifier une population estampillée
- Dans le champ Nom, saisissez le nom de la nouvelle population estampillée.
- Dans le champ Description, saisissez une description.
- Paramètres
- Dans la liste déroulante Basée sur l'entité, sélectionnez l'entité sur laquelle sera construite la population estampillée.
- Facultatif : pour filtrer la population estampillée de façon à supprimer certaines lignes en fonction d'une condition spécifique, cliquez sur le bouton Modifier les filtres. L'existence d'un filtre est indiquée comme ci-dessous :
: aucun filtre n'a été défini
: un filtre existe déjà
- Dans la section Horodatage, sélectionnez la date à utiliser pour la population estampillée. Il peut s'agir d'un champ (calculé ou non), d'une constante ou d'une invite.
Cliquez sur Modifier le stockage de KxTimeStamp pour sélectionner le stockage de votre choix.
Sélectionnez Date si vous souhaitez que le format de stockage soit AAAA-MM-JJ.
Sélectionnez Date avec horaire si vous souhaitez que le format de stockage soit AAAA-MM-JJ HH:MM:SS.
- Cliquez OK pour valider.
- Cible
- Dans la liste Cible, sélectionnez la cible que vous souhaitez utiliser. Si vous ne souhaitez pas utiliser une cible, sélectionnez Ne pas définir de cible pour l'instant et accédez directement à la section Pour valider la création ou la modification d'une population estampillée.
- Si vous avez sélectionné une cible et que vous souhaitez accélérer le processus d'entraînement, vous pouvez cocher la case Activer l'échantillonnage stratifié. Lors de l'activation de l'échantillonnage stratifié, le nombre de lignes dans le jeu de données est réduit mais la quantité d'information est conservée. Cela peut s'avérer utile lorsqu'il y a peu de cas positifs à modéliser. Par exemple, si un jeu de données contient 1 000 cas positifs et 1 000 000 cas négatifs, l'activation de l'échantillonnage stratifié entraîne la conservation des 1 000 cas positifs et l'échantillonnage des cas négatifs. Dans cet exemple, si nous conservons 1 cas négatif sur 10, le jeu de données contiendra 1 000 cas positifs et 100 000 cas négatifs : la proportion de cible est de 1 % alors qu'elle était de 0,01 % dans le jeu de données d'origine. Comme le jeu de données est environ dix fois plus petit, l'entraînement sera beaucoup plus rapide.
- Cochez la case Activer les poids pour générer une colonne de poids permettant d’associer chaque cas négatif avec un poids. Dans l'exemple ci-dessus, vous définissez le poids sur 10. Comme un poids de dix représente approximativement dix cas négatifs, cela permet de conserver des statistiques qui représentent la population initiale sans échantillonnage et donc d’avoir des mesures de la moyenne, des effectifs pondérés et de la capacité prédictive (KI).
- Cliquez sur le bouton Définir les proportions initiales pour extraire ou définir manuellement les catégories.
- Pour valider la création ou la modification d'une population estampillée
- Cliquez sur le bouton Suivant pour valider la création ou la modification de la population estampillée.
- Si une population estampillée portant le même nom existe déjà, une boîte de dialogue vous demande de préciser le comportement à adopter :
- Cliquez sur Oui pour enregistrer la population estampillée avec un nouveau numéro de version.
- Cliquer sur Non si vous voulez écraser la population estampillée existante.