Sélection du type de stockage

Lorsque vous créez un modèle, la journalisation des événements génère une grande quantité de colonnes temporaires. Vous pouvez indiquer si les données générées doivent être stockées dans l'espace mémoire ou sur disque.

Les deux modes disponibles sont en Mémoire ou Sur disque :

  • Mémoire signifie que les calculs seront stockés dans la mémoire interne. Ce mode est plus rapide mais son utilisation limite la quantité de données pouvant être traitées. Lorsque vous utilisez cette option, vous devez faire attention de fournir à la journalisation des événements une quantité de données traitable pour éviter tout plantage de l'application.
  • Sur disque (sélectionné par défaut) signifie que les calculs internes seront stockés dans un fichier sur le disque dur. Dans ce but, la journalisation des événements traitera les données par blocs. Étant donnée une limite de mémoire, elle calculera combien de données peuvent être stockées en mémoire, effectuera les calculs, les enregistrera sur le disque, et ainsi de suite. Ce mode est plus lent que le mode Mémoire car il nécessite un passage sur le jeu de données d'événements pour chaque bloc. Cependant, vous pouvez personnaliser cette fonctionnalité en spécifiant la taille limite de la mémoire à utiliser. Indiquez pour cela dans le fichier de configuration une valeur numérique pour le paramètre KELMemoryThreshold représentant l'espace mémoire en méga-octets que la journalisation des événements peut consommer. Si vous attribuez par exemple la valeur 1024 à KELMemoryThreshold, la journalisation des événements n'utilisera au maximum que 1024 Mo de mémoire en mode Sur disque. La valeur par défaut de ce paramètre est 512 Mo.

    Notez que cette valeur est une estimation et n'est applicable qu'à la journalisation des événements. Autrement dit, la quantité de mémoire utilisée par ce module peut être légèrement supérieure ou très inférieure à ce chiffre (si tous les calculs peuvent être stockés en mémoire par exemple). Cependant la taille globale du processus de l'application peut être supérieure à ce chiffre car d'autres fonctionnalités peuvent intervenir dans le processus d'apprentissage. L'utilisation d'une interface graphique, par exemple, consomme également de la mémoire. Ce point n'est pas pris en compte par cette option.