Teilstichprobe

Im Trainingsdatenset können für alle Unterteilungsstrategien außer Benutzerdefiniert Teilstichproben vorgenommen werden. Wählen Sie die Drucktaste (Erweiterte Einstellungen), um das Bild Teilstichprobe anzuzeigen.

Teilstichproben können folgendermaßen vorgenommen werden:

  • Wählen Sie eine bestimmte erste Zeile und letzte Zeile aus den Originaldaten aus.
  • Wählen Sie einen beliebigen Teil der Originaldaten aus. Um bei der Teilstichprobe dieselben Datensätze aus den Originaldaten auszuwählen, können Sie einen beliebigen Initialwert verwenden.
  • Verwenden Sie die Zeilenauswahl und die zufällige Teilstichprobe gleichzeitig.
  • Zufällige Teilstichprobe einrichten
    1. Markieren Sie die Option Zufallsauswahl.
    2. Verwenden Sie im Abschnitt Zufallsauswahl den Schieberegler Anteil, um den Prozentsatz des Originaldatensets auszuwählen, den Sie behalten möchten.
    3. Geben Sie im Feld Zufallsauswahl einen Initialwert für die Teilstichprobe ein. Als Inititalwert ist standardmäßig 1960 eingestellt.
    4. Verwenden Sie auf dem Schieberegler Anteil den Cursor, um den Anteil der Beobachtung auszuwählen, den Sie im Datenset haben möchten. Durch die Zufallsauswahl wird anhand des Initialwerts für jede Zeile im Datenset ein Zufallsindex generiert, d. h. gleicher Initialwert – gleicher Index.

      Sie können die Auswahl detaillieren, indem Sie das Ankreuzfeld Erweitert markieren. Der Schieberegler wird durch zwei Felder ersetzt, in denen Sie den Indexbereich festlegen können, den Sie beibehalten möchten. Wenn Sie beispielsweise [0, 20 %] auswählen, wählen Sie die Zeilen mit einem Index zwischen 0 und 0,2; [0, 20 %] steht also nicht für dieselben Zeilen wie [80 %, 100 %] (Indizes zwischen 0,8 und 1). Wenn Sie also für 80 % Ihres Datensets lernen und für die restlichen 20 % anwenden möchten und eine zufällige Teilstichprobe vornehmen, ist das die einzig mögliche Vorgehensweise. Sie können somit zwei komplementäre Datensets anlegen, indem Sie dieselben Mauszeiger- und Initialwerteinstellungen beibehalten und zwei komplementäre Bereiche auswählen.

  • Zeilenauswahl einrichten
    1. Markieren Sie die Option Zeilenauswahl.
    2. Geben Sie im Feld Erste Zeile die Nummer der Zeile ein, an der die Teilstichprobe des Datensets beginnen soll.
    3. Geben Sie im Feld Letzte Zeile die Nummer der Zeile ein, an der die Teilstichprobe des Datensets enden soll.
    4. Nachdem die Teilstichprobe spezifiziert wurde, wählen Sie OK, um die Einstellungen zu sichern und das Fenster Einstellungen zu schließen.