Выборка

Свойства, которые можно настроить для компонента подготовки выборки.

Синтаксис Этот компонент применяется для выбора подмножества данных из крупных наборов.
Поддерживаются следующие типы выборок:
  • Первые N: выбор первых N записей в наборе данных.
  • Последние N: выбор последних N записей в наборе данных.
  • Каждые N: выбор каждой N-ой записи в наборе данных (N – интервал). Например, при N=2 будут выбраны 2-я, 4-я, 6-я, 8-я и последующие четные записи.
  • Простая случайная выборка: случайная выборка записей (N – размер выборки или процентная доля записей в наборе данных).
  • Систематическая случайная выборка: выборка на основе заданного интервала или размера сегмента. При таком подходе случайным образом выбирается N-я запись из первого и каждого последующего сегмента.
Свойства компонента "Выборка"
Таблица 1: Свойства компонента подготовки данных
Свойство Описание
Тип выборки Укажите тип выборки.
Критерий ограничения строк Выберите метод ограничения строк.
Число строк Введите число строк, которые требуется выбрать.
Доля строк в процентах Введите процент строк, которые требуется выбрать.
Размер сегмента Введите размер сегмента, в котором требуется выбрать случайную строку.
Размер шага Введите интервал строк, которые требуется выбрать.
Максимальное число строк Введите максимальное число строк, которые требуется выбрать.

Выбор подмножества набора данных
Ид. сотрудника Имя сотрудника Дата рождения Возраст
1 Лора 11.11.1986 25
2 Дейзи 12.05.1981 30
3 Алекс 30.05.1978 33
4 Джон 06.06.1979 32
5 Тед 04.07.1987 24
6 Том 30.06.1970 41
7 Анна 24.06.1965 46
8 Вэлери 06.07.1990 21
9 Мэри 19.09.1985 26
10 Мартин 21.11.1986 25
Выходные данные выборки:
  1. Первые N: для N=5
    Ид. сотрудника Имя сотрудника Дата рождения Возраст
    1 Лора 11.11.1986 25
    2 Дейзи 12.05.1981 30
    3 Алекс 30.05.1978 33
    4 Джон 06.06.1979 32
    5 Тед 04.07.1987 24
  2. Последние N: для N=4
    Ид. сотрудника Имя сотрудника Дата рождения Возраст
    7 Анна 24.06.1965 46
    8 Вэлери 06.07.1990 21
    9 Мэри 19.09.1985 26
    10 Мартин 21.11.1986 25
  3. Каждые N: Интервал=3
    Ид. сотрудника Имя сотрудника Дата рождения Возраст
    3 Алекс 30.05.1978 33
    6 Том 30.06.1970 41
    9 Мэри 19.09.1985 26
  4. Простая случайная выборка: для количества строк=2

    В результатах могут возвращаться любые две строки.

    Ид. сотрудника Имя сотрудника Дата рождения Возраст
    7 Анна 24.06.1965 46
    8 Вэлери 06.07.1990 21
  5. Систематическая случайная выборка: размер сегмента=4
    Ид. сотрудника Имя сотрудника Дата рождения Возраст
    2 Дейзи 12.05.1981 30
    6 Том 30.06.1970 41
    10 Мартин 21.11.1986 25

    или

    Ид. сотрудника Имя сотрудника Дата рождения Возраст
    1 Лора 11.11.1986 25
    5 Тед 04.07.1987 24
    9 Мэри 19.09.1985 26