Свойства, которые можно настроить для компонента подготовки выборки.
Синтаксис Этот компонент применяется для выбора подмножества данных из крупных наборов.
Поддерживаются следующие типы выборок:
- Первые N: выбор первых N записей в наборе данных.
- Последние N: выбор последних N записей в наборе данных.
- Каждые N: выбор каждой N-ой записи в наборе данных (N – интервал). Например, при N=2 будут выбраны 2-я, 4-я, 6-я, 8-я и последующие четные записи.
- Простая случайная выборка: случайная выборка записей (N – размер выборки или процентная доля записей в наборе данных).
- Систематическая случайная выборка: выборка на основе заданного интервала или размера сегмента. При таком подходе случайным образом выбирается N-я запись из первого и каждого последующего сегмента.
Свойства компонента "Выборка"
Таблица 1: Свойства компонента подготовки данных
| Свойство |
Описание |
| Тип выборки |
Укажите тип выборки. |
| Критерий ограничения строк |
Выберите метод ограничения строк. |
| Число строк |
Введите число строк, которые требуется выбрать. |
| Доля строк в процентах |
Введите процент строк, которые требуется выбрать. |
| Размер сегмента |
Введите размер сегмента, в котором требуется выбрать случайную строку. |
| Размер шага |
Введите интервал строк, которые требуется выбрать. |
| Максимальное число строк |
Введите максимальное число строк, которые требуется выбрать. |
Выбор подмножества набора данных
| Ид. сотрудника |
Имя сотрудника |
Дата рождения |
Возраст |
| 1 |
Лора |
11.11.1986 |
25 |
| 2 |
Дейзи |
12.05.1981 |
30 |
| 3 |
Алекс |
30.05.1978 |
33 |
| 4 |
Джон |
06.06.1979 |
32 |
| 5 |
Тед |
04.07.1987 |
24 |
| 6 |
Том |
30.06.1970 |
41 |
| 7 |
Анна |
24.06.1965 |
46 |
| 8 |
Вэлери |
06.07.1990 |
21 |
| 9 |
Мэри |
19.09.1985 |
26 |
| 10 |
Мартин |
21.11.1986 |
25 |
Выходные данные выборки:
- Первые N: для N=5
| Ид. сотрудника |
Имя сотрудника |
Дата рождения |
Возраст |
| 1 |
Лора |
11.11.1986 |
25 |
| 2 |
Дейзи |
12.05.1981 |
30 |
| 3 |
Алекс |
30.05.1978 |
33 |
| 4 |
Джон |
06.06.1979 |
32 |
| 5 |
Тед |
04.07.1987 |
24 |
- Последние N: для N=4
| Ид. сотрудника |
Имя сотрудника |
Дата рождения |
Возраст |
| 7 |
Анна |
24.06.1965 |
46 |
| 8 |
Вэлери |
06.07.1990 |
21 |
| 9 |
Мэри |
19.09.1985 |
26 |
| 10 |
Мартин |
21.11.1986 |
25 |
- Каждые N: Интервал=3
| Ид. сотрудника |
Имя сотрудника |
Дата рождения |
Возраст |
| 3 |
Алекс |
30.05.1978 |
33 |
| 6 |
Том |
30.06.1970 |
41 |
| 9 |
Мэри |
19.09.1985 |
26 |
- Простая случайная выборка: для количества строк=2
В результатах могут возвращаться любые две строки.
| Ид. сотрудника |
Имя сотрудника |
Дата рождения |
Возраст |
| 7 |
Анна |
24.06.1965 |
46 |
| 8 |
Вэлери |
06.07.1990 |
21 |
- Систематическая случайная выборка: размер сегмента=4
| Ид. сотрудника |
Имя сотрудника |
Дата рождения |
Возраст |
| 2 |
Дейзи |
12.05.1981 |
30 |
| 6 |
Том |
30.06.1970 |
41 |
| 10 |
Мартин |
21.11.1986 |
25 |
или
| Ид. сотрудника |
Имя сотрудника |
Дата рождения |
Возраст |
| 1 |
Лора |
11.11.1986 |
25 |
| 5 |
Тед |
04.07.1987 |
24 |
| 9 |
Мэри |
19.09.1985 |
26 |