示例
可为示例准备部件进行配置的属性。
语法 使用此部件可从大型数据集中选择数据的子集。
示例部件支持以下示例类型:
- 前 N:选择数据集中前 N 个记录。
- 后 N:选择数据集中后 N 个记录。
- 每 N 个:选择数据集中的每 N个记录(N 表示间隔)。例如,如果 N=2,则选择第 2、4、6、8 个记录,以此类推。
- 简单随机:随机选择数据集中大小为 N 或百分之 N 的记录。
- 系统性随机:在此示例类型中,示例间隔或存储桶根据存储桶的大小而创建。示例部件从第一个存储桶中随机选择第 N 个记录,然后从每个后续存储桶中选择第 N 个记录。
示例属性
表 1: 数据准备部件属性
| 属性 |
说明 |
| 示例类型 |
选择示例的类型。 |
| 限制行的依据 |
选择用于限制行的方法。 |
| 行数 |
输入要选择的行数。 |
| 行的百分比 |
输入要选择的行的百分比。 |
| 存储桶大小 |
输入在其中要选择随机行的存储桶大小。 |
| 步长 |
输入要选择的行之间的间隔。 |
| 最大行数 |
输入要选择的最大行数。 |
从给定的数据集中选择数据的子集
| 员工 ID |
员工姓名 |
出生日期 |
年龄 |
| 1 |
Laura |
11/11/1986 |
25 |
| 2 |
Desy |
12/5/1981 |
30 |
| 3 |
Alex |
30/5/1978 |
33 |
| 4 |
John |
6/6/1979 |
32 |
| 5 |
Ted |
4/7/1987 |
24 |
| 6 |
Tom |
30/6/1970 |
41 |
| 7 |
Anna |
24/6/1965 |
46 |
| 8 |
Valerie |
6/7/1990 |
21 |
| 9 |
Mary |
19/9/1985 |
26 |
| 10 |
Martin |
21/11/1986 |
25 |
示例输出:
- 前 N:N=5
| 员工 ID |
员工姓名 |
出生日期 |
年龄 |
| 1 |
Laura |
11/11/1986 |
25 |
| 2 |
Desy |
12/5/1981 |
30 |
| 3 |
Alex |
30/5/1978 |
33 |
| 4 |
John |
6/6/1979 |
32 |
| 5 |
Ted |
4/7/1987 |
24 |
- 后 N:N=4
| 员工 ID |
员工姓名 |
出生日期 |
年龄 |
| 7 |
Anna |
24/6/1965 |
46 |
| 8 |
Valerie |
6/7/1990 |
21 |
| 9 |
Mary |
19/9/1985 |
26 |
| 10 |
Martin |
21/11/1986 |
25 |
- 每 N 个:间隔=3
| 员工 ID |
员工姓名 |
出生日期 |
年龄 |
| 3 |
Alex |
30/5/1978 |
33 |
| 6 |
Tom |
30/6/1970 |
41 |
| 9 |
Mary |
19/9/1985 |
26 |
- 简单随机:行数=2
结果可以是任意两行。
| 员工 ID |
员工姓名 |
出生日期 |
年龄 |
| 7 |
Anna |
24/6/1965 |
46 |
| 8 |
Valerie |
6/7/1990 |
21 |
- 系统性随机:存储桶大小=4
| 员工 ID |
员工姓名 |
出生日期 |
年龄 |
| 2 |
Desy |
12/5/1981 |
30 |
| 6 |
Tom |
30/6/1970 |
41 |
| 10 |
Martin |
21/11/1986 |
25 |
或
| 员工 ID |
员工姓名 |
出生日期 |
年龄 |
| 1 |
Laura |
11/11/1986 |
25 |
| 5 |
Ted |
4/7/1987 |
24 |
| 9 |
Mary |
19/9/1985 |
26 |