示例

可为示例准备部件进行配置的属性。

语法 使用此部件可从大型数据集中选择数据的子集。
示例部件支持以下示例类型:
  • 前 N:选择数据集中前 N 个记录。
  • 后 N:选择数据集中后 N 个记录。
  • 每 N 个:选择数据集中的每 N个记录(N 表示间隔)。例如,如果 N=2,则选择第 2、4、6、8 个记录,以此类推。
  • 简单随机:随机选择数据集中大小为 N 或百分之 N 的记录。
  • 系统性随机:在此示例类型中,示例间隔或存储桶根据存储桶的大小而创建。示例部件从第一个存储桶中随机选择第 N 个记录,然后从每个后续存储桶中选择第 N 个记录。
示例属性
表 1: 数据准备部件属性
属性 说明
示例类型 选择示例的类型。
限制行的依据 选择用于限制行的方法。
行数 输入要选择的行数。
行的百分比 输入要选择的行的百分比。
存储桶大小 输入在其中要选择随机行的存储桶大小。
步长 输入要选择的行之间的间隔。
最大行数 输入要选择的最大行数。

从给定的数据集中选择数据的子集
员工 ID 员工姓名 出生日期 年龄
1 Laura 11/11/1986 25
2 Desy 12/5/1981 30
3 Alex 30/5/1978 33
4 John 6/6/1979 32
5 Ted 4/7/1987 24
6 Tom 30/6/1970 41
7 Anna 24/6/1965 46
8 Valerie 6/7/1990 21
9 Mary 19/9/1985 26
10 Martin 21/11/1986 25
示例输出:
  1. 前 N:N=5
    员工 ID 员工姓名 出生日期 年龄
    1 Laura 11/11/1986 25
    2 Desy 12/5/1981 30
    3 Alex 30/5/1978 33
    4 John 6/6/1979 32
    5 Ted 4/7/1987 24
  2. 后 N:N=4
    员工 ID 员工姓名 出生日期 年龄
    7 Anna 24/6/1965 46
    8 Valerie 6/7/1990 21
    9 Mary 19/9/1985 26
    10 Martin 21/11/1986 25
  3. 每 N 个:间隔=3
    员工 ID 员工姓名 出生日期 年龄
    3 Alex 30/5/1978 33
    6 Tom 30/6/1970 41
    9 Mary 19/9/1985 26
  4. 简单随机:行数=2

    结果可以是任意两行。

    员工 ID 员工姓名 出生日期 年龄
    7 Anna 24/6/1965 46
    8 Valerie 6/7/1990 21
  5. 系统性随机:存储桶大小=4
    员工 ID 员工姓名 出生日期 年龄
    2 Desy 12/5/1981 30
    6 Tom 30/6/1970 41
    10 Martin 21/11/1986 25

    员工 ID 员工姓名 出生日期 年龄
    1 Laura 11/11/1986 25
    5 Ted 4/7/1987 24
    9 Mary 19/9/1985 26