Propiedades que se pueden configurar para el componente de preparación de muestras.
Sintaxis Utilice este componente para seleccionar un subconjunto de datos de conjuntos de datos mayores.
El componente Muestra es compatible con los siguientes tipos de muestra:
- Primeros N: selecciona los primeros registros N del conjunto de datos.
- Últimos N: selecciona los últimos registros N del conjunto de datos.
- Cada N: Selecciona cada registro N del conjunto de datos, donde N es un intervalo. Por ejemplo, si N=2, se seleccionarán los registros 2, 4, 6, 8, etc.
- Aleatorización simple: selecciona registros aleatoriamente del tamaño N o un porcentaje de N de los registros de un conjunto de datos.
- Aleatorización sistemática: en este tipo de muestra, se crean intervalos simples o depósitos según el tamaño del depósito. El componente Muestra selecciona un registro N aleatoriamente del primer depósito y de cada depósito posterior.
Propiedades de muestra
Tabla 1: Propiedades del componente de preparación de datos
| Propiedad
|
Descripción
|
| Tipo de muestra
|
Seleccione el tipo de muestreo.
|
| Limitar filas por
|
Seleccione el método para limitar las filas.
|
| Número de filas
|
Introduzca el número de filas que desee seleccionar.
|
| Porcentaje de filas
|
Introduzca el porcentaje de filas que desee seleccionar.
|
| Tamaño del depósito
|
Introduzca el tamaño del depósito en el que desee seleccionar una fila aleatoria.
|
| Tamaño de paso
|
Introduzca el intervalo entre las filas que desee seleccionar.
|
| Filas máximas
|
Introduzca el número máximo de filas que desee seleccionar.
|
Seleccionar un subconjunto de datos de un conjunto de datos determinado
| ID del empleado |
Nombre del empleado |
Fecha de nacimiento |
Edad |
| 1 |
Laura |
11/11/1986 |
25 |
| 2 |
Desi |
12/5/1981 |
30 |
| 3 |
Álex |
30/5/1978 |
33 |
| 4 |
Juan |
6/6/1979 |
32 |
| 5 |
Tomás |
4/7/1987 |
24 |
| 6 |
Tobías |
30/6/1970 |
41 |
| 7 |
Anna |
24/6/1965 |
46 |
| 8 |
Valeria |
6/7/1990 |
21 |
| 9 |
María |
19/9/1985 |
26 |
| 10 |
Martín |
21/11/1986 |
25 |
Salida de muestras:
- Primeros N: donde N=5
| ID del empleado |
Nombre del empleado |
Fecha de nacimiento |
Edad |
| 1 |
Laura |
11/11/1986 |
25 |
| 2 |
Desi |
12/5/1981 |
30 |
| 3 |
Álex |
30/5/1978 |
33 |
| 4 |
Juan |
6/6/1979 |
32 |
| 5 |
Tomás |
4/7/1987 |
24 |
- Últimos N: donde N=4
| ID del empleado |
Nombre del empleado |
Fecha de nacimiento |
Edad |
| 7 |
Anna |
24/6/1965 |
46 |
| 8 |
Valeria |
6/7/1990 |
21 |
| 9 |
María |
19/9/1985 |
26 |
| 10 |
Martín |
21/11/1986 |
25 |
- Cada N: Intervalo=3
| ID del empleado |
Nombre del empleado |
Fecha de nacimiento |
Edad |
| 3 |
Álex |
30/5/1978 |
33 |
| 6 |
Tobías |
30/6/1970 |
41 |
| 9 |
María |
19/9/1985 |
26 |
- Aleatorización simple: para un número de filas=2
El resultado pueden ser dos filas cualesquiera.
| ID del empleado |
Nombre del empleado |
Fecha de nacimiento |
Edad |
| 7 |
Anna |
24/6/1965 |
46 |
| 8 |
Valeria |
6/7/1990 |
21 |
- Aleatorización sistemática: tamaño del depósito=4
| ID del empleado |
Nombre del empleado |
Fecha de nacimiento |
Edad |
| 2 |
Desi |
12/5/1981 |
30 |
| 6 |
Tobías |
30/6/1970 |
41 |
| 10 |
Martín |
21/11/1986 |
25 |
o
| ID del empleado |
Nombre del empleado |
Fecha de nacimiento |
Edad |
| 1 |
Laura |
11/11/1986 |
25 |
| 5 |
Tomás |
4/7/1987 |
24 |
| 9 |
María |
19/9/1985 |
26 |