Descripción de datos

Se pueden cargar metadatos en formato de texto delimitado tabulaciones o por comas, desde una fuente ODBC o en formato de propietario. Existen dos maneras de describir los datos:

  • Analizar: examinará las primeras cien líneas de datos y proporcionará al usuario una estimación inicial de la descripción del fichero de datos. Para los ficheros de datos de texto, se recomienda que la primera fila contenga los nombres de las variables. Después de crear un fichero de descripción, el botón Grabar descripción guardará el fichero de descripción en el subdirectorio indicado en el cuadro Directorio. El nombre del fichero de descripción se puede indicar en la casilla Descripción.
  • Abrir descripción: cargará un fichero de descripción grabado previamente.
  • Ver datos: muestra las primeras cien líneas del conjunto de datos para ayudarle a validar la descripción.

Los siguientes campos describen cada variable o atributo:

  • Nombre: El nombre de variable (no se puede modificar)
  • Almacenamiento: Tipo de valores almacenados en esta variable
    • Number: La variable contiene solo números "calculables" (cuidado: un número de teléfono o un número de cuenta no deben considerarse números)
    • String: La variable contiene cadenas de caracteres
    • Datetime: La variable contiene marcas de fecha y hora
    • Date: La variable contiene fechas
  • Valor: Describe el tipo de valor
    • Continua: una variable numérica a partir de la que puede calcularse la media, varianza, etc.
    • Nominal: variable categórica que es el único valor posible de una cadena
    • Ordinal: variable numérica discreta en la que el orden relativo es importante
  • Clave: variable clave o identificador para el registro (0: la variable no es un identificador; 1: identificador primario: 2: identificador secundario, etc.)
  • Orden: Identifica si una variable representa un orden natural (0: la variable no representa un orden natural, 1: la variable representa un orden natural). Si el valor se establece en 1, la variable se utiliza en expresiones SQL en una condición "order by".

    Advertencia: Marcar una variable como variable de orden afectará la decisión de optar por una estrategia de partición. Con una variable de orden solo pueden utilizarse las estrategias secuenciales.

  • Falta: cadena utilizada en el fichero de descripción de datos para representar valores que faltan (p. ej.: "999" o "#Empty" - sin comillas)
  • Grupo: nombre del grupo al que pertenece la variable. Las variables de un mismo grupo expresan la misma información y, por tanto, no se cruzan cuando el modelo tiene un grado de complejidad superior a 1. Este parámetro se podrá utilizar en una versión futura.

Descripción: Etiqueta de descripción adicional para la variable