Configuración del componente de Análisis de opiniones de HANA

El componente de Análisis de opiniones de HANA le permite analizar un flujo complejo de texto (por ejemplo, las opiniones de los usuarios de Twitter sobre un producto o un servicio). El componente analiza la opinión incluida en cada unidad de texto y transmite si la opinión es positiva o negativa. De esta forma, puede transformar los datos no estructurados en una serie de categorías fáciles de entender para descubrir los factores de influencia. A partir de ahí, puede generar perspectivas para llevar mejor la empresa.

Requisitos previos:
  • Servidor: Sistema HANA (SPS 9+) con PAL, APL y R configurados.

  • Cliente: SAP Predictive Analytics 2.4 instalado y configurado para R.

Realice los siguientes pasos para analizar un flujo de texto para las opiniones:

  1. En Expert Analytics, conéctese a una Fuente de datos. Por ejemplo, para un análisis de las opiniones de los usuarios de Twitter sobre un producto o un servicio, puede utilizar una tabla llamada TwitterFeed.
  2. En el Espacio Predecir, de la Lista de componentes seleccione Preparación de datos - Preprocesadores - Análisis de opiniones de HANA. Arrastre y suelte un componente Análisis de opiniones de HANA en el editor de análisis. De forma alternativa, haga doble clic en el componente Análisis de opiniones de HANA. Haga clic en Aceptar.
  3. Haga doble clic en el compoente Análisis de opiniones de HANA para trabajar con las parametrizaciones de la configuración. De forma alternativa, en el componente haga clic en el icono Parametrizaciones y del menú contextual seleccione Configurar parametrizaciones.
  4. En la casilla de diálogo de Opiniones de HANA, en el panel Propiedades seleccione una Variable destino del menú. Tenga en cuenta que se filtra para listar sólo las columnas de texto de los siguientes tipos: TEXT, BINTEXT, VARCHAR, NCLOB, CLOB o BLOB.
  5. Añada un Nombre de columna de opinión que es el nombre de la columna de salida. En el ejemplo de Twitter, es el nombre de la columna en la que se escriben las opiniones para cada tuit.
  6. En el panel avanzado, realice las acciones siguientes en la sección de comportamiento:
    1. Seleccione los idiomas del texto para el análisis. De forma estándar, analizará todos los idiomas soportados pero se puede optimizar al especificar los idiomas incluidos en el conjunto de datos.
    2. Seleccione el tipo MIME para seleccionar el tipo de texto incluido en la variable destino. De forma estándar, analizará todos los tipos MIME soportados pero se puede optimizar al especificar los tipos MIME incluidos en el conjunto de datos.
    3. Seleccione si informar o no de la cantidad de blasfemias incluidas en el análisis marcando la casilla de selección Habilitar blasfemias.
    4. Marque las opiniones en las que esté interesado para realizar el análisis. En la misma sección, nombre las opiniones a utilizar en el análisis y en el reporting. En el ejemplo de Twitter, puede considerar cada opinión como buena o mala. De esta forma puede trabajar con un problema de dos clases. Haga clic en Listo.
  7. Cuando se configura, puede utilizar las opiniones para el análisis. Por ejemplo, el análisis se puede completar mediante un árbol de decisiones que puede añadir a la cadena de análisis desde la sección de algoritmos del panel de Lista de componentes.
    Nota

    El análisis está disponible para su visualización en las herramientas de soporte visuales como un árbol de decisiones.

  8. Haga clic en el icono Ejecutar análisis. Conceda algo de tiempo para que finalice el análisis, porque durante la ejecución se crea un índice de texto completo, que puede extender el tiempo de ejecución dependiendo de la cantidad de texto que se analiza y del que se realizan tokens.
  9. Haga clic en la pestaña Resultados para ver el Resumen de los resultados.
El Resumen incluye los registros de entrada totales, los registros con opiniones y los registros sin opiniones, y un desglose de sus opiniones marcadas. En el ejemplo de Twitter, el Resumen incluye un porcentaje de opiniones buenas y malas y el número de tokens únicos.
Sabe cómo configurar el componente de análisis de opiniones de HANA y utilizarlo como paso de procesamiento previo en un análisis complejo.