Configurando o componente HANA Sentiment Analysis

O componente HANA Demand Forecasting permite que você analise um fluxo de texto complexo (por exemplo, a opinião de usuários do Twitter sobre um produto ou serviço). O componente analisa a opinião contida em cada unidade de texto e determina se a declaração é positiva ou negativa. Dessa forma, você pode transformar seus dados não estruturados em uma série de categorias que podem ser facilmente entendidas para identificar fatores de influência. Lá, você pode gerar insights para administrar melhor sua empresa.

Pré-requisitos:
  • Servidor: o sistema HANA (SPS 9+) com PAL, APL e R configurados.

  • Cliente: o Predictive Analytics 2.4 instalado e o R configurado.

Siga estas etapas para analisar um fluxo de texto de opiniões:

  1. No Expert Analytics, conecte-se a uma Fonte de dados. Por exemplo, para uma análise das opiniões de um usuário do Twitter sobre um produto ou serviço, você poderia usar uma tabela chamada TwitterFeed.
  2. Na divisão Prever, na Lista de componentes, selecione Preparação de dadosPré-processadoresHANA Sentiment Analysis. Arraste o componente HANA Sentiment Analysis e solte-o no editor de análise. Como alternativa, clique duas vezes no componente HANA Sentiment Analysis. Clique em OK.
  3. Clique duas vezes no componente HANA Sentiment Analysis para trabalhar com as definições de configuração dele. Como alternativa, no componente, clique no ícone Configurações e, no menu de contexto, selecione Configurar definições.
  4. Na caixa de diálogo HANA Sentiment, no painel Propriedades, selecione uma Variável de destino no menu. Note que o painel foi filtrado para listar apenas as colunas de texto dos seguintes tipos: TEXT, BINTEXT, VARCHAR, NCLOB, CLOB ou BLOB.
  5. Adicione o Nome da coluna de opinião, que é o nome da coluna de saída. No exemplo do Twitter, esse é o nome da coluna na qual as opiniões são escritas para cada publicação.
  6. No painel Avançado, realize as seguintes ações na seção Comportamento:
    1. Selecione os idiomas do texto para análise. Por padrão, serão analisados todos os idiomas suportados, mas isso pode ser otimizado pela especificação dos idiomas contidos no conjunto de dados.
    2. Selecione o tipo MIME para escolher o tipo de texto contido na sua variável de destino. Por padrão, serão analisados todos os tipos MIME suportados, mas isso pode ser otimizado pela especificação dos tipos MIME contidos no conjunto de dados.
    3. Escolha se deseja reportar o número de palavrões na análise por meio do campo de seleção Ativar leitura de palavrões.
    4. Associe as opiniões nas quais está interessado para a análise. Na mesma seção, especifique um nome para as opiniões, o qual será usado na análise e na geração de relatórios. No exemplo do Twitter, você pode definir o sentimento de cada opinião como positivo ou negativo. Dessa forma, você pode trabalhar com um problema de duas classes. Clique em Concluído.
  7. Quando configuradas, as opiniões podem ser usadas para análise. Por exemplo, a análise pode ser realizada por meio de uma árvore de decisões que você adiciona à cadeia de análise pela seção Algoritmos do painel Lista de componentes.
    Nota

    A análise está disponível para exibição nas ferramentas de suporte visual, como em uma árvore de decisões.

  8. Clique no ícone Executar análise. Aguarde até a análise ser concluída. Como será criado um índice de texto completo durante a execução, o tempo necessário para esse processo varia de acordo com a quantidade de texto que está tokenizado e analisado.
  9. Clique na guia Resultados para visualizar o resumo dos resultados.
O resumo inclui o total de registros de entrada, os registros com opiniões e os registros sem opiniões, assim como uma divisão das suas opiniões associadas. No exemplo do Twitter, o resumo inclui a porcentagem de opiniões com sentimento positivo, a porcentagem de opiniões com sentimento negativo e o número de tokens exclusivos.
Agora você pode configurar o componente HANA Sentiment Analysis e usá-lo como uma etapa de pré-processamento em uma análise complexa.