Share via


Explorando o modelo de previsão (tutorial de mineração de dados intermediário)

Agora que você criou o modelo de mineração de previsão, já pode explorar os resultados usando a guia Visualizador do Modelo de Mineração do Data Mining Designer. O Visualizador Microsoft Time Series contém duas guias: Gráficos e Modelo.

O modelo de mineração de previsão que você criou descreve as vendas de produtos em três regiões diferentes — Europa, América do Norte e Pacífico para os anos 2001-2004. Da mesma forma, o algoritmo Microsoft Time Series cria um modelo de série temporal que contém várias árvores, sendo que cada uma contém uma combinação diferente de região, produto e atributo previsível.

Cada uma das guias no visualizador oferece uma exibição diferente das informações no modelo de série temporal completo.

  • Guia Gráficos

  • Guia Modelo

  • Visualizador de Conteúdo Genérico

Guia Gráficos

A guia Gráficos do Visualizador MicrosoftTime Series mostra graficamente cada uma das árvores que o algoritmo cria. Uma árvore de série temporal contém uma combinação exclusiva de produto, região e atributo previsível.

A legenda à direita do visualizador relaciona a série temporal selecionada na lista suspensa e inclui uma caixa de seleção para cada série temporal. É possível controlar quais séries temporais são exibidas no visualizador, selecionando ou desmarcando as caixas de seleção na legenda.

Também é possível alterar as opções de exibição, como as cores usadas para cada série temporal, ou examinar valores em qualquer ponto no gráfico.

Para selecionar uma série temporal

  1. Clique na guia Gráficos da guia Visualizador do Modelo de Mineração, caso ela ainda não esteja em exibição.

  2. Clique na lista suspensa à direita da exibição do gráfico e marque todas as caixas de seleção: o gráfico deve conter 24 linhas de séries diferentes.

  3. Clique em OK.

  4. Desmarque as caixas de seleção à direita do gráfico para ocultar temporariamente as linhas de todas as séries que se baseiam no Amount.

  5. Agora, desmarque as caixas de seleção relacionadas às bicicletas R750 e R250.

    Agora, o gráfico contém apenas as seis linhas de série a seguir, para que você possa comparar mais facilmente as tendências para as bicicletas M200 e T1000.

    • M200 Europe: Quantity

    • M200 North America: Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity t

    • T1000 North America: Quantity

    • T1000 Pacific: Quantity

Séries prevendo a quantidade M200 e T1000Séries prevendo a quantidade M200 e T1000

O gráfico exibe dados históricos e previstos. Os dados previstos aparecem sombreados para diferenciá-los dos dados históricos. Para facilitar a comparação de séries diferentes, também é possível alterar as cores associadas a cada linha no gráfico. Para obter mais informações, consulte Como alterar as cores usadas no Visualizador de Mineração de Dados.

As linhas de tendência mostram que o total de vendas para todas as regiões geralmente tende ao crescimento, com pico a cada 12 meses, em dezembro. As previsões seguem a mesma tendência. Ao examinar o gráfico, você também pode informar que os dados para a bicicleta T1000 começam muito depois dos dados para a outra série de produto.

Por padrão, o Analysis Services mostra cinco etapas de previsão para cada série temporal. Você pode alterar esse valor para mostrar mais ou menos etapas de previsão. Também é possível exibir graficamente o desvio padrão para a previsão adicionando barras de erro ao gráfico.

Para alterar as opções de previsão e exibição na exibição do Gráfico

  1. Altere o valor para Etapas de Previsão gradativamente de 5 para 10 e depois para 6.

    Observe que nas linhas de tendência com grandes flutuações nos dados históricos, as flutuações são ampliadas durante a previsão.

  2. Marque a caixa de seleção Mostrar Desvios.

  3. Coloque o mouse sobre as barras de erro da série M200.

  4. Coloque o mouse sobre as barras de erro da série T1000 Pacific.

Você usará esses resultados para investigação mais detalhada. Mais tarde, você desenvolverá um modelo com a média de todas as regiões e, portanto, não sujeito a tanta flutuação.

Voltar ao Início

Guia Modelo

A guia Modelo do Visualizador Microsoft Time Series no Data Mining Designer lhe permite exibir a série temporal como um gráfico da árvore de decisão. Uma árvore separada é calculada para cada série incluída no modelo. Em um modelo de série temporal, o gráfico da árvore de decisão talvez tenha um único nó, se a série temporal for linear, ou talvez tenha vários nós e condições associados a cada ramificação, como uma árvore de decisão comum.

Os nós no gráfico da árvore de decisão para uma série temporal contêm vários tipos de informações:

  • A concentração de casos para o estado do atributo previsível especificado no controleBackground. Tanto a janela Nó de Legenda quanto a Dica de Ferramenta que aparecem quando você posiciona o mouse sobre um item da árvore fornecem o número exato de casos.

  • A fórmula de regressão para o nó. A fórmula de regressão ARTXP somente está disponível nos nós folha. A equação ARIMA está disponível no nó raiz da árvore.

  • Um gráfico losango que representa o intervalo do atributo. O losango fica na posição mediana do nó, e sua largura representa a variação do atributo naquele nó.

Para exibir a árvore de decisão para um modelo de série temporal

  1. Na lista Árvore, na guia Modelo do visualizador, selecione a série M200 North America: Amount.

    Um único nó é exibido no gráfico.

  2. Coloque o cursor do mouse sobre o nó.

    Para um nó Tudo, a Dica de Ferramenta que aparece inclui informações como o número de casos em toda a série e as equações de série temporal derivadas da análise dos dados.

  3. Clique no nó e exiba a Legenda de Mineração.

    A Legenda de Mineração inclui informações semelhantes a essas na Dica de Ferramenta, mas fornece mais detalhes, como um histograma dos valores.

  4. Na lista Árvore, na guia Modelo do visualizador, selecione a série M200 Pacific: Amount.

    Agora, o gráfico de árvore contém um nó Tudo e dois nós filho. O texto nos nós filho descreve as condições que dividem a árvore,

  5. Coloque o cursor do mouse sobre um dos nós filho e examine o conteúdo da Dica de Ferramenta. Se desejar, clique no nó e exiba a Legenda de Mineração.

    Para os nós filho, a descrição inclui a contagem de casos em cada ramificação da árvore e as condições adicionais que causaram a divisão da árvore.

Voltar ao Início

Visualizador da Árvore de Conteúdo Genérico

Além do visualizador personalizado para a série temporal, o Analysis Services fornece o Visualizador de Árvore de Conteúdo Genérica da Microsoft. Esse visualizador pode ser usado em todos os modelos de mineração de dados, independentemente do algoritmo ou do tipo de modelo utilizado. O Visualizador da Árvore de Conteúdo Genérico está disponível na lista suspensa do Visualizador.

Nesse visualizador, cada modelo de mineração, independentemente dos dados ou do algoritmo usado para análise, é representado como uma árvore que contém uma série de nós. Cada nó representa conhecimentos adquiridos sobre algum subconjunto dos dados. O conteúdo exato do nó difere segundo o algoritmo e o tipo do atributo previsível; no entanto, o esquema geral do conteúdo é o mesmo.

Como o modelo de mineração de dados criado é do tipo misto, combinando algoritmos ARTXP e ARIMA, o Analysis Services usa cada algoritmo por sua vez para criar modelos ARTXP e ARIMA separados para cada série temporal. Quando você usa o Visualizador Microsoft Time Series para navegar no modelo de mineração de previsão, o Analysis Services combina os resultados dos dois algoritmos e mostra o modelo de mineração como uma única árvore, com cada nó da árvore tendo algum conteúdo dos dois algoritmos.

No entanto, quando você usa o Visualizador de Árvore de Conteúdo Genérica da Microsoft, o conteúdo gerado por cada algoritmo é exposto como dois tipos diferentes de nós no modelo de mineração de previsão. É possível executar uma busca detalhada na versão ARTXP do modelo ou na versão ARIMA do modelo para visualizar os níveis crescentes de detalhe.

Para exibir detalhes de uma determinada série de dados no visualizador de conteúdo genérico

  1. Na guia Visualizador do Modelo de Mineração, selecione Visualizador de Árvore de Conteúdo Genérica da Microsoft da Microsoft na lista suspensa Visualizador.

  2. No painel Legenda de Nó, clique no nó (Tudo) superior.

  3. No painel Detalhes do Nó, examine o valor de ATTRIBUTE_NAME.

    Esse valor informa qual série, ou combinação de produto e região, está contida nesse nó. No exemplo do AdventureWorks, o nó superior pertence à série M200 Europe.

  4. No painel Legenda de Nó, localize o primeiro nó que tenha nós filho.

    Se um nó de série tiver filhos, a exibição de árvore mostrada na guia Modelo do Visualizador MTS também terá uma estrutura de ramificação.

  5. Expanda o nó e clique em um dos nós filho.

    A coluna NODE_DESCRIPTION do esquema contém a condição que causou a divisão da árvore.

  6. No painel Legenda de Nó, clique no nó ARIMA superior e expanda o nó até que todos os nós filho estejam visíveis.

  7. No painel Detalhes do Nó, examine o valor de ATTRIBUTE_NAME.

    Esse valor informa qual série temporal está contida nesse nó. O nó superior na seção ARIMA corresponde ao nó superior na seção (Tudo). No exemplo do AdventureWorks, esse nó contém a análise ARIMA da série M200 Europe.

Para obter mais informações, consulte Conteúdo do modelo de mineração para modelos de série temporal (Analysis Services – Mineração de dados).

Voltar ao Início