Explorar el modelo de centro de llamadas (Tutorial intermedio de minería de datos)

Artículo
11/01/2016

Se aplica a: SQL Server 2016 Preview

Ahora que ha creado el modelo de exploración, puede usarlo para obtener más información sobre los datos mediante las herramientas siguientes que se proporcionan en SQL Server Data Tools (SSDT).

Visor de red neuronal de Microsoft**:** este visor está disponible en la Visor de modelo de minería de datos ficha del Diseñador de minería de datos y está diseñado para ayudarle a experimentar con las interacciones de los datos.
Visor de árbol de contenido genérico de Microsoft**:** este visor estándar proporciona detalles precisos sobre los patrones y estadísticas que detecta el algoritmo al generar el modelo.

Visor de redes neuronales de Microsoft

El Visor tiene tres paneles: entrada, salida, y Variables.

Mediante el uso de la salida panel, puede seleccionar diferentes valores para el atributo de predicción o la variable dependiente. Si el modelo contiene varios atributos de predicción, puede seleccionar el atributo de la atributo de salida lista.

El Variables panel compara los dos resultados que eligió en términos de los atributos participantes o variables. Las barras coloreadas representan visualmente en qué grado afecta la variable a los resultados buscados. También puede ver las puntuaciones de mejora respecto al modelo predictivo para las variables. Una puntuación de mejora respecto al modelo predictivo se calcula de forma diferente en función de qué tipo de modelo de minería de datos se usa, pero en general indica la mejora en el modelo cuando se usa este atributo para la predicción.

El entrada panel le permite agregar influenciadores al modelo para probar varios escenarios condicionales.

Usar el panel Salida

En este modelo inicial, le interesa ver cómo afectan varios factores al grado de servicio. Para ello, puede seleccionar grado de servicio en la lista de atributos de salida y, a continuación, comparar los diferentes niveles de servicio seleccionando intervalos en las listas desplegables de valor 1 y valor 2.

Para comparar los grados de servicio inferior y superior

Para valor 1, seleccione el intervalo con los valores más bajos. Por ejemplo, el intervalo 0-0-0.7 representa las tasas menores de abandono y, por lo tanto, el mejor grado de servicio.

Nota

Los valores exactos de este intervalo pueden variar según la configuración del modelo.
Para valor 2, seleccione el intervalo con los valores más altos. Por ejemplo, el intervalo con el valor >=0,12 representa las tasas mayores de abandono y, por lo tanto, el peor grado de servicio. En otras palabras, el 12% de los clientes que llamaron durante este turno colgaron antes de hablar con un agente.

El contenido de la Variables panel se actualiza para comparar los atributos que contribuyen a los valores de resultado. Por lo tanto, la columna de la izquierda muestra los atributos asociados al mejor grado de servicio y la columna de la derecha los atributos asociados al peor grado de servicio.

Usar el panel Variables

En este modelo, parece que Average Time Per Issue es un factor importante. Esta variable indica el tiempo promedio que se tarda en responder una llamada, con independencia de su tipo.

Para ver y copiar las puntuaciones de mejora respecto al modelo predictivo y la probabilidad de un atributo

En el Variables panel, sitúe el mouse sobre la barra coloreada en la primera fila.

Esta barra coloreada muestra en qué Average Time Per Issue contribuye a la calidad de servicio. La información sobre herramientas muestra una puntuación general, las probabilidades y las puntuaciones de mejora con respecto al modelo predictivo para cada combinación de variable y resultado de destino.
En el Variables panel, haga una barra coloreada y seleccione copia.
En una hoja de cálculo de Excel, haga clic en cualquier celda y seleccione Pegar.

El informe se pega como una tabla HTML y solo muestra las puntuaciones de cada barra.
En otra hoja de cálculo Excel, haga clic en cualquier celda y seleccione Pegado especial.

El informe se pega en formato de texto e incluye las estadísticas relacionadas descritas en la sección siguiente.

Usar el panel Entrada

Suponga que le interesa observar el efecto de un factor determinado, como el turno o el número de operadores. Puede seleccionar una variable concreta mediante el entrada panel y el Variables panel se actualiza automáticamente para comparar los dos previamente grupos seleccionados, dados la variable especificada.

Para revisar el efecto en el grado de servicio cambiando los atributos de entrada

En el entrada panel, para atributo, seleccione Shift.
Para valor, seleccione AM.

El Variables panel se actualiza para mostrar el impacto en el modelo cuando el turno es AM. Las demás selecciones siguen siendo las mismas, sigue comparando los grados de servicio menor y mayor.
Para valor, seleccione PM1.

El Variables panel se actualiza para mostrar el impacto en el modelo cuando el turno cambia.
En el entrada panel, haga clic en la siguiente fila en blanco atributo, y seleccione las llamadas. Para valor, seleccione el intervalo que indica el número máximo de llamadas.

Se agrega una condición de entrada nueva a la lista. El Variables panel se actualiza para mostrar el impacto en el modelo para un turno concreto cuando el volumen de llamadas es mayor.
Continúe cambiando los valores de Shift y Calls para encontrar correlaciones interesantes entre el turno, el volumen de llamadas y el grado de servicio.

Nota

Para borrar el entrada panel para que pueda utilizar diferentes atributos, haga clic en actualizar el contenido del Visor.

Interpretar las estadísticas que se proporcionan en el visor

Los tiempos de espera más prolongados son un factor de predicción muy eficaz de una tasa de abandono elevada, lo que significa que el grado de servicio es deficiente. Esto puede parecer una conclusión obvia; sin embargo, el modelo de minería de datos proporciona datos estadísticos adicionales para ayudarle a interpretar estas tendencias.

Puntuación: valor que indica la importancia global de esta variable para discriminar entre los resultados. Cuanto más alta es la puntuación, más intenso es el efecto que la variable tiene en el resultado.
Probabilidad de valor 1: porcentaje que representa la probabilidad de que este valor para este resultado.
Probabilidad del valor 2: porcentaje que representa la probabilidad de que este valor para este resultado.
Elevación del valor 1 y elevación del valor 2: puntuaciones que represente el impacto del uso de esta variable concreta para predecir los resultados del valor 1 y valor 2. Cuanto más alta es la puntuación, mejor es la variable prediciendo los resultados.

La tabla siguiente contiene algunos valores de ejemplo para los influenciadores más importantes. Por ejemplo, el probabilidad del valor 1 es 60,6% y probabilidad del valor 2 es 8,30%, lo que significa que cuando Average Time Per Issue estaba dentro del intervalo de 44-70 minutos, el 60,6% de los casos estaban en el turno con los grados de servicio más alto (valor 1) y el 8,30% de los casos estaban en el turno con los peores grados de servicio (valor 2).

A partir de esta información puede sacar algunas conclusiones. Un menor tiempo de respuesta de las llamadas (el intervalo 44-70) influye en gran medida en un mejor grado de servicio (el intervalo 0.00-0.07). La puntuación (92,35) le indica que esta variable es muy importante.

Sin embargo, según se sigue mirando la lista de factores que influyen, se ven algunos otros factores con efectos que son más sutiles y más difíciles de interpretar. Por ejemplo, el turno parece influir en el servicio, pero las puntuaciones de mejora con respecto al modelo predictivo y las probabilidades relativas indican que no es un factor importante.

Attribute	Value	Favorece < 0,07	Favorece >= 0,12
Average Time Per Issue	89.087 - 120.000		Puntuación: 100 Probabilidad de Value1: 4,45% Probabilidad de Value2: % 51.94 Elevación de Value1: 0,19 Elevación de Value2: 1,94
Average Time Per Issue	44.000 - 70.597	Puntuación: 92,35 Probabilidad de valor 1: 60,06 % Probabilidad de valor 2: 8,30 % Elevación de valor 1: 2,61 Elevación de valor 2: 0,31

Volver al principio

Visor de árbol de contenido genérico de Microsoft

Este visor se puede usar para ver información incluso más detallada creada por el algoritmo cuando se procesa el modelo. El Visor de árbol de contenido MicrosoftGeneric representa el modelo de minería de datos como una serie de nodos, donde cada nodo representa el conocimiento adquirido acerca de los datos de entrenamiento. Este visor se puede utilizar con todos los modelos, pero el contenido de los nodos es diferente según el tipo de modelo.

Para los modelos de red neuronal o modelos de regresión logística, es posible la nodo de estadísticas marginales especialmente útil. Este nodo contiene estadísticas derivadas acerca de la distribución de los valores de los datos. Esta información puede ser de utilidad si desea obtener un resumen de los datos sin tener que escribir muchas consultas de T-SQL. El gráfico de los valores del tema anterior se derivó del nodo de estadísticas marginal.

Para obtener un resumen de los valores de datos del modelo de minería de datos

En el Diseñador de minería de datos, en la Visor de modelo de minería de datos seleccione .
Desde el Visor lista, seleccione Visor de árbol de contenido genérico de Microsoft.

La vista del modelo de minería de datos se actualiza para mostrar una jerarquía de nodos en el panel izquierdo y una tabla HTML en el panel derecho.
En el título del nodo panel, haga clic en el nodo que tiene el nombre 10000000000000000.

El nodo superior de cualquier modelo siempre es el nodo raíz. En un modelo de red neuronal o de regresión logística, el nodo que está inmediatamente por debajo es el nodo de estadísticas marginal.
En la Detalles del nodo panel, desplácese hacia abajo hasta que encuentre la fila NODE_DISTRIBUTION.
Desplácese hacia abajo por la tabla NODE_DISTRIBUTION para ver la distribución de valores calculados por el algoritmo de red neuronal.

Para usar estos datos en un informe, podría seleccionar información de filas específicas y copiarla después, o puede usar la siguiente consulta de Extensiones de minería de datos (DMX) para extraer el contenido completo del nodo.

SELECT *   
FROM [Call Center EQ4].CONTENT  
WHERE NODE_NAME = '10000000000000000'

También puede usar la jerarquía de nodos y los detalles de la tabla NODE_DISTRIBUTION para recorrer rutas individuales de la red neuronal y ver estadísticas del nivel oculto. Para obtener más información, consulte ejemplos de consultas de modelo de red neuronal.