Explorar el modelo de agrupación en clústeres (Tutorial básico de minería de datos)

 

Se aplica a: SQL Server 2016 Preview

El Microsoft algoritmo de clústeres agrupa los casos en los clústeres que contienen características similares. Estas agrupaciones son útiles para la exploración de datos, la identificación de anomalías en los datos y la creación de predicciones.

El Visor de clústeres de Microsoft ofrece las siguientes pestañas para la exploración de modelos de minería de datos de agrupación en clústeres:

Diagrama del clúster

Perfiles del clúster

Características del clúster

Distinción del clúster

Pestaña Diagrama del clúster

La pestaña Diagrama del clúster muestra todos los clústeres de un modelo de minería de datos. Las líneas entre los clústeres representan la "proximidad" y aparecen sombreadas en función de la similitud entre los clústeres. El color de cada clúster representa la frecuencia de la variable y el estado del clúster.

Para explorar el modelo en la pestaña Diagrama del clúster

  1. Utilice la Mining Model lista en la parte superior de la Visor de modelo de minería de datos ficha para cambiar a la TM_Clustering modelo.

  2. En el Visor lista, seleccione Visor de clústeres de Microsoft.

  3. En el Variable de sombreado seleccione bicicleta.

    La variable predeterminada es rellenado, pero puede cambiarlo a cualquier atributo en el modelo, para detectar cuáles clústeres contienen los miembros que tienen los atributos que desee.

  4. Seleccione 1 en la estado cuadro para explorar esos casos donde se compró una bicicleta.

    El densidad leyenda describe la densidad del par de Estados del atributo seleccionado en la Variable de sombreado y el estado. En este ejemplo nos indica que el clusterwith el sombreado más oscuro tiene el porcentaje más alto de compradores de bicicletas.

  5. Pause su mouse sobre el clúster con el sombreado más oscuro.

    Información sobre herramientas muestra el porcentaje de casos que tienen el atributo Bike Buyer = 1.

  6. Seleccione el clúster que tiene la máxima densidad, haga clic en el clúster, seleccione cambiar el nombre de clúster y tipo Bike Buyers High para una identificación posterior. Haga clic en Aceptar.

  7. Busque el clúster que tiene el sombreado más ligero (y la densidad más baja). Haga clic en el clúster, seleccione cambiar el nombre de clúster y tipo Bike Buyers Low. Haga clic en Aceptar.

  8. Haga clic en el Bike Buyers High de clúster y arrástrelo a un área del panel que le ofrecerán una visión clara de sus conexiones a los demás clústeres.

    Al seleccionar un clúster, se resaltan las líneas que conectan este clúster con otros para que pueda ver todas las relaciones existentes para el mismo. Cuando el clúster no está seleccionado, puede saber por la oscuridad de las líneas la intensidad de las relaciones entre todos los clústeres del diagrama. Si el sombreado es claro o inexistente, los clústeres no son muy similares.

  9. Use el control deslizante situado en la parte izquierda de la red para filtrar los vínculos de menor intensidad y encontrar los clústeres con las relaciones más próximas. El departamento comercial de Adventure Works Cycles podría desear combinar los clústeres similares al determinar el mejor método para entregar el envío de correo directo.

Volver al principio

Pestaña Perfiles del clúster

El perfiles del clúster ficha proporciona una visión general de la TM_Clustering modelo. El perfiles del clúster ficha contiene una columna para cada clúster del modelo. La primera columna enumera los atributos asociados a un clúster como mínimo. El resto del visor contiene la distribución de estados de un atributo por cada clúster. La distribución de una variable discreta se muestra como una barra coloreada con el número máximo de barras aparece en el barras de histograma lista. Los atributos continuos se muestran con un diagrama de rombo, que representa la desviación media y estándar en cada clúster.

Para explorar el modelo en la pestaña perfiles del clúster

  1. Establecer histograma barras de 5.

    En nuestro modelo, 5 es el número máximo de estados para cualquier variable.

  2. Si el leyenda de minería de datos bloquea la presentación de la atributo perfiles, moverlo de forma.

  3. Seleccione el Bike Buyers High columna y arrástrelo a la derecha de la rellenado columna.

  4. Seleccione el Bike Buyers Low columna y arrástrelo a la derecha de la Bike Buyers High columna.

  5. Haga clic en el Bike Buyers High columna.

    El Variables columna está ordenada en orden de importancia para ese clúster. Desplácese por la columna y revise las características del clúster Bike Buyer High. Por ejemplo, es muy probable que en todas ellas la característica común sea que la distancia al trabajo sea corta.

  6. Haga doble clic en el edad de celda en el Bike Buyers High columna.

    El leyenda de minería de datos muestra más detallada vista y se puede ver el intervalo de edad de estos clientes, así como la edad Media.

  7. Haga clic en el Bike Buyers Low columna y seleccione Ocultar columna.

Volver al principio

Pestaña Características del clúster

Con el características del clúster ficha, puede examinar con más detalle las características que forman un clúster. En lugar de comparar las características de todos los clústeres (como en la pestaña Perfiles del clúster), puede explorar un clúster a la vez. Por ejemplo, si selecciona Bike Buyers High desde el clúster lista, puede ver las características de los clientes en este clúster. Aunque la presentación es diferente del visor Perfiles del clúster, los resultados son los mismos.

Nota


A menos que establezca un valor inicial para holdoutseed, los resultados pueden variar cada vez que procese el modelo. Para obtener más información, consulte holdoutseed, elemento

Volver al principio

Pestaña Distinción del clúster

Con el distinción del clúster ficha, puede explorar las características que distinguen un clúster de otro. Después de seleccionar dos clústeres, uno de los clúster 1 lista y uno de los clúster 2 lista, el Visor calcula las diferencias entre los clústeres y muestra una lista de los atributos que distinguen a los clústeres más.

Para explorar el modelo en la pestaña distinción del clúster

  1. En el clúster 1 seleccione Bike Buyers High.

  2. En el clúster 2 seleccione Bike Buyers Low.

  3. Haga clic en Variables para ordenar alfabéticamente.

    Algunas de las diferencias sustanciales entre clientes de la Bike Buyers Low y Bike Buyers High clústeres incluyen la edad, la posesión de un vehículo, número de hijos y la región.

Tareas relacionadas

Vea los temas siguientes para explorar los demás modelos de minería de datos.

Siguiente tarea de la lección

Explorar el modelo Bayes Naive ( Tutorial de minería de datos básicos y nº 41;

Tarea anterior de la lección

Explorar el modelo de árbol de decisión ( Tutorial de minería de datos básicos y nº 41;

Vea también

Examinar un modelo usando el Visor de clústeres de Microsoft
Pestaña Distinción del clúster (Visor de modelos de minería de datos)
Pestaña Perfiles del clúster (Visor de modelos de minería de datos)
Pestaña Características del clúster (Visor de modelos de minería de datos)
Pestaña Diagrama del clúster (Visor de modelos de minería de datos)