Crear predicciones (Tutorial básico de minería de datos)

 

Se aplica a: SQL Server 2016 Preview

Después de haber probado la precisión de los modelos de minería de datos y esté satisfecho con los resultados, a continuación, puede generar predicciones mediante el generador de consultas de predicción en el predicción de modelo de minería de datos ficha en el Diseñador de minería de datos.

El Generador de consultas de predicción tiene tres vistas. Con el diseño y consulta vistas, puede generar y examinar su consulta. A continuación, puede ejecutar la consulta y ver los resultados en la resultado vista.

Todas las consultas de predicción utilizan DMX, que es el acrónimo del lenguaje de Extensiones de minería de datos (DMX). DMX tiene una sintaxis similar a la de T-SQL, pero se utiliza con consultas en objetos de minería de datos. Aunque la sintaxis de DMX no es complicada, con un generador de consultas como este, o en la SQL Server datos de minería de datos de complementos para Office, hace mucho más fácil seleccionar entradas y generar expresiones, por lo que es muy recomendable que conozca los aspectos básicos.

Crear la consulta

El primer paso para crear una consulta de predicción consiste en seleccionar un modelo de minería de datos y una tabla de entrada.

Para seleccionar un modelo de minería de datos y una tabla de entrada

  1. En el predicción de modelo de minería de datos ficha del Diseñador de minería de datos, en la Mining Model cuadro, haga clic en Seleccionar modelo.

  2. En la Seleccionar modelo de minería de datos diálogo cuadro, navegar por el árbol hasta la Targeted Mailing estructura, expanda la estructura, seleccione TM_Decision_Tree, y, a continuación, haga clic en Aceptar.

  3. En la Seleccionar tabla (s) de entrada cuadro, haga clic en Seleccionar tabla de casos.

  4. En la Seleccionar tabla cuadro de diálogo el origen de datos seleccione la vista del origen de datos Adventure Works DW Multidimensional 2012.

  5. En nombre de tabla o vista, seleccione el ProspectiveBuyer (dbo) de tabla y, a continuación, haga clic en Aceptar.

    El ProspectiveBuyer más se parezca la tabla el vTargetMail tabla de casos.

Asignar las columnas

Después de seleccionar la tabla de entrada, el Generador de consultas de predicción crea una asignación predeterminada entre el modelo de minería de datos y la tabla de entrada, en función de los nombres de las columnas. Al menos una columna de la estructura debe coincidir con una columna de los datos externos.

Importante


Los datos que use para determinar la precisión de los modelos deben contener una columna que se pueda asignar a la columna de predicción. Si no existe esa columna, puede crear una con valores vacíos, pero debe tener el mismo tipo de datos que la columna de predicción.

Para asignar las entradas al modelo

  1. Haga clic en las líneas que conectan los modelo de minería de datos ventana para el Seleccionar tabla de entrada ventana y seleccione modificar conexiones.

    Observe que no todas las columnas están asignadas. Agregaremos asignaciones para varios columnas de la tabla. También generaremos una columna de fecha de nacimiento nueva en función de la columna de fecha actual, para que la coincidencia de las columnas sea mejor.

  2. Bajo columna de la tabla, haga clic en el bicicleta de celda y seleccione ProspectiveBuyer.Unknown en la lista desplegable.

    De esta forma se asigna la columna de predicción, [Bike Buyer], a una columna de la tabla de entrada.

  3. Haga clic en Aceptar.

  4. En el Explorador de soluciones, haga clic en el Targeted Mailing vista del origen de datos y seleccione Ver diseñador.

  5. Haga clic en la tabla ProspectiveBuyer y seleccione nuevo cálculo con nombre.

  6. En la Crear cálculo con nombre cuadro de diálogo para nombre de columna, tipo calcAge.

  7. Para descripción, tipo calcular la edad basándose en la fecha de nacimiento.

  8. En el expresión escriba DATEDIFF(YYYY,[BirthDate],getdate()) y, a continuación, haga clic en Aceptar.

    Dado que la tabla de entrada no tiene ningún edad columna correspondiente en el modelo, puede utilizar esta expresión para calcular la edad del cliente de la columna de fecha de nacimiento de la tabla de entrada. Puesto que edad se identificó como más influyentes columna para predecir la compra de bicicletas, debe existir en el modelo y en la tabla de entrada.

  9. En el Diseñador de minería de datos, seleccione la predicción de modelo de minería de datos ficha y vuelva a abrir el modificar conexiones ventana.

  10. Bajo columna de la tabla, haga clic en el edad de celda y seleccione ProspectiveBuyer.calcAge en la lista desplegable.

    Advertencia


    Si no ve la columna en la lista, puede que tenga que actualizar la definición de la vista del origen de datos que se ha cargado en el diseñador. Para ello, en el archivo menú, seleccione Guardar todo, y, a continuación, cierre y vuelva a abrir el proyecto en el diseñador.

  11. Haga clic en Aceptar.

Diseñar la consulta de predicción

  1. El primer botón de la barra de herramientas de la predicción de modelo de minería de datos ficha es la conmutador diseñar ver / cambiar a la vista de resultados o cambie a la vista de consulta botón. Haga clic en la flecha abajo en este botón y seleccione diseño.

  2. En la cuadrícula de la predicción de modelo de minería de datos ficha, haga clic en la celda de la primera fila vacía en el origen columna y, a continuación, seleccione función de predicción.

  3. En el función de predicción de fila, en la campo columna, seleccione PredictProbability.

    En el Alias columna de la misma fila, escriba probabilidad de resultado.

  4. Desde el Mining Model ventana anterior, seleccione y arrastre [Bike Buyer] en el criterios o argumento celda.

    Cuando se coloca, [TM_Decision_Tree]. [Bike Buyer] aparece en el criterios o argumento celda.

    Especifica la columna de destino para la PredictProbability (función). Para obtener más información acerca de las funciones, consulte extensiones de minería de datos ( DMX ) Referencia a función.

  5. Haga clic en la siguiente fila vacía en el origen columna y, a continuación, seleccione modelo de minería de datos TM_Decision_Tree**.**

  6. En el TM_Decision_Tree de fila, en la campo columna, seleccione bicicleta.

  7. En el TM_Decision_Tree de fila, en la criterios o argumento escriba = 1.

  8. Haga clic en la siguiente fila vacía en el origen columna y, a continuación, seleccione tabla ProspectiveBuyer.

  9. En el ProspectiveBuyer de fila, en la campo columna, seleccione ProspectiveBuyerKey.

    De esta forma, se agregará el identificador único a la consulta de predicción para que pueda identificar quién es más y menos probable que compre una bicicleta.

  10. Agregue cinco filas más a la cuadrícula. Para cada fila, seleccione tabla ProspectiveBuyer como el origen y, a continuación, agregue las siguientes columnas de la campo celdas:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Finalmente, ejecute la consulta y examine los resultados.

El el generador de consultas de predicción también incluye estos controles:

  • Mostrar casilla de verificación

    Permite quitar cláusulas de la consulta sin tener que eliminarlas desde el diseñador. Esto puede resultar útil cuando se trabaja con consultas complejas y se desear conservar la sintaxis sin tener que copiar y pegar DMX en la ventana.

  • Grupo

    Inserta un paréntesis de apertura (izquierdo) al principio de la línea seleccionada o inserta un paréntesis de cierre (derecho) al final de la línea actual.

  • AND/OR

    Inserta el AND operador o la OR operador inmediatamente después de la función actual o una columna.

Para ejecutar la consulta y ver los resultados

  1. En el predicción de modelo de minería de datos seleccione la resultado botón.

  2. Una vez que la consulta se ejecute y se muestren los resultados, puede revisarlos.

    El predicción de modelo de minería de datos ficha muestra información de contacto de clientes potenciales que es probable que los compradores de bicicletas. El probabilidad de resultado columna indica la probabilidad de la predicción sea correcta. Puede utilizar estos resultados para determinar a qué clientes potenciales debe dirigirse en el correo.

  3. En este punto, puede guardar los resultados. Tiene tres opciones:

    • Haga clic en una fila de datos en los resultados y seleccione copia para guardar solo el valor (y el encabezado de columna) en el Portapapeles.

    • Haga clic en cualquier fila de los resultados y seleccione Copiar todo para copiar el conjunto de resultados completo, incluidos los encabezados de columna, en el Portapapeles.

    • Haga clic en Guardar resultado de consulta para guardar los resultados directamente a una base de datos como sigue:

      1. En el Guardar resultado de consulta de minería de datos cuadro de diálogo, seleccione un origen de datos o definir un nuevo origen de datos.

      2. Escriba un nombre para la tabla que contendrá los resultados de la consulta.

      3. Utilice la opción Agregar a DSV, para crear la tabla y agregarla a una vista de origen de datos existente. Esto es útil si desea conservar todas las tablas relacionadas para un modelo, como los datos de entrenamiento, los datos del origen de predicción y los resultados de la consulta, en la misma vista del origen de datos.

      4. Utilice la opción Sobrescribir si existe, para actualizar una tabla existente con los resultados más recientes.

        Debe utilizar la opción de sobrescribir la tabla si ha agregado algunas columnas a la consulta de predicción, cambiado los nombres o los tipos de datos de las columnas en la consulta de predicción, o si ha ejecutado alguna instrucción ALTER en la tabla de destino.

        Además, si varias columnas tienen el mismo nombre (por ejemplo, el nombre de columna predeterminado expresión) debe crear un alias para las columnas con nombres duplicados, o se producirá un error cuando el diseñador intenta guardar los resultados en SQL Server. La razón es que SQL Server no permite que varias columnas tengan el mismo nombre.

        Para obtener más información, consulte datos minería consulta resultado de cuadro de diálogo Guardar ( Nº 41; & de vista predicción de modelo de minería de datos.

Siguiente tarea de la lección

Uso de obtención de detalles en la estructura de datos ( Tutorial de minería de datos básicos y nº 41;

Vea también

Crear una consulta de predicción con el Generador de consultas de predicción