Modelos de minería de datos (Analysis Services - Minería de datos)

Esta sección explica la arquitectura básica de un modelo de minería de datos, proporciona información general de sus propiedades y describe las maneras en que se puede crear un modelo de minería de datos y trabajar con él.

Mining Model Architecture

Defining Mining Models

Mining Model Properties

Mining Model Columns

Processing Mining Models

Viewing and Querying Mining Models

Arquitectura del modelo de minería de datos

Un modelo de minería de datos recibe los datos de una estructura de minería de datos y, a continuación, los analiza utilizando un algoritmo de minería de datos. La estructura y el modelo de minería de datos son objetos independientes. La estructura de minería de datos almacena la información que define el origen de datos. Un modelo de minería de datos almacena la información derivada del procesamiento estadístico de los datos, como los patrones encontrados como resultado del análisis.

Un modelo de minería de datos está vacío hasta que los datos que proporciona la estructura de minería de datos se procesan y analizan. Una vez procesado el modelo, contiene los metadatos, resultados y enlaces de la estructura de minería de datos.

el elemento contiene los metadatos, patrones y enlaces

Los metadatos especifican el nombre del modelo y el servidor donde están almacenados, así como una definición del mismo, incluida una lista de las columnas de la estructura de minería de datos que se utilizaron para generarlo, las definiciones de los filtros opcionales que se aplican al procesarlo y el algoritmo empleado para analizar los datos. La elección de las columnas, los filtros y el algoritmo influye en gran medida en los resultados del análisis. Por ejemplo, si crea un modelo de agrupación en clústeres y un modelo de árboles de decisión con los mismos datos, el contenido del modelo podría ser muy diferente, ya que estos modelos utilizan algoritmos y filtros diferentes. Para obtener más información, vea Contenido del modelo de minería de datos (Analysis Services - Minería de datos).

Los resultados que están almacenados en el modelo varían dependiendo del algoritmo, pero pueden incluir patrones, conjuntos de elementos, reglas y fórmulas. Estos resultados se pueden utilizar para realizar predicciones.

Los enlaces que están almacenados en el modelo señalan a los datos almacenados en memoria caché en la estructura de minería de datos. Si los datos se han almacenado en memoria caché en la estructura y no se han borrado después del procesamiento, estos enlaces le permiten obtener detalles de los resultados para llegar a los casos que admiten los resultados. Sin embargo, los datos reales están almacenados en la memoria caché de la estructura, no en el modelo.

[Arriba]

Definir modelos de minería de datos

Puede crear un modelo de minería de datos en los pasos siguientes:

  • Cree la estructura de minería de datos subyacente.

  • Seleccione un algoritmo.

  • Especifique las columnas y el uso del modelo.

  • Opcionalmente, puede establecer los parámetros para ajustar el procesamiento del algoritmo.

  • Procese el modelo.

Analysis Services proporciona las herramientas siguientes para ayudarle a administrar los modelos de minería de datos:

  • El Asistente para minería de datos le ayuda a crear una estructura y el modelo de minería de datos relacionado. Éste es el método más fácil de utilizar. El asistente crea automáticamente la estructura de minería de datos necesaria y le ayuda con la configuración de los valores importantes.

  • Una instrucción DMX CREATE MODEL se puede utilizar para definir un modelo. La estructura necesaria se crea automáticamente como parte del proceso; por consiguiente, no puede reutilizar una estructura existente con este método. Utilice este método si ya sabe exactamente qué modelo desea crear.

  • Una instrucción DMX ALTER STRUCTURE ADD MODEL se puede utilizar para agregar un nuevo modelo de minería de datos a una estructura existente. Utilice este método si desea experimentar con diferentes modelos que se basen en el mismo conjunto de datos.

También puede crear mediante programación modelos de minería de datos, utilizando AMO o XML/A, u otros clientes como el Cliente de minería de datos para Excel. Para obtener más información, vea los siguientes temas:

Objetos de administración de análisis (AMO)

[Arriba]

Propiedades del modelo de minería de datos

Cada modelo de minería de datos tiene propiedades que definen el modelo y sus metadatos. Éstos podrían incluir el nombre, la descripción, la fecha en que se procesó el modelo en último lugar, los permisos del modelo y los filtros que se utilizan en los datos para el aprendizaje.

Cada modelo de minería de datos también tiene propiedades que se derivan de la estructura de minería de datos y que describen las columnas de datos que usa. Si la columna es una tabla anidada, también se le puede aplicar un filtro independiente.

Además, cada modelo de minería de datos contiene dos propiedades especiales: Algorithm y Usage.

  • Propiedad del algoritmo: especifica el algoritmo que se utiliza para crear el modelo. Los algoritmos que están disponibles dependen del proveedor que se use. Para obtener una lista de los algoritmos que se incluyen con SQL ServerAnalysis Services, vea Algoritmos de minería de datos (Analysis Services: Minería de datos). La propiedad Algorithm se aplica al modelo de minería de datos y puede establecerse solo una vez para cada modelo. Puede cambiar el algoritmo más tarde pero algunas columnas del modelo de minería de datos podrían dejar de ser válidas si el algoritmo elegido no las admite. Es más, siempre debe volver a procesar el modelo después de los cambios.

  • La propiedad Usage define cómo usa el modelo cada columna. Puede definir el uso de la columna como Input, Predict, Predict Only o Key. La propiedad Usage se aplica a las columnas de modelo de minería de datos individuales y debe establecerse individualmente para cada columna que se incluye en un modelo. Si la estructura contiene una columna que no se usa en el modelo, el uso se establece en Ignore.

Puede cambiar el valor de las propiedades de un modelo de minería de datos después de crearlo. Sin embargo, cualquier cambio, incluso el nombre del modelo, requiere que vuelva a procesarlo. Después de volver a procesar el modelo, podría ver resultados diferentes.

[Arriba]

Columnas del modelo de minería de datos

Al igual que la estructura, el modelo de minería de datos contiene columnas. Puede elegir qué columnas de la estructura de minería de datos desea usar en el modelo. Además de usar las columnas que están en la estructura de minería de datos subyacente, puede crear copias de las mismas y, a continuación, cambiar su nombre o su utilización.

Según el algoritmo que elija, algunas columnas de la estructura de minería de datos podrían ser incompatibles con el modelo o podrían conducir a resultados inexactos. Debería revisar cuidadosamente los datos de la estructura e incluir en el modelo sólo las columnas que tengan sentido para el análisis. Si cree que una columna no se debería utilizar, no es necesario eliminarla de la estructura o del modelo de minería de datos; en su lugar, basta con establecer un marcador en la columna que especifique que se debería omitir al generar el modelo. Esto significa que la columna permanecerá en la estructura de minería de datos, pero no se utilizará en el modelo; sin embargo, si se permite obtener detalles del modelo para la estructura, puede recuperar después la información de la columna.

Después de haber creado el modelo, puede realizar cambios como agregar o quitar columnas, o cambiar el nombre del modelo. Sin embargo, cualquier cambio, incluidos sólo los de los metadatos del modelo, requiere que el modelo se vuelva a procesar.

Para obtener más información, vea Columnas de la estructura de minería de datos y Columnas del modelo de minería de datos.

[Arriba]

Procesar modelos de minería de datos

Un modelo de minería de datos es un objeto vacío hasta que se procesa. Al procesar un modelo, los datos que la estructura almacena en memoria caché se pasan a través de un filtro, si se ha definido alguno en el modelo, y algoritmo los analiza. El algoritmo identifica las reglas y los patrones en los datos, y después utiliza dichas reglas y patrones para rellenar el modelo. Para obtener más información acerca del modo en que se utilizan los algoritmos para crear modelos de minería de datos, vea Algoritmos de minería de datos (Analysis Services: Minería de datos).

Una vez procesado, el modelo de minería de datos también almacena información sobre los resultados del análisis. Para obtener más información acerca de la clase de datos que se almacenan en un modelo de minería de datos, vea Contenido del modelo de minería de datos (Analysis Services - Minería de datos).

[Arriba]

Ver y consultar modelos de minería de datos

Después de haber procesado un modelo, puede explorarlo utilizando los visores personalizados que se proporcionan en Business Intelligence Development Studio y SQL Server Management Studio. Para obtener más información acerca de los visores personalizados de Analysis Services, vea Ver un modelo de minería de datos.

También puede crear consultas con el modelo de minería de datos para realizar predicciones o recuperar los metadatos del modelo o los patrones que este crea. Las consultas se crean con Extensiones de minería de datos (DMX). Para obtener información sobre los diferentes tipos de consultas que puede utilizar con un modelo de minería de datos, vea Consultar modelos de minería de datos (Analysis Services - Minería de datos).