Arquitectura lógica (Analysis Services - Minería de datos)

Se aplica a: SQL Server 2019 y versiones anteriores de Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

La minería de datos estaba en desuso en SQL Server 2017 Analysis Services y ahora se ha interrumpido en SQL Server 2022 Analysis Services. La documentación no se actualiza para las características en desuso e interrumpidas. Para más información, consulte Compatibilidad con versiones anteriores de Analysis Services.

La minería de datos es un proceso que implica la interacción de varios componentes.

  • Puede tener acceso a orígenes de datos en una base de datos de SQL Server o cualquier otro origen de datos y usarlos para el entrenamiento, las pruebas o la predicción.

  • Las estructuras y modelos de minería de datos se definen mediante SQL Server Data Tools o Visual Studio.

  • Los objetos de minería de datos se administran y se crean predicciones y consultas mediante SQL Server Management Studio.

  • Una vez completada la solución, se implementa en una instancia de SQL Server Analysis Services.

El proceso de creación de estos objetos de la solución se ha descrito previamente en otro lugar. Para obtener más información, vea Soluciones de minería de datos.

En las secciones siguientes se describe la arquitectura lógica de los objetos de una solución de minería de datos.

Datos de origen de la minería de datos

Estructuras de minería de datos

Modelos de minería de datos

Objetos de minería de datos personalizados

Datos de origen de la minería de datos

Los datos que se usan en la minería de datos no se almacenan en la solución de minería de datos; solo se almacenan los enlaces. Los datos podrían residir en una base de datos creada en una versión anterior de SQL Server, en un sistema CRM o incluso en un archivo plano. Cuando se entrena la estructura o el modelo mediante un proceso, se crea un resumen estadístico de los datos y se almacena en una memoria caché que puede conservarse para usarse en operaciones posteriores, o puede eliminarse después del procesamiento. Para obtener más información, vea Estructuras de minería de datos (Analysis Services - Minería de datos).

Los datos dispares se combinan en el objeto SQL Server Analysis Services vista del origen de datos (DSV), que proporciona una capa de abstracción sobre el origen de datos. También puede especificar combinaciones entre tablas o agregar tablas que tengan una relación de varios a uno para crear columnas de tabla anidadas. La definición de estos objetos, el origen de datos y la vista del origen de datos, se almacena en la solución con las extensiones de archivo *.ds y *.dsv. Para obtener más información sobre cómo crear y usar SQL Server Analysis Services orígenes de datos y vistas de orígenes de datos, vea Orígenes de datos admitidos (SSAS - Multidimensional).

También puede definir y modificar orígenes de datos y vistas del origen de datos utilizando AMO o XMLA. Para obtener más información sobre cómo trabajar con estos objetos mediante programación, vea Información general sobre la arquitectura lógica (Analysis Services - Datos multidimensionales).

Estructuras de minería de datos

Una estructura de minería de datos es un contenedor de datos lógico que define el dominio de datos a partir del cual se generan los modelos de minería de datos. Una sola estructura de minería de datos puede admitir varios modelos de minería de datos.

Cuando tenga que usar los datos en la solución de minería de datos, Analysis Services leerá los datos del origen y genera una memoria caché de agregados y otra información. De forma predeterminada, esta memoria caché se mantiene para poder reutilizar datos de entrenamiento y admitir modelos adicionales. Si necesita eliminar la memoria caché, cambie la propiedad CacheMode en el objeto de estructura de minería de datos por el valor ClearAfterProcessing. Para obtener más información, vea Clases de minería de datos de AMO.

Analysis Services también proporciona la capacidad de separar los datos en conjuntos de datos de entrenamiento y pruebas, de modo que pueda probar los modelos de minería de datos en un conjunto representativo seleccionado aleatoriamente de datos. Los datos no se almacenan en realidad por separado; en su lugar, los datos de caso de la memoria caché de la estructura se marcan con una propiedad que indica si ese caso se utiliza para el entrenamiento o para las pruebas. Si la memoria caché se elimina, esta información no se puede recuperar.

Para obtener más información, vea Estructuras de minería de datos (Analysis Services - Minería de datos).

Una estructura de minería de datos puede contener tablas anidadas. Una tabla anidada proporciona detalles adicionales sobre el caso que se modela en la tabla de datos principal. Para obtener más información, vea Tablas anidadas (Analysis Services - Minería de datos)

Modelos de minería de datos

Antes del procesamiento un modelo de minería de datos solo es una combinación de propiedades de metadatos. Estas propiedades especifican una estructura de minería de datos, especifican un algoritmo de minería de datos y definen una colección de parámetros y configuraciones de filtro que afectan al modo en que se procesan los datos. Para obtener más información, vea Modelos de minería de datos (Analysis Services - Minería de datos).

Al procesar el modelo, los datos de entrenamiento que se almacenan en la memoria caché de la estructura de minería de datos se utilizan para generar los patrones, según las propiedades estadísticas de los datos y la heurística definida por el algoritmo y sus parámetros. Esto se conoce como entrenamiento del modelo.

El resultado del entrenamiento es un conjunto de datos de resumen, contenido en el contenido del modelo, que describe los patrones encontrados y proporciona las reglas con las que generar predicciones. Para obtener más información, vea Contenido del modelo de minería de datos (Analysis Services - Minería de datos).

En escenarios limitados, la estructura lógica del modelo también se puede exportar a un archivo que representa las fórmulas y los enlaces de datos según un formato estándar, el lenguaje de marcado de modelado de predicción (PMML). Esta estructura lógica se puede importar en otros sistemas que utilizan PMML y el modelo así descrito puede utilizarse entonces para la predicción. Para obtener más información, vea Descripción de la instrucción Select de DMX.

Objetos de minería de datos personalizados

Otros objetos que se usan en el contexto de un proyecto de minería de datos, como los gráficos de precisión o las consultas de predicción, no se conservan en la solución, pero se pueden incluir en un script mediante ASSL o se pueden generar con AMO.

Además, puede ampliar los servicios y características disponibles en una instancia de SQL Server Analysis Services agregando estos objetos personalizados:

Ensamblados personalizados
Los ensamblados .NET pueden definirse mediante cualquier idioma compatible con COM o CLR y, a continuación registrarse con una instancia de SQL Server. Los archivos de ensamblado se cargan desde la ubicación definida por la aplicación ; en el servidor se guarda una copia junto con los datos. La copia del archivo de ensamblado se usa para cargar el ensamblado cada vez que se inicia el servicio.

Para obtener más información, vea Administración de ensamblados de modelos multidimensionales.

Procedimientos almacenados personalizados
SQL Server Analysis Services minería de datos admite el uso de procedimientos almacenados para trabajar con objetos de minería de datos. Puede crear sus propios procedimientos almacenados para ampliar la funcionalidad y trabajar más fácilmente con los datos devueltos por las consultas de predicción y las consultas de contenido.

Definición de procedimientos almacenados

Los procedimientos almacenados siguientes pueden usarse al realizar la validación cruzada.

Procedimientos almacenados de minería de datos (Analysis Services - Minería de datos)

Además, SQL Server Analysis Services contiene muchos procedimientos almacenados del sistema que se usan internamente para la minería de datos. Aunque los procedimientos almacenados del sistema son para uso interno, es posible le resulten útiles. Microsoft se reserva el derecho de cambiar estos procedimientos almacenados según sea necesario; por consiguiente, para utilizarlos en producción, se recomienda crear consultas con DMX, AMO o XMLA.

Crear algoritmos de complemento
SQL Server Analysis Services proporciona un mecanismo para crear sus propios algoritmos y, a continuación, agregar los algoritmos como un nuevo servicio de minería de datos a la instancia del servidor.

Analysis Services utiliza las interfaces COM para comunicarse con los algoritmos de complemento. Para obtener más información sobre cómo implementar nuevos algoritmos, vea Plugin Algorithms.

Debe registrar cada nuevo algoritmo para poder usarlo. Para registrar un algoritmo, agregue los metadatos necesarios para los algoritmos en el archivo .ini de la instancia de SQL Server Analysis Services. Debe agregar la información a cada instancia donde piense utilizar el nuevo algoritmo. Después de agregar el algoritmo, puede reiniciar la instancia y utilizar el conjunto de filas de esquema MINING_SERVICES para ver el nuevo algoritmo, incluidas las opciones y los proveedores que el algoritmo admite.

Consulte también

Procesar un modelo multidimensional (Analysis Services)
Referencia de Extensiones de minería de datos (DMX)