Алгоритм интеллектуального анализа данных представляет собой механизм, создающий модель интеллектуального анализа данных. Чтобы создать модель, алгоритм сначала анализирует набор данных, осуществляя поиск определенных закономерностей и трендов. Алгоритм использует результаты этого анализа для определения параметров модели интеллектуального анализа данных. Затем эти параметры применяются ко всему набору данных, чтобы выявить пригодные к использованию закономерности и получить подробную статистику.
Модель интеллектуального анализа данных, созданная алгоритмом, может иметь различные формы, включая следующие.
-
Набор правил, описывающих группирование продуктов в транзакции.
-
Дерево принятия решений, прогнозирующее, купит ли конкретный заказчик продукт.
-
Математическую модель, прогнозирующую продажи.
-
Набор кластеров, описывающих связи вариантов в наборе данных.
Службы Microsoft SQL Server Analysis Services предоставляют несколько алгоритмов для использования в решениях интеллектуального анализа данных. Эти алгоритмы являются подмножеством всех алгоритмов, которые могут использоваться для интеллектуального анализа данных. Можно также использовать алгоритмы сторонних производителей, соответствующие спецификации OLE DB для интеллектуального анализа данных. Дополнительные сведения об алгоритмах сторонних производителей см. в разделе Подключаемые алгоритмы.
Типы алгоритмов интеллектуального анализа данных
Службы Analysis Services включают следующие типы алгоритмов.
Выбор правильного алгоритма для использования в конкретной экономической задаче может быть достаточно сложным. В то время как можно использовать различные алгоритмы для выполнения одной и той же задачи, каждый алгоритм выдает различный результат, а некоторые алгоритмы могут выдавать более одного типа результатов. Например, можно использовать алгоритм дерева принятия решений (Майкрософт) не только для прогнозирования, но также в качестве способа уменьшения количества столбцов в наборе данных, поскольку дерево принятия решений может идентифицировать столбцы, не влияющие на конечную модель интеллектуального анализа данных.
Не обязательно применять алгоритмы независимо друг от друга. В одном решении интеллектуального анализа данных можно использовать несколько алгоритмов для просмотра данных, а затем на основе результатов предсказать конкретный итог с помощью других алгоритмов. Например, можно использовать алгоритм кластеризации, распознающий закономерности, для разделения данных на группы, являющиеся более или менее однородными, а затем использовать эти результаты для создания более точной модели дерева принятия решений. Можно использовать несколько алгоритмов в одном решении для выполнения различных задач, например алгоритм дерева регрессии для получения данных для финансового прогнозирования и алгоритм на основе правил для выполнения анализа потребительской корзины.
Модели интеллектуального анализа данных могут прогнозировать значения, создавать обобщения данных и находить скрытые корреляции. Для облегчения выбора алгоритмов для решения интеллектуального анализа данных в следующей таблице приведены рекомендации по использованию алгоритмов для конкретных задач.
Поскольку каждая модель возвращает различные типы результата, службы Analysis Services предоставляют отдельное средство просмотра для каждого алгоритма. При просмотре модели интеллектуального анализа данных в службах Analysis Services модель отображается на вкладке Средство просмотра моделей интеллектуального анализа данных конструктора интеллектуального анализа данных с использованием соответствующего средства просмотра для данной модели. Дополнительные сведения см. в разделе Просмотр модели интеллектуального анализа данных.
Подробные сведения об алгоритмах
В следующей таблице приводятся ссылки на типы сведений, доступных для каждого алгоритма.
-
Общее описание алгоритма. Содержит общее объяснение работы алгоритма и пример бизнес-сценария, в котором алгоритм может быть полезен.
-
Технический справочник. Приводит список параметров, с помощью которых можно управлять работой алгоритма и изменять результаты в модели. Содержит дополнительные технические данные о реализации алгоритма, советы по повышению производительности и требования к данным.
-
Запросы к модели. Предоставляет примеры запросов, которые можно использовать с моделями каждого типа. Можно запрашивать модель для получения дополнительных сведений о закономерностях в модели и для составления прогнозов на основе этих закономерностей.
-
Содержимое модели интеллектуального анализа данных. Описывает, каким образом данные хранятся в общей структуре для всех типов моделей, и объясняет, как интерпретировать эти данные. После построения модели можно просмотреть ее с помощью средств просмотра, доступных в среде BI Development Studio, или написать запросы для получения данных непосредственно из содержимого модели, используя расширения интеллектуального анализа данных.
Основные понятия
Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
Подключаемые алгоритмы
Другие ресурсы
Справочник по расширениям интеллектуального анализа данных
Использование средств интеллектуального анализа данных
Справка и информация
Получение помощи по SQL Server 2008