检测类别视频教程(数据挖掘表分析工具)

适用于:Microsoft SQL Server Analysis Services

作者:Michele Hart,Microsoft Corporation

解说:Mary Brennan,Microsoft Corporation

长度:00:6:39

大小:18,295 KB

类型:WMV 文件

观看此视频

相关帮助主题:

数据挖掘算法(Analysis Services – 数据挖掘)

数据透视表和数据透视图报表概述

其他视频:

表分析工具入门(SQL Server 视频)

分析关键影响因素视频教程(数据挖掘表分析工具)

从示例填充视频教程(数据挖掘表分析工具)

预测视频教程(数据挖掘表分析工具)

突出显示异常值视频教程(数据挖掘表分析工具)

预测计算器视频教程(数据挖掘表分析工具)

应用场景分析 - 目标查找视频教程(Excel 数据挖掘外接程序)

应用场景分析 -“假设”视频教程(Excel 数据挖掘外接程序)

购物篮分析视频教程(数据挖掘表分析工具)

视频摘要

在此教程中,我们将学习如何使用适用于 Excel 2007 的“检测类别”表分析工具。

视频脚本

简介

您好,我是 Mary Brennan。我是 Microsoft SQL Server 的技术撰稿人。

“检测类别”工具使用 Microsoft 聚类分析算法自动查找表中具有类似特征的行。

完成后,该工具将创建一个报表,列出找到的类别及其区别特征。默认情况下,该工具会向数据表中添加一个新列,其中包含针对每行数据的建议类别。然后,您可查看这些类别,还可以重命名它们。

向导

开始前,我们先复制一份 Table Analysis Tools Sample 工作表。

当使用“检测类别”工具时,它会在原始数据表中创建一个新列。如果执行后续数据挖掘操作,那么创建的新列会对您的操作结果产生影响。为了防止产生影响,我们先将该工作表复制一份。

  1. 右键单击 Table Analysis Tools Sample 选项卡并选择**“移动或复制工作表 (Move or Copy)”**。
  2. 选中**“建立副本 (Create a copy)”**。
  3. 突出显示 Table Analysis Tools Sample,从而将创建的副本放在原始数据表之前。
  4. 单击**“确定 (OK)”**。
  5. 选择 Table Analysis Tools Sample (2) 选项卡并单击表中的任意位置,从而激活表分析工具。
  6. 在**“表工具 (Table Tools)”菜单下,选择“分析 (Analyze)”选项卡,从而打开“表分析工具 (Table Analysis Tools)”**功能区。
  7. 单击**“检测类别 (Detect Categories)”**,从而启动向导。
  8. 在向导对话框中,请指定要在分析中使用的列。您可取消选择具有非重复值的列,例如人员姓名或记录 ID,因为这些列可能对分析没有用。请注意,系统将自动取消选择 ID 列。我们将保留其他选择的列不动。
  9. 根据需要,您还可以指定能够创建的最大类别数。默认情况下,该工具自动创建的类别数与它找到的类别数相同。我们将保留默认设置不变。
  10. 选中**“将一个类别列追加到原始 Excel 表 (Append a Category column to the original Excel table)”**选项。
  11. 单击**“运行 (Run)”**。

该工具会创建名为“分类报表 (Categories Report)”的新工作表,其中列有找到的类别及其特征。

报表

**“分类报表 (Categories Report)”包含两个表和一个“类别配置文件 (Category Profiles)”**图表。浏览这些结果,我们可以发现数据中存在的模式,从而帮助我们了解我们的客户。

第一个表列出了使用临时名称标识的新类别,并显示了归入该类别的原始数据行数。

第二个表是**“类别特征 (Category Characteristics)”表,它显示了在每个类别中找到的类似特征的详细信息。单击“类别 (Category)”列上方的“筛选 (Filter)”**按钮可以查看其他类别的特征。

**“相对重要性 (Relative importance)”**阴影条指示属性和值对作为区别因素的重要程度。阴影条越长,该属性代表此类别的可能性就越大。

在此示例中,我们可以看到**“类别 1 (Category 1)”是由低收入和上下班距离较近的欧洲客户组成。我们就利用此信息给“类别 1 (Category 1)”**指定一个更有意义的名称。

  1. 在第一个表中,双击以选择**“类别 1 (Category 1)”**。
  2. 然后键入**“欧洲,收入低,上下班距离近 (Eur Low-Income, Short Commute)”**。
  3. 然后,将此列加宽以显示整个标签。

新的类别标签就会立即传播到其他图表以及源数据工作表中的类别分配列。但是,新的类别标签不会传播到**“类别配置文件 (Category Profiles)”**图表。

页面底部的**“类别配置文件 (Category Profiles)”**图表是一个交互工具,可以用来帮助您更加详细地浏览所查找的结果。

单击此图表中的任意位置,可以显示透视表图表控件,可以用此图表控件交互地对各字段进行筛选和重新排列。

同时,Excel 菜单功能区也会显示**“透视表工具 (PivotChart Tools)”**选项卡,其中包含各种选项,可以用来对图表进行重新格式化,对数据进行重新排列、合并和操作。

接下来,我们要做的就是对此图表进行更新,从而显示我们的新类别名称。

单击图表区域之外,然后按组合键 CTRL-ALT-F5,即可显示新的标签。请记住,当更改上面任意一个表时,需要使用组合键 CTRL-ALT-F5 或透视表控件对图表进行更新。

从图表中我们可以看出**“类别 3 (Category 3)”**是由非常年青的客户组成。蓝条代表年龄 Very Low,红条代表年龄 Low

让我们看一下其他的列。

  1. 在**“透视表字段列表 (PivotTable Field List)”中,选择“列 (Column)”**。
  2. 取消选择字段 Age,增加选择字段 Region
  3. 然后,单击**“确定 (OK)”**。
  4. 这时,在图表的右边,代表“类别 1”的**“欧洲,收入低,上下班距离近 (European Low-Income Short-Commute)”**类别就会显示很大百分比的欧洲客户。

针对此图表,您还可以进行很多操作。此视频的启动页上提供有使用透视表相关的链接,您可以通过这些链接了解更多信息。

让我们先返回到数据。

  1. 单击 Table Analysis Tools Sample (2) 选项卡。我们的名为**“类别 (Category)”**的新列就会显示在表的最右边。我们可以使用“类别 (Category)”字段对数据进行排序和筛选。
  2. 在**“类别 (Category)”下拉菜单的“文本筛选 (Text Filters)”下,选中“欧洲,收入低,上下班距离近 (Eur Low-Income, Short Commute)”**旁的复选框。
  3. 然后,单击**“确定 (OK)”**。
  4. 这样,就完成了使用“类别 (Category)”字段对数据进行排序和筛选的操作。

结论

“检测类别”视频教程到此结束。若要寻求表分析工具方面的更多帮助,建议您观看其他表分析工具的视频教程,并参阅随 Excel 数据挖掘外接程序一起提供的帮助文档。感谢您观看此视频教程。