分析关键影响因素视频教程(数据挖掘表分析工具)

适用于:Microsoft SQL Server Analysis Services

作者:Michele Hart,Microsoft Corporation

解说:Mary Brennan,Microsoft Corporation

时长:00:4:48

大小:6,892 KB

类型:WMV 文件

观看此视频

相关帮助主题:

数据挖掘算法(Analysis Services – 数据挖掘)

其他视频:

表分析工具入门(SQL Server 视频)

检测类别视频教程(数据挖掘表分析工具)

从示例填充视频教程(数据挖掘表分析工具)

预测视频教程(数据挖掘表分析工具)

突出显示异常值视频教程(数据挖掘表分析工具)

预测计算器视频教程(数据挖掘表分析工具)

应用场景分析 - 目标查找视频教程(Excel 数据挖掘外接程序)

应用场景分析 -“假设”视频教程(Excel 数据挖掘外接程序)

购物篮分析视频教程(数据挖掘表分析工具)

视频摘要

在本教程中,我们将学习如何使用 Excel 2007 分析关键影响因素表分析工具。

视频脚本

简介

您好,我叫 Mary Brennan,是 Microsoft SQL Server 的技术写作人员。

分析关键影响因素工具使用 Microsoft 聚类分析算法,使您能够选择包含所需结果或目标值的列,然后分析数据中的模式,以确定哪些因素对于该结果的影响最大。例如,如果您的客户列表包含一列,该列显示每个客户去年的总购买情况,则您可以对该表进行分析,以确定排在前几位的购买者的共同特性。

通过此工具,您还可以选择一对可能的结果并进行比较。例如,如果您要预测的列包含离散值(例如,Purchase = YesPurchase = NoPurchase = Yes but not now,则您可以对立即购买的客户与以后购买的客户进行比较,以及对以后购买的客户与始终不会购买的客户进行比较。这有助于确定影响购买的重要因素。

在这个教程中,我们将找出影响决定是否购买自行车的因素。然后,我们可以使用此信息来确定最可能购买我们产品的客户。

向导

  1. 开始时,选择**“表分析工具示例”(Table Analysis Tools Sample)** 选项卡,然后单击表内的任何地方以激活表分析工具。
  2. 在**“表工具”(Table Tools)** 菜单下,选择**“分析”(Analyze)** 选项卡,从而打开**“表分析工具”(Table Analysis Tools)** 功能区。
  3. 双击**“分析关键影响因素”(Analyze Key Influencers)** 以启动向导。
  4. 在向导对话框中,选择要分析的列。此向导自动默认为工作表中的第一列,但我们希望查看自行车购买情况。如果我们现在单击**“运行”(Run)**,则将对所有列执行分析。然而,我们将…
  5. 单击**“选择分析时要使用的列”(Choose columns to be used for analysis)。在“高级列选择”(Advanced Columns Selection)** 对话框中,选择最可能影响自行车销售的列。我们希望查明**“婚姻状况”(Marital Status)“拥有的汽车数”(Number of Cars Owned)“区域”(Region)** 和**“性别”(Gender)** 如何影响自行车销售情况。通过简化我们的分析,可以改进性能和准确性。
  6. 单击**“运行”(Run)。如果检测到模式,向导将在一个新工作表中创建一个报表来显示这些模式。该报表名称为“采购的自行车的关键影响因素”(Key Influencers for <Purchased Bike>)**。如果未检测到模式,向导将创建一个新工作表,其中包含有关此问题的说明。

报表

打开**“采购的自行车的关键影响因素报表”(Key Influencers for Purchased Bike report)**。该表报告与每个结果关联的因素,并以图形方式显示关系的概率。

  1. 查看我们的结果时,我注意到的第一件事情是未列出**“性别”(Gender)**,这表明性别对于自行车购买影响不大。
  2. 结果是根据每种可能的**“采购的自行车”(Purchased Bike)** 值,按照影响程度从高到低的顺序列出。不购买自行车的最重要的影响因素是拥有两辆汽车。而购买自行车的最重要的影响因素是没有汽车。
  3. 现在,我们进一步对此报表进行自定义,并更深入地考察结果。在**“基于关键影响因素的对比”(Discrimination based on key influencers)** 对话框中,我们可以创建一个新报表,此报表比较每种可能的结果。我们实际所做的是筛选结果并深入分析模型,以发现特定的属性并突出显示两个关键影响因素之间的差异。在此情况下,我们只有两个值:“是”(Yes) 和**“否”(No)**。
  4. 单击**“添加报表”(Add Report)**。
    向导为每一对因素比较创建一个新表。因为我们只有两个值,所以,该表是相同数据的不同视图。
  5. 当您完成比较后,单击**“关闭”(Close)**。

在本教程中,我们看到一个只具有两个值(“Yes”和“No”)的列。在更复杂的示例中,您可以针对具有多个值的结果分析影响因素。例如,“采购的自行车数目”(Number of Bikes Purchased) 可能具有以下各值:01234,等等。或者,使用同一个数据库,我们可以查看**“区域”(Region)** 的关键影响因素,然后深化并比较**“太平洋”(Pacific)** 和**“北美”(North America)**。

结论

上面的内容总结了分析关键影响因素视频教程。有关表分析工具的其他帮助,建议您查看其他表分析工具视频教程,以及 Excel 数据挖掘外接程序随附的帮助文档。感谢您观看此视频教程。