准备用于定型顺序分析和聚类分析模型的数据时,应理解特定算法的要求,其中包括所需要的数据量以及使用数据的方式。
顺序分析和聚类分析模型的要求如下:
-
单个
key
列 顺序分析和聚类分析模型需要一个用来标识记录的键。
-
顺序列 对于顺序数据,模型必须具有包含顺序 ID 列的嵌套表。顺序 ID 可以为任何可排序的数据类型。例如,可以使用数据类型为网页标识符、整数或文本字符串的列,只要该列可以标识顺序中的事件。每个顺序只允许有一个顺序标识符,且每个模型中只允许有一种类型的顺序。
-
可选的非顺序属性 该算法支持添加与顺序无关的其他属性。这些属性可以包含嵌套列。
例如,在前面引用的 AdventureWorks 网站的示例中,顺序分析和聚类分析模型可以包含订单信息(作为事例表)、每个订单的具体客户的人口统计数据(作为非顺序属性)以及包含客户浏览网站和将商品放入购物车的顺序的嵌套表(作为顺序信息)。
有关顺序分析和聚类分析模型支持的内容类型和数据类型的详细信息,请参阅 Microsoft 顺序分析和聚类分析算法技术参考(Analysis Services – 数据挖掘)的“要求”一节。