更新日期:
2009 年 4 月 30 日
仅适用于聚类分析模型。此函数返回输入事例适合现有模型的可能性。
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
- NORMALIZED
-
返回值包含事例在模型中的概率除以事例不在模型中的概率所得的值。
- NONNORMALIZED
-
返回值包含事例的原始概率,即事例属性概率的乘积。
使用 Microsoft 聚类分析和 Microsoft 顺序分析和聚类分析算法生成的模型。
介于 0 和 1 之间的双精度浮点数。该数值越接近 1,则指示事例出现在此模型中的概率越高。该数值越接近 0,则指示事例越不可能出现在此模型中。
默认情况下,PredictCaseLikelihood 函数的结果将被规范化。通常,当事例中的属性个数增加,并且任何两个事例的原始概率之间的差异大大缩小时,规范化的值更为有用。
下面的公式用于计算规范化的值(给定 x 和 y):
-
x = 事例基于聚类分析模型的可能性
-
y = 边缘事例可能性(计算为事例基于计数定型事例的对数可能性)
-
Z = Exp( log(x) – Log(Y))
规范化值 = (z/ (1+z))
以下示例返回在聚类分析模型(在数据挖掘基础教程中创建)内出现指定事例的可能性。
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
预期的结果:
|
Default_Likelihood
|
Normalized_Likelihood
|
Raw_Likelihood
|
|---|
|
6.30672792729321E-08
|
6.30672792729321E-08
|
9.5824454056846E-48
|
|
更新的内容
|
|---|
|
改正了示例,以便准确显示原始规范化和非规范化(原始)概率之间的差异。
|
参考
数据挖掘扩展插件 (DMX) 函数参考
函数 (DMX)
将函数映射到查询类型 (DMX)
其他资源
数据挖掘算法(Analysis Services – 数据挖掘)
帮助和信息
获取 SQL Server 2008 帮助