Microsoft 关联算法遍历数据集以查找同时出现在某个事例中的项。然后,该算法按照由 MINIMUM_SUPPORT 参数指定的事例数,将出现次数最少的关联项分组为项集。例如,项集可以为“Mountain 200=Existing, Sport 100=Existing”,并且支持的数目可以为 710,那么该算法将根据项集生成规则。可以使用这些规则根据是否存在该算法标识为重要项的其他特定项,预测数据库中的某项是否存在。例如,某规则可以为“if Touring 1000=existing and Road bottle cage=existing, then Water bottle=existing”,并且其概率可能为 0.812。在此例中,该算法发现由于购物篮中存在 Touring 1000 轮胎和水壶套,因此预测购物篮中也可能存在水壶。
有关该算法以及在挖掘模型中自定义该算法行为并控制结果的参数列表的更多详细说明,请参阅 Microsoft 关联算法技术参考。