Apriori算法怎么理解

发布时间:2022-01-18 11:20:58 作者:柒染
来源:亿速云 阅读:203

这篇文章的内容主要围绕Apriori算法怎么理解进行讲述,文章内容清晰易懂,条理清晰,非常适合新手学习,值得大家去阅读。感兴趣的朋友可以跟随小编一起阅读吧。希望大家通过这篇文章有所收获!

1. Apriori算法的目的:

主要是用来挖掘关联规则,即从一个事务数据集中发现频繁项集并推出关联规则,其名字是因为算法基于先验知识(prior knowledge).根据前一次找到的频繁项来生成本次的频繁项。Apriori是关联分析中核心的算法。

Apriori算法的特点:

只能处理分类变量,无法处理数值型变量;

数据存储可以是交易数据格式(事务表),或者是事实表方式(表格数据)。

算法核心在于提升关联规则产生的效率而设计的。

2. 新概念:

项集:(例如所有的商品)为一个项集,则每一个事务t(例如购买小票上的商品)都是一个项集。

支持度:    项集的支持度是指包含该项集的事务所占所有事务的比例。

频繁项集:就是指满足给定的最小支持度的项集。

关联规则:X->Y 是指由X能推出Y

置信度:   对于X->Y的置信度表示p(X,Y)/p(X); 即项集X事务中也包含项集Y的事务所占的比例

3. Apriori的思想:

我们希望置信度和支持度要满足我们的阈值范围才算是有效的规则,实际过程中我们往往会面临大量的数据,如果只是简单的搜索,会出现很多的规则,相当大的一部分是无效的规则,效率很低,那么Apriori就是通过产生频繁项集,然后再依据频繁项集产生规则,进而提升效率。

以上所说的代表了Apriori算法的两个步骤:产生频繁项集和依据频繁项集产生规则。

为什么确定频繁项集?

刚才说了,必须支持度大于我们指定的支持度,这也就是说能够确定后面生成的规则是在普遍代表性上的项目集生成的,因为支持度本身的高低就代表了我们关联分析结果是否具有普遍性。

感谢你的阅读,相信你对“Apriori算法怎么理解”这一问题有一定的了解,快去动手实践吧,如果想了解更多相关知识点,可以关注亿速云网站!小编会继续为大家带来更好的文章!

推荐阅读:
  1. 学习日志---Apriori算法发现频繁集
  2. 深度解析数据挖掘关联规则Apriori算法

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

上一篇:Port Mapper反射DDoS攻击预警的示例分析

下一篇:如何分析API网关的产品架构和常见应用场景

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》