滕毅1 王璐2 朱和胜3
(1.广东省邮政信息技术局,广东 广州 510000;2.上海民航职业技术学院,上海 200232;
摘要:为了查找客户手机渠道的购买规律,做好邮政手机渠道的推荐。本文采用Apriori算法针对客户的手机订单进行处理,统计并且分析手机业务之间的关联性,生成手机渠道业务的强推荐规则。推荐算法的关键在于阀值的确定,本文将关联规则产生的购买行为对应的购买比例与客户的平均购买比例相比较,高于平均购买比例的规则定义为强规则,最终,本文得到12条强关联规则。
教育期刊网 http://www.jyqkw.com
关键词 :Apriori;产品关联;手机业务推荐
中图分类号:F626.12 文献标志码:A 文章编号:1000-8772(2015)22-0186-01
电子渠道是当前电信行业、互联网企业、电商等必备的销售渠道,中国邮政为了方便客户,同时拓宽业务的推广渠道,目前已经开始将某些便民的邮务类的业务建立了电子渠道[1,2]。当前邮政通过手机渠道能够办理的业务包含:代收路桥费年票、电信充值、会员报刊、交通违章非现场缴费、境外报刊、图书销售、我要上封面、自由一族缴费八种业务。
如表1所示,根据客户的过往的交易记录,统计客户交易的种类,客户的交易主要集中于会员报刊、境外报刊、图书销售以及电信充值四种业务。按照客户的角度统计其采用的业务种类发现,99.17%的客户当前只采用了手机渠道1~2种业务。
一、数据预处理
按照客户维度统计每种业务客户办理的情况,为了寻找不同业务之间的购买的关联规则,将八种业务类型客户加办的情况分别用布尔型变量表示,有金额发生的业务标记为true,无金额发生的业务用false表示。
二、Apriori算法
Apriori算法是Agrawal和R.Srikant于1994年提出的,是布尔关联规则挖掘频繁项集的原创性算法。它是一种逐层搜索的迭代方法,其中k项集用于探索(k+1)项集。该算法主要有两个步骤。
1.找出所有的频繁项集:该项集的每一个出现的频繁性与最小支持度。
2.由频繁项集产生强关联规则:满足最小支持度和最小置信度的规则。
算法在实施过程中的主要的问题在于,在最小支持度值设置的很低的时候,会产生大量满足最小支持度的项集。
算法流程:
设定k=1
扫描事务数据库一次,生成频繁的1-项集
如果存在两个或以上频繁k-项集,重复下面过程:
[候选产生] 由长度为k的频繁项集生成长度为k+1的候选项集
[候选前剪枝] 对每个候选项集,若其具有非频繁的长度为k的子集,则删除该候选项集
[支持度计算] 扫描事务数据库一次,统计每个余下的候选项集的支持度
[候选后剪枝] 删除非频繁的候选项集,仅保留频繁的(k+1)-项集
设定k = k+1
三、计算结果
采用Apriori算法求解后,得到以下强关联规则,置信度的设置的阀值是针对推荐产品的平均购买率。若关联规则推导出的产品购买率高于其平均购买率,则为强关联规则。最终,得到以下强关联规则:
1.充值→图书,置信度为31%,平均购买率为22%;
2.充值→违章,置信度为4%,平均购买率为0.14%;
3.违章→充值,置信度为48%,平均购买率为8%;
4.违章→图书,置信度为40%,平均购买率为22%;
5.违章→境外,置信度为8%,平均购买率为6%;
6.充值、报刊→图书,置信度为70%,平均购买率为22%;
7.报刊、违章→充值、图书,置信度为91%;
8.报刊、违章→充值,置信度为100%;
9.报刊、违章→图书,置信度为100%;
10.境外、充值→图书、报刊,置信度为77%;
11.境外、充值→图书,置信度为85%;
12.境外、充值→报刊,置信度为92%。
四、结语
本文重点针对手机渠道产品的关联推荐进行分析,采用Apriori算法计算出产品间的强规则,然后,本文采用可以针对每个顾客以往的业务办理情况,推断其最有可能办理的其他业务。
教育期刊网 http://www.jyqkw.com
参考文献:
[1] 赵川江.浅析移动互联网时代电子渠道的作用[J].电信科学,2011(S1).
[2] 高克成.电信行业营销渠道用户适应性影响因素研究[D].黑龙江:哈尔滨工业大学,2011.
(责任编辑:张娟)