PC版
搜索导航
论文网 > 证券金融论文 > 公司研究论文

数据挖掘技术在保险公司交叉销售中的实证研究

  中图分类号:TU247.1文献标识码:A文章编号:1006-4117(2011)04-0160-02
  
  在CRISP-DM方法论指导下,构建基于聚类的关联规则数据挖掘模型,对保险业务数据进行挖掘分析。
  一、数据准备
  结合保险公司个人寿险业务数据库的信息,可以概括为客户信息表、保单信息表及理赔信息。将三张表中和挖掘主题相关的字段信息抽取,整合为一张宽表。
  研究样本中,年龄和保费都是连续型数据,将其转化为离散化数据,有利于提高数据挖掘的效率。利用SQLServer2005的IntegrationServer工具加载数据表,建立多维数据立方体。
  基于数据挖掘的保险交叉销售模型应用
  (一)构建基于聚类的挖掘模型
  选取412(金彩明天两全保险)、413(瑞鑫两全保障)等为主细分变量,地区、保费、渠道等为辅细分变量。并保证输入变量与输出变量之间有一定的相关性。建立聚类挖掘模型,得到聚类结构图。
  模型将数据分为10个群体,对每个群进行钻取,结合剖面图和数据倾向图,判别其所具备的特征。10个分类的强弱势特征如下表所示:
  选择保费10000和100000为临界点,可见类1、类2、类3为低端客户,缴纳保费均在10000元以下,类4-8为中端用户,缴纳保费为10001到100000元之间,类9和类10属于高端客户,缴纳保费均在100000元以上。
  针对低中高端群组,结合年龄、性别、受教育程度等特征对群组的业务特征进行描述,低端群组特征分析如下表1-4所示:
  低端群组消费特征描述:该群体受教育程度普遍不高,在初中以下,年龄偏大,大多在50―65岁之间,缴纳保费的能力较低,都在10000元以下。由于S42(康宁终身健康保险)缴费较高,所以需求很低,此外S66(少儿保险)需求很少。同样的方法,统计分析中端和高端客户的群体特征。
  聚类只能解决已经发生过的客户消费行为,并不能对将来的消费行为和规律进行预测。在聚类的基础上,对所有险种类别进行关联分析,得出最强的关联规则,从而有针对性的对各客户群组进行交叉销售。
  (二)构建关联挖掘模型
  针对每一群组,构建关联挖掘模型,关联规则的默认算法是Apriori算法。通过运行关联挖掘结构,得出依赖网络图。
  对于每一群组来说,最强的险种关联只是两个或三个而已。选择关联最强的两个险种:S43→701,险种出现的概率为88.9%,重要度为1.9,为正关联。说明低端客户类1,在购买S43(康宁定期保险)的同时购买701(全家福意外卡)的几率为88.9%,结合低端客户群组的消费特征,较顺应常理。得出的关联规则是形如A→B,代表如果购买了产品A,则同时也会购买保险产品B。具体情况如表3所示。
  根据各个类别最佳的险种关联,像所对应的群组中还没有消费这种保险组合的客户进行推销,已经购买了其中一种保险产品的客户,向其推荐另一款产品;或者在未来向某一类客户推荐产品时,根据其收入和教育程度等客观因素,判断大致所属的群组,推销产品组合,以达到实现交叉销售的目的。
  结束语:论文对基于聚类的关联规则交叉销售模型进行实证研究,先从客户角度出发,运用EM聚类算法对准备好的数据进行数据挖掘,得出自然的10个群组分类,然后对每一个群组,从产品业务角度出发,用Apriori算法对险种进行关联分析,得出可以指导交叉销售的规则。在客户聚类的基础上,找出保险产品潜在的关联规律,制定有针对性的交叉销售方案。
  
  
  作者单位:常熟理工学院管理学院
  作者简介:周梅(1978― ),女,汉族,江苏徐州人,中国矿业大学管理学院在读博士生;常熟理工学院管理学院,讲师,研究方向:数据挖掘,金融工程与风险管理。

相关论文

数据挖掘实证保险公司销售数据
试论大数据背景下企业战略决策的挑战
基于数据系统的电力杆塔共享运营策略
大数据时代背景下农村财务审计监督
浅谈大数据时代企业人力资源管理模式
实证会计和分析式会计研究方法的融合
浅谈大数据发展背景下的企业财务内部
试论大数据背景下财务会计向管理会计
大数据背景下日化企业市场营销创新策
浅谈大数据时代房地产企业新型营销路
大数据时代拼多多盈利模式研究