随着保险科技在车险反欺诈领域应用的不断深入,许多产险公司在车险理赔系统中布置了风控模型、规则或工具,为风险识别提供了技术支持,这其中就包含关系图谱。
关系图谱是车险保险反欺诈领域中应用工具之一,其聚焦团伙类共发性风险。主要针对共性特殊案件,它依据各案件中人车之间共性信息关联,连接成网络;再通过人工质检的方式锁定。当前多数公司布置在已决环节,作为已决反欺诈的辅助质检工具,个别公司关联布置在未决环节,但仅为查勘结束后端。
关系图谱是基于图数据库建立关系的一种网络图。通过数据抽取和转换,图计算引擎对数据进行查询和分析,实现秒级数据运算和数据可视化,并以图谱的形式展示给用户的图形分析工具。用户可以基于已建好的图谱进行查询、分析和探索。
车险反欺诈关系图谱在应用中,主要针对共性特征案件,它依据各案件中,人车之间共性信息关联,连接成网络;再通过人工质检的方式锁定。关系图谱按照网络中“人、车、物”风险关系可分为两类,即显性关系和隐性关系:
在显性关系中,包含人员、车辆和电话信息、物损信息四类。其中“人”主要包含事故的被保险人、标的驾驶员(标的/三者)、伤者(标的/三者)、支付人;“车”包含标的车、三者车;物损信息参照物损类型区分(取决与系统维护物损类型字段);电话号码包含报案人、驾驶员(标的/三者)、被保险人(一般在承保留存)。
考虑到关系图谱工具的查询“共性”特征,当前多数公司布置在已决环节,做为已决反欺诈的辅助质检工具,个别公司关联布置在未决环节,但仅为查勘结束后端。经实践验证,关系图谱工具应用限制多,应用场景少,总结以下四点问题:
关系图谱是对事故中,人车物存在关联关系的一种可视化展示工具,对数据的真实性依赖度非常高。如果在查勘、定损端存在人为因素错误录入问题,就会导致关联关系连接错误。例如车险查勘节点的三者信息录入,因无法获取三者车辆或驾驶员准确信息,查勘员会采取虚假信息录入,对图谱影响最大的是套用以往案件的驾驶员信息,会出现“同一驾驶员驾驶不同车辆出险”的错误网络。当前业内三者(包含人伤)、修理厂信息有效率普遍不高,各家系统对人员、车辆信息仅存在简单数量、位次规则校验,缺少验真类验证方式,是形成问题的主要因素。
关系图谱需要的数据量越多,构成网络的概率越高,这对多数小公司来说,会导致发现率低,可应用效费比差。
据笔者了解,业内多数应用关系图谱的公司,在图谱页面配置了对人车物的检索功能,个别公司设置风险检索规则,并配置了“区域围栏”,依据围栏圈出的案件,进行筛查质检。从当前质检效果来看,关系图谱检出有效率不高,真正意义的团伙,无法通过网络自动检索定向推动到质检人工作台。质检人员只能通过关键信息查询方式,被动检索图谱,这相当于给质检人N把箱子钥匙,但无法告知哪个箱子里有“宝贝”。
众所周知CFR-OFR是一个管理闭环,关系图谱工具如何在闭环中发挥应用最大化,当前还是比较棘手的问题。问题不是能否布置在未决端及哪个环节,而是基于反欺诈技术构架如何有效整合,智能输出效果最大化问题。关系图谱由于由于应用场景化小、触发率低,又是被动触发方式,在反欺诈体系建设中还无法发挥更大的作用。
解决关系图谱在反欺诈应用的局限性,笔者认为在单一公司视角下,应从解决问题本源入手,提升图谱智能化输出与扩大应用场景才是关键。
谈到回归解决问题本源,应当检视基于人车物的团伙画像是否清晰准确。首先确定人车物关联关系定义团伙基础画像,针对画像特征进行分类,设定风险因子配置因子风险级别(依据本公司承保及风险特征确定),据此建立图谱风险模型。依据各类别团伙共性差异及画像特征,还可定向配置因子建立子模型(例如:基于10吨以上货车风险特点的货车风险模型、基于伤残案件黄牛特征的人伤黄牛风险模型、基于及损失关联度的隐损套件风险模型等等)。数据模型的搭建不仅可以准确定义风险团伙,而且为图谱的智能化输出提供有效支撑。
智能化输出应遵循MIRI法则(米利法则),即MIRI=MODEL+INTELLIGENT+REGULATION+INTERACTIVE。在模型输出中,通过各区域风险特征,调整子模型与公共模型校验案件顺序。应遵循子模型优先原则,依据保险车辆基本信息或案件类型分类优先流入子模型后,再流入公共模型中,确保模型输出效果。
建模后需配置“区域围栏”规则,分别布置在模型前、后两端,布置在前端,可以增加模型的定向输出有效性。例如隐性关系条件,可配置围栏规则“团伙中案件在同一非合作修理厂”,再如依据老旧车/中高端车团伙风险,可配置车价、车龄或车型的围栏规则,做为模型输出的限制条件。布置在模型后端,可以设置对案件基本数量、触发规则数量的限制条件,提升输出的精准性。例如可增加基本数量限制的“五案七人”滤网限制,即输出网络必须满足至少存在5笔案件,涉及案件人员不少于7人。限制条件可包含但不限于人、车、物、案的四个维度中。限制规则应建立在数据实践最大效能的基础上,才能为模型输出效果提供保证。
搭建图谱模型+规则后,针对公司内各机构风险差异化问题,可以增加人机互动编程功能,并为质检人员定向查询支持。
依据模型因子,配置图谱编程管理页面,编程页面可以ILOG编程框架为蓝本,针对人、车、物关联关系,配置可选择的因子+触发数量筛选项,配置多因子组合关联关系(包含、互斥、叠加等)选择,并定义团伙输出名称。
以团伙中存在高频骨干人员名称及角色、车辆身份及角色为基础编写团伙风险案件鉴别报告模板,按照高风险因子关联关系,锁定风险类型,描述团伙骨干在不同案件中的关联关系,定性内部人员参与度,修理厂参与度等。
当前车险案件审核页面均是针对单一案件的审核,针对团伙案件,单一案件审核页面不能提供多维数据信息与关联案件同步质检支持,存在共性团伙漏检等诸多问题。基于图谱案件共性特征,应修改审核页面,增加团伙风险名称、风险鉴别报告、关联案件风险识别信息字段,配置团伙标识点选/添加,多案共检等功能,提升团伙类案件检出效果。
黑名单数据库应用较为普遍,但部分公司数据库存储信息不清晰,未能准确定义收存案件类型及字段规则。会出现数据重复维护问题,而且关键数据缺失,将导致数据有效性不高。例如拒赔案件筛选规则中,对主观故意类的性质区分不清晰,涉及换驾类与拼凑类案件全部入库;对人员角色、修理厂风险类型的缺少基本定义标识等。然而黑名单数据库对图谱网络意义重大,它是提升真实性校准效果的倍增器。所以在维护现有黑名单中,应增加在SIU、CFR审核环节的角色及风险识别字段,并据此确定分类和流入规则,在审核后自动归类黑名单库中。同时黑名单分类数据字段,可以选择成为图谱模型因子,也可以编写成为图谱规则,做为图谱团伙的具象标识,以提升识别效果。
欺诈团伙的一大特征是流动性强,中小公司由于数据存量少,时长不能聚焦锁定,这需要通过行业力量来整合资源。银保信作为保险数据存储公司,可通过关系图谱工具,为行业公司提供风险检索与智能推送功能,再联合各地行业协会、司法部门建立“反欺诈联查”组织。行业反欺诈网络的构建,将大大提升跨公司、跨区域的欺诈团伙打击效果。
笔者认为,解决图谱局限性问题,需要整合现有技术资源,取长补短,优化使用结合提升反欺诈闭环管控效果的一种可行方法(例如通过XGBoost模型+图谱模型+热力图模型优化输出再结合AR等工具组合)。
从车险反欺诈科技应用趋势来看,在3-5年内,随着脸谱扫描与声纹技术的日益成熟,关系图谱的应用场景将由现有的2D“线圈”组合模式,逐步转变成为声纹+图像+多维身份识别的3D模式,通过行业的多技术整合输出,将会开启车险反欺诈3.0时代。开云 app 开云 入口开云 app 开云 入口