互联网+大数据模式下的征信 - 以芝麻信用为例

发布时间:2020-11-06 21:21:05   来源:文档文库   
字号:

互联网+大数据模式下的征信——以芝麻信用为例

于晓阳

【摘 要】内容摘要:芝麻信用作为蚂蚁金服旗下独立的第三方信用评估及管理机构,通过运用大数据、云计算及机器学习等技术,客观呈现个人的信用状况,并已在消费金融、信用卡、租房、租车、酒店等多个金融与生活类场景为用户、商户提供信用服务,让其能够享受信用带来的便利和价值。本文对芝麻信用概况及特点进行了全面论述,并深入剖析了其存在的问题,最后提出了促进大数据征信机构规范、健康发展的相关建议。

【期刊名称】北方金融

【年(),期】2016(000)011

【总页数】4

【关键词】芝麻信用 数据 信用评分 征信产品

一、芝麻信用概况

(一)在数据来源上。芝麻信用的数据来源主要包括三个方面:第一是阿里体系内的数据。从渠道的角度来分,其电商交易数据来自阿里巴巴体系,互联网金融数据则来自蚂蚁金服;第二是外部合作机构提供的数据。对于外部数据的获取主要有两种方式,政府方面的数据以购买方式获取为主,包括工商、学历学籍部门、法院、公安、电力、煤气公司等公共事业机构。另外,一些本身具有大数据积累的商业公司也是芝麻信用的合作对象,比如运营商、P2P公司等,这部分可能会通过合作、置换、服务输出等方式获得。第三是用户自主提交的信用数据。芝麻在20157月上线了上传功能,用户可以主动上传个人信息,包括学历学籍、单位邮箱、职业信息、车辆信息和公积金五个方面,比如上传工作证明、公积金记录、缴税证明,资产证明之类的材料给芝麻信用,然后会得到一个更全面更准确的芝麻分。目前芝麻信用带有购物、金融和社交三种不同维度的数据,其接入的外部数据源在八成以上,而阿里的数据源已减少至不足两成。

(二)在数据处理技术上。芝麻信用在构建信用评分模型体系时,利用云计算、机器学习等技术,能以较低的成本对海量数据的关联性进行分析,还在充分研究和吸收传统征信评分模型算法的优势的基础上,积极尝试前沿的随机森林、决策树、神经网络等模型算法,挖掘出和信用表现有稳定关联的特征,从而更加高效和科学的发现大数据中蕴含的信用评估价值。目前,芝麻信用应用了一种改进的树模型GBDT,深入挖掘特征之间的关联性,衍生出具备较强信用预测能力的组合特征,并将该组合特征与原始特征一起使用逻辑回归线性算法进行训练,从而获得一个具备可解释性的准确的线性预测模型。

本文来源:https://www.2haoxitong.net/k/doc/b933594bbaf67c1cfad6195f312b3169a551ea2a.html

《互联网+大数据模式下的征信 - 以芝麻信用为例.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式