热搜:
编辑导语:政府数据是政府在运作过程中采集到的数据,我们在日常办事中会遇到,比如常遇到的身份认证、信息绑定等等,这就是政府数据的案例;本文作者详细的分享了关于政府数据与如今各行业的发展与融合的思考,我们一起来了解一下。

笔者以前主要关注的是在金融科技行业相关的数据、场景及应用,持续观察了解过程,发现这个行业的数据玩家的数据采集、数据使用及数据权属非常不清晰,存在风险非常大,与政策的整体大基调是相悖的。

虽然2020年前都没有明确的政策文件,但猎人基于一些相关的个人信息安全法等数据及信息安全条文,及基于任何场景的最终使用对象肯定会落实到人这一基础点;无论是前期的数据采集及最终的数据的使用均需要自然人及法人的授权,而当时情况至少80%以上数据采集及数据使用未获得用户授权;最近几年很多不合规的头部机构倒闭或停掉相关业务,其实也在映证这一点。

这类头部数据玩家90%以上属于非备案、非征信、非官方机构,但却做着合规机构的相似的业务,这个商业模式就存在非常大的风险。而与这些数据机构合作的正规机构业务由于核心数据产品均采用其数据为主,这些数据机构倒闭或数据不能服务都对正规机构核心数据产品业务直接停滞或风控能力大幅度降低,营收水平大大受挫。

而政府数据(国家拥有的数据,或者泛指政府拥有的数据,分为部委数据(全国性数据),地方政府数据(区域型数据))作为权属最清晰,也是来源最合规的数据出口;在笔者的研究中发现,在这块的定位、这类数据的服务平台或产品应用服务公司,其实非常少。

但政府数据的一些基础的市场化应用其实在我们日常生活都经常接触到,是最直接的收益群体;例如身份证信息核验、跨行绑定银行卡信息核验、手机号实名制识别等,这些产品其实也就是我们的政府数据应用案例,身份证信息核验来自公安部、跨行绑定银行卡信息核验来自银联、手机号实名制识别来自运营商。

因此,笔者判断政府数据的潜在价值有待释放,特别是在金融科技行业,这个最需要合规安全的数据源的场景。

一、政府数据潜在价值体现

政府数据相信很多读者都不怎么熟悉,这里各位可以先看下这些关键词,感受下这些关键词背后政府数据的价值所在。

我这里把这些关键词,连成一段话给各位感受下:数据是第五大生产力,在我国数据中80%属于政府数据,政府数据属于新型国有资产,归国资委管理。

国家正在大力推动数据要素市场化,引导数据交易在合规数据交易平台上交易。数字经济规模占GDP的3分之一,核心要素是数据。

数字经济发展趋势有“五化”:数字产业化、产业数字化、数字化治理、数据价值化及数据资产化。

二、政府数据是什么

政府数据的概念可以参考《深圳经济特区数据条例(征求意见稿)》中的“公共数据”的定义:

“公共数据”是指本市各级行政机关和依法授权行使行政职能的组织以及具有公共管理和服务职能的企事业单位(以下统称“公共管理和服务机构”)在依法履职或提供公共管理和服务过程中收集或产生的,以一定形式记录、保存的各类数据及其衍生数据。

本条例所称具有公共管理和服务职能的企事业单位包括但不限于本市行政区域内与人民群众利益密切相关的教育、卫生健康、供水、供电、供气、供热、金融、电信、公共交通等企事业单位。

政府数据简单理解为政府在运作过程中采集到的数据,这些数据因为政府相关部门职能的不一样,采集到的数据维度类型也是不同的。

为了让各位更直观的了解政府数据的现有形态及情况,猎人通过比较熟悉的数据宝公司的政府数据矩阵给各位做个简单的内容普及;数据宝作为全国在政府数据这块的领跑者,已链接了近50家部委(全国约70家部委)的数据,我们通过数据宝的政府数据链接谱图,来更进一步了解政府数据的情况,同时了解为什么政府数据能支持如何多的应用场景。

政府数据分散于各个部委、厅局委办局的各系统中,由各部委、厅局委办局各自保管,通过设定特定部门、成立全资子公司来对外提供数据出口。

数据宝作为全国范围不足20家机构企业中拥有大数据资产交易资质的公司,现在链接的政府数据包括覆盖14亿人口的公安部数据,覆盖全国73亿+的银联数据,覆盖全网的近16亿手机用户数据、覆盖全国上亿企业的相关数据、覆盖全国31个省2亿台车的高速卡口数据、覆盖全国全量车辆及全量驾驶证群体的数据,覆盖8亿+的铁路用户出行数据等——人车企三种类型均有相对较全面的覆盖。

以上部委数据可以通过单个部委或多个部委数据融合形成产品再为数字经济赋能。如我们使用的各种APP注册实名时需要用到公安部和运营商的数据实现信息真实性判断,我们绑定各行银行卡时需要银联的数据能力支持跨行绑卡信息真实性识别。

我们申请贷款时,个人贷款需要社保公积金数据,需要人社部门的数据支持;申请企业贷款时,需要央行征信及税务局的数据支持;如果没有这些政府数据的开放支持,很多业务都无法正常运作及对外服务,所以政府数据的开放程度及维度在一定程度上直接决定了企业能提高什么服务及提供服务的效率是高还是低。

三、政府数据与其他类型数据的区别

行业内的营销部门、风控部门及渠道采购部门可能接触较多的数据有企业数据、公开数据及个人数据。

1)企业数据:主要指企业在正常运营过程中,通过为客户提供产品及服务,合规合理有度的采集到并留存下来的客户自动提供或被动获取的相关数据,及整个运营过程中各类产品及服务产生的其他相关数据。行业内的巨头数据量级及维度都是领先,因此其在业务服务类型及能力上都远超其他跟随者,企业业务覆盖人群越广,能积累的数据也越多,形成良性循环;而体量不够大的企业,只能做垂直细分场景。企业数据用的好的机构如阿里的借呗花呗、京东的白条产品等。

2)公开数据:简单理解为我们从搜索引擎能搜索到的及各类网站上公开的信息,当然有一大部分公开数据属于政府公开的数据;公开数据的数据积累的核心要点在于该企业掌握的爬虫引擎能力的强弱,因此爬取公开数据经常需要与目标网站做技术对抗;虽说很多网站的数据都是公开的,但这些网站的数据搜集起来也是不容易的,他们也不希望辛苦积累的数据被其他公司轻易爬走。公开数据用的较好的机构如天眼查、企查查等。

3)个人数据:个人才有的或能够在特定场合提供的信息数据,例如线下贷款填表填的一些信息。

而政府数据比较特殊,政府数据按照相应的整体方针的规划,分三类,无条件开放-公开数据、有条件开放-脱敏授权、不允许开放-涉密数据。

政府数据的价值为什么大,最简单的原因是,政府掌握大部分的企业经营数据、公开数据大部分是政府公开的数据、政府数据涵盖了大部分的个人数据;政府数据没覆盖的是企业运作过程中比较隐秘的未公开数据、个人私有的独特数据。

四、政府数据市场化核心三步走

政府数据是个宝藏,但至今还是在市场化开放的起跑线上,属于初步阶段。

原因是大部分的政府数据都是没经过标准化处理的,还停留在信息化内部使用阶段,能够市场化的数据少之又少,同时政府部门也没有专门的团队去专门研究这个事情,因此政府数据到市场这个过程是有很大一块工作需要处理的。

2020年新基建的大力发展,很多的政府机构都在积极响应,而各种智能城市大脑建设的大厂也在积极为政府数据做数据治理相关工作,打好数据基础;但实际情况是,这些大厂能实现的其实是升级版的政府信息化,达不到政府数据市场化的要求,因为这不是个简单的技术活,而是实打实的数据应用创新变现的活。

这里以数据宝为全国交通部数据从治理到应用变现的全生命周期过程总结的方法论来了解下政府数据市场化的核心三步走是个什么情况。

数据宝内部总结出来的政府数据市场化三步走叫做“商品化三级治理”,一级治理主要目的是实现基础化治理,使各政府部门各类系统汇集的数据达到有序化;二级治理的主要目的是合规化治理,达到政府数据共享开放标准,并实现数据安全分级分类;包括行业的一些大厂在为政府提升数据治理时也只能做到二级治理,也就是建立各种数据资源目录。

而数据宝掌握了特有的第三级治理,商品化治理,针对数据应用场景,实现政府数据资源商品化,达到市场可交易变现的标准。通过定目标、定角色、定任务、定机制、定流程及定考核来保障全流程。治理后的政府数据将获得以下属性:数据权属清晰、标注充分、全面安全属性、能跨网安全流转及实现商品化应用——这也是政府数据市场化前必须实现的步骤。

五、政府数据市场化案例-交通部

交通部掌握了全国31个省(目前西藏和海南特殊原因无有效数据),2亿台车(乘用车及运营车),覆盖12000个高速出入口站点,25000多个ETC门架,数据量级达数百亿级。

2020年的主要数据如车牌号都是通过摄像头拍摄提取,各省站点建设之初,建设的摄像头能力不一;同时由于各种现场环境因素如天气、位置、灯光等导致采集数据会产生缺失或误识别,这类原因导致的各种脏乱数据非常多,无法直接市场化。

因此需要三步走,先进行数据有序化治理,实现数据标准基础化,然后各省间数据共享比对,进行数据有效优化;同时也能促进各省部门积极采集及共享数据,同时按照交通部的治理反馈优化内部采集流程提高区域数据采集质量;最后通过商品化产品打造流程,将数据维度按照场景需求进行拆分,结合各自模型能力实现相应的产品形态。

六、政府数据赋能产业潜在市场规模

国务院《促进大数据发展行动纲要》目标要求,大大加速了大数据行业的发展,2015年底我国大数据核心产业规模是696.7亿元,2017年达到1335亿元,到2020年爆发式增长到1万亿元;到2020年,我国大数据关联产业产值将达到10万亿元,大数据融合产业产值将达到20万亿元。

金融科技仅是数字科技的一个提前发力的板块,但不是全部。整个大数据产业分为核心产业、关联产业、融合产业,每个细分产业都是10万亿以上的潜在规模;金融科技板块的发展路径,数据融合创新思路等方面的经验均可以作为我们研究其他产业科技的发展路径及数据融合创新应用思路的借鉴。

七、政府响应数据市场化开放具体表现

截至2019年,全国已有23个省份成立省级大数据管理机构,超过20个城市成立市级大数据管理机构。

当下各级政府正在如火如荼地推进的智慧城市建设,大数据无疑更是关键中的关键;然而,从各地智慧城市、数字政府建设的具体实践来看,最大痛点和瓶颈也正是数据的匮乏;各地大数据匮乏的核心症结在于各级部门未能充分认识到大数据的重要性,缺乏汇集大数据的意识和动力,而关键则是缺乏相应的大数据相关机构。

大数据管理局的成立表明,当地政府已充分认识到大数据的重要性,专职机构的设立也能真正敦促各级各部门更重视大数据建设;各级政府机构拥有海量的原始数据,如气象、人口、环境、土地等公共数据,安全、海关、旅游等管理数据,教育、医疗、金融等服务数据,这些构成了社会发展与运行的基础。

当数据在具体的政府单一部门时,产生不了任何价值,但如果将这些数据进行关联分析,将产生巨大的社会价值和经济效益,但是由于各级各部门从部门利益出发,宁愿让数据烂在自己手中也不愿意共享数据;这一方面导致了一个个的“数据孤岛”,难以实现数据的互联互通。另一方面相互割裂的数据事实上根本不是大数据,只能被称为“小数据”。

例如,工商数据在工商部门,金融数据在金融办,医疗数据在医疗部门,房屋数据在房管部门,教育数据在教育部门;而通过新设立的大数据管理局,通过有效措施切实打破各部门之间的“数据孤岛”,数据联网之后则数据可以在各个部门之间同步交互、共享,一个市民在房管部门住房状态的改变可以同步到公安部门,这样不仅能够提升效率,而且能够帮助相关部门提升现代治理能力。

政府内部在打破“数据孤岛”,这个过程会促进区域政府数据的汇集,区域政府数据的汇集最终流向部委。

八、政府数据市场化开放进程

政府数据的市场化在2001年就已经在初步尝试了,但整体进展到了2020年还是相对较慢;而企业类、公开类数据的市场化路径及进展非常快,但主要也是得利于互联网金融野蛮生长对数据的需求,用数据换时间,用时间换效率,用效率换规模,简单点就是:数据=规模。

1. 公安部

应该算是最早的进行市场化政府部门了,2001年3月27日,中央机构编制委员会批准公安部成立“全国公民身份证号码查询服务中心”(以下简称“中心”),负责建设、管理和运营 “全国公民身份信息系统”,为政府部门、社会各界及人民群众提供公民身份信息核查和统计分析服务,2003年才正式对外运行(该中心应该算是公安条线数据市场化初期出口了,但其实该系统类似公安部门的对外服务平台,实际的数据总控权应该在公安一所)。

主要的推动力是:2000年4月1日起由国务院颁布施行的《个人存款账户实名制规定》确立了我国的储蓄实名制。

按照个人储蓄实名制的要求,凡居住在国内的中国公民,在金融机构开立个人存款账户或在原账户上办理第一笔存款时,提供的实名证件包括居民身份证、户口簿等;假身份证、假文凭等各种假冒证件制假技术简直到以假乱真的地步,储蓄网点一线的人员普遍没有接受过证件真假的鉴定培训,对储户提供的实名制规定的身份证、户口簿等各类有效证件,是难以通过肉眼来辨别真伪的,公民身份信息核查服务将为存款实名制的有效落实提供保障。【行业发展对政府部门的数据需求推动了政府数据市场化】

2. 银联

于2002年3月成立了中国的银行卡联合组织——中国银联,开启了我国银行卡产业联合发展的新篇章。

2006年2月27日,中国银联总裁助理卫国在北京透露,虽然反对质疑之声不绝于耳,但银联针对跨行查询的收费计划并没有改变;中国银联对跨行查询收费铁定将在2006年上半年正式实施,每笔收费1角。

主要推动力:为了促进银行卡的联网联合,1993年我国启动了“金卡工程”,到2000年,陆续建立了18个城市银行卡交换中心和一个总中心,部分实现了当地城市的同城跨行通用和部分城市之间的异地跨行通用。

随着联网通用的推进,社会接受银行卡的程度越来越高,产业的发展需要更为强大的同心力和推动力;经国务院同意,在中国人民银行的直接组织领导下,各商业银行联合起来,在合并全国银行卡信息交换总中心和18个城市银行卡中心的基础上,由中国工商银行、中国农业银行、中国银行、中国建设银行、交通银行等银行卡发卡金融机构共同发起,于2002年3月成立了中国的银行卡联合组织——中国银联,开启了我国银行卡产业联合发展的新篇章。

3. 央行征信

2004年4月,人民银行成立银行信贷征信服务中心;2004年12月15日,个人信用信息基础数据库实现15家国有和股份制商业银行,8家城市商业银行在重庆等7个城市的试运行。

2006年1月16日,人民银行召开新闻通气会,宣布个人信用信息基础数据库正式运行;2006年6月底,企业信用信息基础数据库实现了在所有中资、外资商业银行和有条件的农村信用社全国联网运行。

2010年9月9日,国家发展改革委员会以《国家发展改革委关于中国人民银行征信中心服务收费试行标准等有关问题的复函》(发改委价格[2010]2071号)正式批复中国人民银行征信中心自2010年10月1日起试行收费。

主要推动力:随着经济市场化程度的加深,加快企业和个人征信体系建设已成为社会共识。

2002年11月8日党的十六大报告明确提出要“健全现代市场经济的社会信用体系”,十六届三中全会明确提出“按照完善法规、特许经营、商业运作、专业服务的方向,加快建设企业和个人信用服务体系。”温家宝总理明确指示,社会信用体系建设从信贷信用征信起步,多次强调要加快全国统一的企业和个人信用信息基础数据库建设,形成覆盖全国的信用信息网络。

2003年,国务院“三定方案”明确赋予人民银行“管理信贷征信业,推动建立社会信用体系”的职责。

2007年召开的全国金融工作会议进一步提出,以信贷征信体系建设为重点,全面推进社会信用体系建设;2007年2月27日,国家质量监督检验检疫总局与中国人民银行宣布,国家质检总局将向人民银行、商业银行等企业征信系统的使用者提供组织机构代码信息的在线实时查询服务。为进一步发挥人民银行在社会信用体系建设作用,2008年,国务院将人民银行职能调整为“管理征信业,推动建立社会信用体系”。

4. 企业组织信息

全国组织机构代码网络系统于2000年建成并投入使用,当时已经建立包含了我国1400万组织机构信息的中央数据库;质检总局提供查询的信息包括组织机构代码标识及其相关的机构名称、工商注册码、机构地址、法定代表人姓名、组织机构代码证办理机构名称等共计33项信息。

2007年2月27日国家质量监督检验检疫总局与中国人民银行宣布,国家质检总局将向人民银行、商业银行等企业征信系统的使用者提供组织机构代码信息的在线实时查询服务,这为核实“企业身份”和信息整合提供了必要的基础。

主要推动力:组织机构代码标识制度是一项重要的社会管理制度。它对我国每个依法成立的企业、事业单位、机关、社会团体及其他组织机构赋予一个唯一的、始终不变的代码标识,并以此为基础建立起了国家层面的组织机构全集信息库。

与人民银行打通原因,主要是因为组织机构代码实时查询有利于落实企业账户实名制,扩大信贷,打击诈骗、洗钱等金融犯罪活动,并能够更好地满足中小企业和低收入人群的融资需求,加快社会信用体系建设。

5. 社保公积金

2013年度社会保险个人权益记录单可登录市人社网查询和打印了。

主要推动力:《社会保险个人权益记录管理办法》已经人力资源和社会保障部第67次部务会审议通过,现予公布,自2011年7月1日起施行。

第四章第十四条社会保险经办机构应当向参保人员及其用人单位开放社会保险个人权益记录查询程序,界定可供查询的内容,通过社会保险经办机构网点、自助终端或者电话、网站等方式提供查询服务。

6. 企业信用信息

全国企业信用信息公示系统(国家企业信用信息公示系统)于2014年2月上线运行。公示的主要内容包括:市场主体的注册登记、许可审批、年度报告、行政处罚、抽查结果、经营异常状态等信息。

主要推动力:本系统信息公示依据《中华人民共和国政府信息公开条例》、国务院《注册资本登记制度改革方案》。《中华人民共和国政府信息公开条例》经2007年1月17日国务院第165次常务会议通过,于2007年4月5日成文,2008年03月28日发布,自2008年5月1日起施行。

7. 信用中国

2015年6月1日,“信用中国”网站正式上线运行,网站的开通对于贯彻落实党中央、国务院关于加强社会信用体系建设的要求,推动各省级信用门户网站互联互通,归集发布各地区、各部门可向社会公开的信用信息具有重要意义。

网站向社会公众提供“一站式”的查询服务,日益成为社会信用体系建设领域沟通社情民意、推进信用信息公开的“总窗口”;下一步将推进“信用中国”网站改版升级,进一步强化网站信用信息共享服务功能。

网站的建设采取政府与社会力量合作的创新模式,充分利用了百度公司最先进的大数据、云计算、搜索引擎等技术,面向全社会开放信用信息查询功能,打造信用信息的“一站式”查询平台。

8. 运营商

2006年左右就开始尝试推动电话用户实名制。

2009年4月印发的《第三代移动通信服务规范(试行)》指出,电信业务经营者依照法律和有关规定对用户资料负有保密义务,未经用户同意,不得将用户信息用于查询服务或提供给第三方,不得泄露、删除、篡改用户信息。刑法也就类似问题给出惩罚措施,在一定程度解决了运营商层面的用户信息安全问题,给提供实名信息的用户吃了定心丸。

2010年手机实名制从讨论开始走向操作。

2013年工信部下发了《电话用户真实身份信息登记规定》对实名制进行了规定。

2016年实现100%实名制。

主要推动力:为了有效打击电信诈骗犯罪,工信部发文要求各家运营商必须从严从快全面落实电话用户实名制,必须在年底前实现100%的实名率;“各基础电信企业要加快推进未实名老用户补登记,在2016年底前实名率达到100%。”在规定时间内未完成补登记的,一律予以停机。

对于新入网的电话,工信部要求运营商严格落实用户身份证件核查责任,采取二代身份证识别设备、联网核验等措施验证用户身份信息,并现场拍摄和留存办理用户照片。通过网络渠道发展新用户时,要采取在线视频实人认证等技术方式核验用户身份信息。

9. 交通部

路网中心的货车北斗数据-中交兴路车联网科技有限公司于2009年承担了交通运输部“全国重点营运车辆联网联控系统”工程中的“省级重点营运车辆公共服务平台”,为15个省级运输管理机构提供重点营运车辆监管服务,同时为全国各省重点运输企业提供营运车辆监控服务;目前,联网车辆已超过500万辆,成为我国首个跨地域、跨车厂、跨平台、联网车辆数量最大的车辆联网应用与服务平台,是全球最大的在营车联网系统。

全国高速卡口数据2019年底左右才算正式对外提供服务,主要由贵州数据宝网络科技有限公司为交通部提供31个省涵盖全量货车及乘用车高速卡口通行数据对外市场化服务。

主要推动力:路网中心的货车北斗数据主要是中交兴路承建了系统,针对两客一危的监控需求,同时实现了对外市场化;而高速卡口的市场化,其中一个原因是2016年交通部为深入贯彻落实党的十八大和十八届三中、四中、五中全会精神,按照党中央、国务院决策部署,遵循以目录管理数据资产、以共享促进数据融合、以开放实现数据增值的总体思路,坚持需求导向和问题导向,加强统筹协调,激发市场活力,着力突破运输大数据发展机制与技术障碍,提升行业数据资源开发利用价值。

在2016年通过了《关于推进交通运输行业数据资源开放共享的实施意见》,期望在3-5年时间实现以下目标:

  • 建立健全行业数据资源开放共享体制机制,基本建成协调联动、高效运转的行业数据资源管理体系。
  • 完善行业数据资源开放共享技术体系,建立互联互通的行业数据资源开放共享平台。
  • 围绕科学决策、精准治理、便捷服务等重点需求,开展一批跨部门、跨地区、跨领域协同应用的试点示范。 【政府部门的数据市场化开放程度可以促进新型行业场景服务形态的创造】

九、政府数据产品化标准路径

政府数据类型如此多,数据量级如此大,商业场景也各式各样,如果将政府数据打造成市场愿意买单的产品服务,这个过程如何实现?

这里猎人总结了一套简单的标准路径-政府数据的产品化标准路径,其经过市场验证,最有效的方式是从市场需求反推产品形态。

首先确定客户类型,数据产品的最终买单对象是企业还是政府机构,而服务这些客户使用数据产品是为了满足企业端业务,还是为了服务C端客户或者服务政府企业。

确定好业务对象后,为了降低研发成本,提高研发效率及数据的利用程度,一般会将接触到的各种业务场景的共性及个性需求提取出来,按照过往经验或对业务理解,进行数据源类型及数据字段的筛选,这个筛选过程会对数据进行细化,权重调整,模型确认,出入参设计及响应参数同步,最后按照客户希望的产品形态进行封装,有API接口、模型评分、模型报告的简单形态,也可以是SAAS平台对外服务或者形成综合解决方案。

政府数据产品的买单对象80%以上是企业客户,调用量与企业互联网业务量级正相关,金融行业调用量普遍高于其他行业。

一是因为金融行业机构有钱,也重视风控,这些场景需要大量的外部数据支撑业务,控制风险,其对应的数据应用团队、技术团队也更成熟,市场培育难度较小。

其次是保险行业,保险行业因为互联网转型的原因,很多业务都通过线上进行,同时业务量的增加,导致其对保险投保风控的要求也大大增加,数据需求也随之增长;而其他行业如物流行业、汽车行业,甚至一些政府机构都在借鉴金融科技的那套逻辑,结合行业自身的转型需求,对数据产品的需求也不断增加。

而政府则更多的是在赋能企业,优化民生服务,提升服务体验等,这些均需要内外部数据的多源融合才更有利于实现;要知道现在的各类政府都是区块化网格化管理,政府部门间的数据共享也并不通畅,更别说对数据如何应用于相关的业务场景中了。

十、政府数据的大数据风控场景产品化思路

大数据风控是各行各业都需要的通用需求,用一句话来表示这个至少百亿级的市场规模需求,通过运用大数据这个原材料,通过构建模型建设的技术方式,对某目标人群,放在借贷场景则为借款人,放在保险场景则为投保人及被保人,对这目标人群进行风险控制和风险提示。

大数据风控需要有场景承载需求,需要有技术支撑场景服务,但如果没数据,最终还是无法形成服务闭环。所以数据从哪里来?

80%的数据在政府手中,如果以前使用了1%的政府数据及大部分企业数据就可以基本满足场景业务需求;那现在如果使用的政府数据提升至甚至更多的政府数据,那这类公司的业务肯定是可以跑的更快的。

1. 个人金融风控场景应用需求及政府赋能产品形态

这里拿出很久之前梳理金融科技在个人金融风控场景的全流程图,每个流程环节主要用到的数据类型都标注出来,忽略掉一些比较偏技术的内容,其实可以看得到图上。

反欺诈环节:需要能够识别用户欺诈行为的数据,例如虚拟手机号,虚拟IP,虚拟设备等,有些情况也会叠加使用强区分数据如公安部才有的在逃、黄赌毒等用户数据;当然由于这部分数据属于非常敏感的数据,能用的场景及行业都是特定的。

用户身份核验环节:这类主要是对用户身份证、绑定的银行卡及提供的手机号,信息是否准确,是否是本人所有。为什么这块数据只有也只能公安部、银联及运营商提供,因为他们分别掌握了最全的身份证数据、银行卡数据及手机号数据;而专注通过缓存数据库非合规服务机构,为相关企业服务时,由于身份证信息更改未更新,银行卡号码销号无效未更新,手机号转网或实名更换等潜在数据服务风险,无法为企业精确识别这类无效客户,后续为这类客户提供服务特别时金融服务时存在较大的资金损失风险。

用户授权信息获取:这块一般需要用户提供相关账号及密码信息,服务机构提供相关技术工具,使用用户提供的账号信息,绕过官方网站防御机制,从官方网站里获取风控需要的相关数据,当然正常情况是能收集到的都会被收集;这种方式现在基本不允许再这么粗暴使用,所以现在基本要使用都需要经过官方数据资源方授权特定场景使用;银行系多头借贷数据从央行征信获取,互联网金融多头借贷从百行征信或相关协会可以获取;金融画像一般指支付行为相关的数据,一般只有银行和支付公司有。其它的按照字面意思,应该都不难猜到是什么部门的数据了。

基本上以上数据齐全后,就可以进行相关的建模,业内常见的就是申请评分卡、行为评分卡、授信模型及分层模型等,大体上就是为了更好的通过模型算法将用户的各类数据进行交叉关联分析及应证,得出用户资质及潜在风险。

风险预警:风险预警其实主要通过用户实质风险变动及行为风险体现实现,实质风险变动简单理解为可以通过在公安部、央行征信、信用中国等地方用户是否从“好”人变成了“坏”人,这个变化无法通过模型算法实现识别;而行为风险体现,可以从还款行为、异常活动轨迹及非常态行为变化等去进行预警。

2. 保险创新场景应用需求及政府赋能产品形态

这里再举个保险行业细分场景-物流行业货车保险产品创新场景。整个产品创新环节分五大部分,这里选择性分享。

针对产品设计环节,可以通过企业针对内部数据透视挖掘潜在客户需求,如货车去程有货物可以赚钱,但回程大概率是空载,回程高速费、油费等成本高,那针对这部分群体是否有针对回程空载减少损失的保险需求;针对这个设想则可以找到需要满足这个需求的数据支持,如是否空载可以通过高速卡口的治超称重系统记录的货车载重情况判断。

保险创新除了这块空载的判断完毕后,在承保的认证场景可以用公安部、银联数据及运营商数据核验货车司机基础的身份信息、投保卡号准确性及手机号是否本人实名;核保场景可以用交通部、公安部、物流信息中心数据综合实现挂靠识别、非空载识别及投保资质识别;定价环节可以综合使用交通部、气象局及中保信等数据。

针对理赔环节:反欺诈及赔付同样可以从交通部、气象部及工信部等数据实现。

3. 疫情防控常态化场景应用(健康码)的政府赋能逻辑

政府数据在政府赋能民生的场景,以新冠疫情期间必使用的健康码应用产品为例,健康码是多源政府数据融合的一个非常成功的防控产品,为我国疫情防控,人口安全流动提供了识别保障。

健康码的使用,一般只要通过微信或支付宝的小程序就可以找到各城市的健康码,人脸识别及身份认证即可得到健康码颜色,颜色代表用户当时的综合数据计算得出的健康结果。

健康码数据融合了个人基本身份信息、自动上传的健康数据、最近就诊数据、移动设备位置数据及铁路航空等出行数据。这些数据分别在公安部、户籍中心、卫健委及三大运营商里。

十一、政府数据全域赋能应用思路延展

接下来,我们通过大数据应用图谱来了解包括政府数据在内的各类行业场景应用。

按照行业场景区分:

  • 工业大数据应用包括:工业物联网大数据应用、产品精准营销大数据应用、工业企业供应链优化大数据应用、产品故障诊断及预测大数据应用等。
  • 文化旅游大数据应用包括:景区大数据应用、酒店大数据应用、餐饮大数据应用等。
  • 农业大数据应用包括:精准农业、农产品安全溯源大数据应用、农产品物流大数据应用、农村电商大数据应用。
  • 交通大数据应用包括:出行大数据应用、LBS大数据应用、交通规划大数据应用。
  • 金融大数据应用包括:保险大数据应用、银行大数据应用、风控大数据应用、企业融资大数据应用、互联网保险大数据应用、证券大数据应用。
  • 能源大数据应用包括:电力大数据应用、煤炭大数据应用、风热大数据应用、光伏大数据应用、油气大数据应用。
  • 医疗大数据应用包括:医疗健康保险大数据应用、基因检测大数据应用。
  • 运营商大数据应用包括:流量运营精准化大数据应用、客户服务大数据应用、运营商大数据资产运营大数据应用。
  • 互联网大数据应用包括:电商大数据应用、舆情大数据应用、竞争情报大数据应用、社交媒体大数据应用。
  • 企业大数据应用包括:生产大数据应用、营销大数据应用、运营决策大数据应用。

以上行业场景大数据应用除了需要理清及用好企业内部的数据,同时必须引入并融合政府数据,开启“上帝视角”,通过政府数据实现行业巨头数据垄断的压迫圈。

须知80%的数据掌握在政府手上,因此要论数据应用的普适性,没哪类数据可以超越政府数据的应用范围。

以下为按照政府性质及其运营过程获得的数据进行应用区分,可以大概归类为下列应用:档案大数据、住建大数据、林业大数据、国防大数据、司法大数据、纪检大数据、园林大数据、民防大数据、住房公积金大数据、反恐维稳大数据、智慧社区大数据、智慧景区大数据、社会信用大数据、城市管理大数据、节能减排大数据、多规合一大数据、精准招商大数据、市场监督大数据、综合应急大数据、精准扶贫大数据、综合治税大数据、地理空间大数据、航运大数据、金融监管大数据、工商大数据、卫计大数据、旅游大数据等。

单个部委的数据可以延伸出单个或几个有限的应用,而多个部委的数据可以按照一定的规则进行融合,融合产生的应用组合方式种类随着部委及其拥有的数据维度量级提升呈网络效应的爆发式增长,融合应用在单个场景的价值也因为政府数据的融合而远超其他类型数据应用能力。

谁掌握了最多的稳定的可用的政府数据使用权,谁掌握了最多的政府数据变现应用场景,谁掌握了最多的政府数据应用逻辑及经验,则将在政府数据市场化这个新赛道上遥遥领先;而抢先应用政府数据结合企业自身业务,打造以政府数据融合企业业务数据的新型产品服务应用,将是其可以PK巨头服务能力的唯一出路,以在垄断的市场中找到新的突破点,获得更多的市场份额。

在大数据行业混,“数据+技术+场景”三位一体才能持续发展。