大数据时代:马云此计划非彼计划

2017年05月27日 11:01 环球网
微博 微信 空间 分享 添加喜爱

  中国人民银行金融研究所互联网金融研究中心秘书长

  伍旭川/文

  近期,马云提出了一个观点:未来,随着数据获取越来越容易,可能会颠覆我们对市场经济的崇拜,“计划”经济会越来越强,市场看不见得手也会因为数据而显形。计划经济从理论上和意识形态上都是与市场经济截然相反的一个概念,马云的阿里巴巴本身是市场经济的产物,大数据与计划经济有什么联系呢?实际上,他这里所说的“计划”经济更多是指在新经济、新金融时代下,利用大数据、云计算、物联网等信息技术,更精准的了解客户和市场需求,使得生产活动更具有针对性,从而显得有计划性。这种“计划”是基于数据和算法,更精准的了解经济活动运行规律。

  大数据是什么?

  大数据是21世纪最为热门的概念之一,被认为是“以计算机、通信技术和互联网为标志的第三次工业革命”的产物。大数据是“无法在一定时间范围内用常规工具进行捕捉、管理和处理的巨量数据集合”,之所以具有这个特征,是因为大数据来源很多,且往往并非基于特定目收集而产生,很可能是某家企业正常业务过程中的副产品,比如国内阿里巴巴的电商交易数据,腾讯的社交数据,所以大数据是零散的碎片化的信息。大数据规模巨大、构成复杂、碎片信息较多,传统的数据分析技术难以处理,伴随巨量数据集合产生的是处理大数据的“新的技术”和“新的模式”。

  大数据不是一个新概念,早在上世纪六七十年代就已出现,但之所以在二十一世纪重新焕发活力,是因为近年来IT技术在应用层面上取得了突破性进展,新的商业模式、新概念层出不穷,互联网、电子商务、社交网络、移动物联网等改变了传统的沟通方式、交易方式乃至商业模式,互联网已经无处不在。当今社会的分工已经非常细化,在效率提高的同时也导致了生产者只聚焦于客户的某一具体需求,忽视消费者的其他需求和购买行为,这就导致对消费者和客户的理解比较片面。但是消费者的需求是多元化的,如果能将这些消费数据连接起来,将是一个跨企业、行业、跨地区、跨国的超级数据库。互联网及其技术的发展为超级数据库的出现创造了可能性,大数据、云计算和物联网等技术的创新发展也在加速这种趋势。未来当物联网发展到达一定规模时,借助传感器、可穿戴设备、智能感知、视频采集等技术可实现实时的信息采集和分析,每个人的日常生活习惯、身体体征、社会网络、知识能力、爱好性情、疾病嗜好、情绪波动等数据都能被记录下来,并通过后续的分析和处理,挖掘出许多额外的信息和关联逻辑,得到趋势信息,预测未来,作为决策的参考依据,实现智慧城市、智慧交通、智慧医疗、智慧环保等等发展理念,这就是大数据的价值所在。

  大数据的作用:以风控为例

  风控,是对风险的控制从而免受财务损失,通常金融机构通过要求抵押、质押、保证担保等方式来作为风险缓冲,但是在信用贷款中,风控的核心就在于预测每笔借款的违约概率,对于违约率高的借款人收取更高的风险补偿,或者拒绝放贷。模型和数据是风控的两大核心,建立风控模型的过程就是找到相关变量与违约概率之间的关系。

  传统的风控技术依赖于社会信用体系的建立。以美国为例,美国信用卡产业非常发达,大部分美国人都有较长历史的信用记录,因此经过多年的发展,已经形成较完备的征信生态体系。美国的征信体系主要由三类机构组成,一是商业银行和贷款机构,这些资金的贷出方在业务开展过程中积累了大量的关于客户借款、还款和违约的历史数据;二是征信公司,主要负责搜集和储存征信数据,包括从地方法院收集公共记录信息和贷款机构收集逾期债务信息,并将数据进行清洗和处理后输出标准化的数据产品,提供给银行和其他金融机构;三是专注于信用评分的公司,最著名的是FICO评分,其作用就是根据征信公司的信用报告,找到变量与违约概率之间的关系,其核心竞争力就是信用评价模型,银行和其他金融机构可以根据FICO评分进行放贷决策。

  但是传统的风控技术弊端越来越明显,其一,在征信体系不完善的金融体系中,传统风控技术对信贷记录空白者识别无效,导致这部分群体信贷需求得不到满足;其二,在互联网大数据时代,忽略了电子商务、社交网络和用户的搜索行为对信用评价的作用。正因为如此,越来越多的公司开始利用Facebook社交数据,作为用户信用评价依据。其背后的逻辑是,社交数据中往往包含了一个人的教育背景、工作经历、社交圈子,社交数据与信用水平存在某种联系。

  大数据应用到风控领域的意义在于,除了重视传统的信贷变量之外,能够将影响用户信贷水平的其他因素也考虑在内,如社交网络信息、用户申请信息等,从而使得信用评价不绝对依赖信贷记录,为信贷记录缺失的群体获取基本金融服务提供了可能性。与传统风控相比,大数据风控有三个显著特征,一是处理的数据种类多,变量规模大。不仅能包括传统的信贷记录等金融机构搜集的结构化数据,还能处理包括法律记录、交易信息、电子商务、社交信息等非传统的数据和非结构化数据。二是关注行为数据,而不仅仅是历史财务数据。传统的信用评分模型变量均与反映被评价主体债务状况和资金延付状况等资金活动相关,但大数据信用评估更关注被评价主体的行为数据,大数据技术是在充分考察借款人借款行为背后的线索和线索间的关联性基础上进行数据分析,降低贷款违约率。非传统数据属于信用评价的边缘信息,比如借款人房租缴纳记录、网络数据信息,甚至借款人填写表格时使用大小写的习惯,在线提交申请之前是否阅读文字说明,这些都能反映借款人真实的状态,是客户真实社会网络的映射。三是模型的建立是不断迭代和动态调整的结果。大数据风控模型的输入端是成千上万的原始数据,然后基于机器学习等技术进行大数据挖掘,寻找数据间的关联性,在关联性基础上将变量进行整合,转换成测量指标,每一种指标反映借款人某一方面的特点,比如诈骗概率、信用风险、偿还能力等。再将这些指标输入不同的模型中,最后将模型结果按一定的权重加总,最终输出的就是信用评分。在整个过程中,原始数据转换成指标需要进行不断的迭代,不同模型的权重值可以根据样本进行动态调整。

  大数据的计划性在于消除信息鸿沟

  经济理论中的计划经济是有规划、计划的发展经济,计划经济又称为指令型经济,在这种体系下,国家在生产、资产分配及产品消费各方面,都由政府统一提前计划安排。计划经济体制是对马克思经济理论的一种实践。根据马克思的设想,理想的社会经济结构是实行单一的公有制,不存在商品经济,并由一个统一的国民经济计划来配置社会资源,组织社会的生产、分配和消费。

  计划经济强调社会生产各部门的协调配合、比例协调一致。计划经济中政府既是运动员、又是裁判员。生产什么、怎样生产和为谁生产,这三个基本的经济问题都是由政府来决定的,大部分经济资源也是由政府拥有,并根据政府指令进行分配,不受市场波动的影响。

  计划经济体制的成功要求具有全面、准确、快速和及时的信息收集、加工和传达系统,劳动者和管理人员要有劳动和工作的积极性,不允许无偿侵占他人劳动成果,在经济发展初期,这些条件尚可达到,因此可以发挥集中力量办大事的优点,但是随着经济体量增加,其弊端就会显现出来,最根本的问题就在于政府能力有限与事无巨细的规划需要之间的矛盾,因此,当经济发展到一定程度时,必然不能忽视市场规律的作用。

  大数据及其一系列的技术将使得经济和社会活动更具有计划性,但是这个计划与经济理论中的计划不同。从市场营销来说,根据大数据分析所得出的信息,营销更加精准、产品更加细化,市场更加细分,生产者和消费者之间的信息鸿沟在缩小。从消费者的角度来说,与企业之间的互动正在加强,企业在生产产品之前更清楚知道客户需要什么样的产品。从社会治理来说,通过对监控摄像、犯罪档案等数据的分析,可以及时发现安全隐患、预测犯罪趋势,预防和打击犯罪。从公共服务来说,通过对公交地铁刷卡、停车收费站、视频摄像头等信息的收集,分析预测出行交通规律,指导公交路线的设计、调整车辆派遣密度,进行车流指挥控制,及时疏导交通拥堵。从医疗服务来说,通过电子病历、临床医疗数据和病人体征数据的收集分析,可以用于远程医疗、医药研发等领域。

推荐阅读
聚焦
关闭评论