国资监管需紧跟大数据时代步伐
——读《大数据时代》有感
评价局 邱 鹏
近年来,“大数据”这个词突然变得很火,不仅出现在阿里巴巴、谷歌等互联网公司的战略规划中,而且在我国及多个其他国家的政府报告中也多次提及,已成为当今互联网世界中的新宠儿。百度李彦宏在对国家领导人的汇报中提出,大数据有两个重要价值:一是促进信息消费,加快经济转型升级;二是关注社会民生,带动社会管理创新。这些价值也正是目前党和国家领导人最为重视的,可见大数据既有理论价值也有现实意义。
我最初从维基百科了解到什么是“大数据”,它是由巨型数据集组成,这些数据集的大小常超出人类在可接受时间下的收集、庋用、管理和处理能力,具有Volume(大量)、Velocity(高速)、Variety(多样)等“3V”特性。仅从定义来讲,实在很难理解大数据到底是什么,有什么用处。刚好有一本推荐读物,维克托·迈尔·舍恩伯格所著的《大数据时代》,粗读之后,也有了些粗浅的认识。《大数据时代》从思维、商业、管理三个方面阐述了在大数据时代在下的变革,这些变革涉及我们生活的方方面面。作者在第一部分提出了三个令人耳目一新的观点:第一,不是随机样本,而是全体数据,这里要求数据要更多;第二,不是精确性,而是混杂性,这里要求数据更杂;第三,不是因果关系,而是相关关系,这里要求数据要更好。第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力。第三部分则是阐述了大数据时代下的弊端以及在管理上的措施。我理解,大数据并不是数据本身,而是一种思维方式,大数据令人着迷的地方在于用科学的方法进行预测,帮助人们发现未知并进行决策。
因阅读精力有限,我仅对作者第一部分的三个观点提出自己的理解。
关于作者的第一个观点“不是随机样本,而是全体数据”。作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,如果我们可以通过各种手段获得海量的数据,随机抽样自然就失去它的意义,所以放弃随机分析法这种捷径,采用全体数据。作者用大数据与乔布斯的癌症治疗例子说明了使用全体数据而非样本的意义,列举了日本“相扑”等来证明使用全体数据的重要性。我对这个观点部分认同,如果能够收集到全体数据而且分析数据的工具也足够先进,那么使用全体数据研究得出的结果自然更加令人信服。但是这个观点也过于绝对,就算是在大数据时代要想收集到全体数据还是不太可能实现的,因为收集全体数据要付出的代价有时会很大,所以我理解他说的全体数据不是指数量而是指范围或者类型,即大数据的随机样本不限于目标数据,还包括目标以外的所有相关数据。同时我认为目前大数据分析不能完全替代随机抽样分析,只是抽样的方法和范围需要加以拓展,毕竟目前对大数据的处理技术不够成熟,分析难度依然较大。
关于作者的第二个观点“不是精确性,而是混杂性”。作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。大数据时代要求我们重新审视精确性的优劣,甚至还说到大数据不仅让我们不再期待精确性,也让我们无法实现精确性。谷歌翻译的成功很好地证明了这一点,谷歌的翻译系统不像Candide那样精确地翻译每一句话,它之所以优于IBM的Candide系统并不是因为它拥有更好的算法机制,和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。我基本同意作者的这个观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。大数据的简单算法比小数据的复杂算法更有效,更具有宏观视野和东方哲学思维。
关于作者的第三个观点“不是因果关系,而是相关关系”。作者强调“大数据不是因果关系,而是相关关系,相关关系比因果关系更重要”。不需要知道“为什么”,只需要知道“是什么”。我不完全赞同作者的这一观点。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。作者也表述了“在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。”所以我认为的大数据应该是把看起来不相干的数据放到一起分析,找到某些跨领域的关联关系,进而推论因果关系,发现其中价值。
联系到目前国资监管、财务监督工作,有些工作虽然开展初衷与“大数据”无关,但实际却与作者的“大数据”理念不谋而合。
一是全面开展中央企业财务决算和全国企业国有资产统计全级次报送工作。目前我委财务决算和国有资产统计范围已经涵盖了全部国有企业,并非传统的规模以上抽样统计,而是包括了中央企业、中央部门管理企业以及地方国有企业等全部国有企业,不留死角;报送级次上也不是以往的三级及三级以上子企业统计,而是逐步推行全部国有企业全级次报送。目前国资委已经全面推行了中央企业财务决算的全级次报送工作,正在全面推动中央部门和地方国资委开展国有企业全级次报送。通过这一国有企业“大数据”,可以加强基层企业财务管控,及时掌握基层企业经营管理情况,全面摸清基层企业经营情况和股东结构,梳理财务资产管理流程和权限,加强基层企业财务状况监测分析,不断提升国有资本管理水平;同时以全级次报送工作为契机,督促国有企业定期组织开展基层企业财务检查,加大对资金、投融资、担保、利润分配、对外捐赠等重大事项的管控力度,抓好有关问题的整改落实。后续我们将在中央企业全级次报送的基础上,继续推动地方国有企业和中央部门管理企业开展全级次报送工作,建立覆盖全面、级次完整的国有企业国有资产统计“大数据”。这与作者的第一条观点,“不是随机样本,而是全体数据”相似,至少是建立了“大数据”基础。
二是开展委内报表整合工作。随着国有资产监管工作不断深入,各项业务对企业信息的需求客观上在不断增加。国资委作为企业外部监管机构,信息既是监管的依据,也是监管效果的体现。各业务厅局及时掌握相关信息是推进工作的客观需要。但是,各类信息散落在各个部门,无法使用全部信息形成决策合力。为此,我们开展了国资委统计报表整合工作,将委内各类业务报表进行集中,实现各类数据互联互通、共享共用和全面分析,为搭建全委数据共享大平台奠定基础,方便快捷地满足监管工作需要,准确提供决策支持,是提升国有资产监管效果的重要保障。这与作者的第二条观点,大数据的“混杂性”相似。
三是推动国有企业应用实施XBRL分类标准。当今世界数据逐渐成为社会发展的核心资产,XBRL作为基于网络的数据信息标准化处理语言,为大数据的战略应用和长远发展提供了有效技术支撑,近年来在国际上得到迅速推广。可以有效解决不同信息系统间的数据交换障碍,促进不同信息系统的互联互通和信息资源整合,推动企业信息在更大范围实现集成共享,在更大深度实现分析利用;应用XBRL技术公开企业财务报告,还有利于企业开展国际对标和国际对话,发现与国际先进企业的差距,不断增强国际竞争力。为此我们在财政部“通用分类标准”的基础上,开展了“国资委财务监管报表XBRL扩展分类标准”的研究与制定工作,并已开始试点推广实施。XBRL技术为企业财务数据、各类业务数据以及国际企业数据集中提供了统一的数据标准,为各类信息孤岛整合成“大数据”提供了的基础,为大数据的利用分析提供了必要条件。
四是推行国有企业财务信息公开。目前,多数所谓的“大数据”其实都是空壳子,因为数据还没有完全放开,我认为只有在政府层面上推动才能真正实现“大数据”的开发和利用。信息公开透明是公司治理有效的重要保障和衡量标准,是有效维护股东权益、防范内部人控制的重要途径。国有企业归全民所有,社会对国有企业的运营状况拥有知情权和监督权。社会各方面对中央企业和国有企业信息的及时性、完整性需求日益提高。实行国有企业财务信息公开,对强化公众监督,促进规范经营,提高管理水平,完善国有资产监管工作,具有重要意义。推动企业应用XBRL技术公开财务报告,是落实党的十八届三中全会精神,加快推动国有企业财务信息公开的有益探索,是完善国有资产监督机制,增强国有企业财务信息透明度,强化社会公众监督的重要举措。推行国有企业财务信息公开,逐步扩展到推行全部企业的信息公开,为大数据的来源提供了基础。
“大数据”时代是信息化社会发展的必然趋势,国资监管工作也只有紧紧跟随时代发展的潮流,在技术上、制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的国际竞争中摆脱受制于人的弱势境地,才能把握发展的方向,冲破与西方国家的差距。对于一个企业如此,对于一个国家更是如此。在如此快速的到来的大数据时代,我们还有很多知识需要学习,许多思维需要转变,许多技术需要研究,需充分考虑到大数据对于未来发展所带来的机遇和挑战。本人时间与精力有限,粗读到此,但有时间仍会进行精读,在这里推荐《大数据时代》,值得一读。
邱鹏,现任国资委评价局主任科员,长期从事全国国有企业统计数据的收集整理、汇总检索、建库维护、财务分析以及各类系统组织开发测试等工作,在推进委内统计报表整合、改进财务分析、深化数据利用以及推动中央企业财务信息化等工作方面发挥了重要作用。