领军学员——陈绍听:国威科技有限公司财务负责人,浙江大学金融学本科,注册会计师,中级会计师。具有丰富的民营企业实践经验,是一位讲求“凡事预则立,不预则废”的标准会计人,同时也是一位酷爱篮球、骑行等体育项目的运动达人。
小数据,大价值
——《大数据》读书报告
《大数据》通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例—奥巴马建设“前所未有的开放政府”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和推特等社交媒体、Web3.0与下代互联网的未来图景等等,为我们一一细解数据创新给公民、政府、社会带来的种种挑战和变革。
正在到来的数据革命,以及他如何改变政府、商业与我们的生活。何以能推动政府信息公开、透明和社会公正?何以促发行政管理和商业管理革新,并创造无限商机?又何以既便利又危及我们每个人的生活?政府、企业和个体又应当如何作为?通过本书了解了作者的核心思想,结合个人的工作实际思考政府以及企业和个人该如何作为,以迎接大数据时代到来。
一、大数据浪潮来袭
1、大数据定义:
传统意义上的“数据”是指“有根据的数字”,但在进入信息时代之后,“数据”二字内涵在扩大,它不仅指代“数字”,还统称一切保存在电脑中的信息,包括文本、声音、视频等。大数据之大,在于其潜在的“大价值”。“大数据”指一般的软件工具难以捕捉、管理和分析的大容量数据,一般以“太字节”为单位。“大数据”之“大”,并不仅仅在于“容量之大”,更大的意义在于:通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。数据是我们新经济的土壤,是我们未来智能社会的土壤,数据可以治国,还可以强国。
2、数据的分类及收集方式:
数据种类 | 收集对象 | 收集方法 | 包含内容 |
业务数据 | 下级部门和各类社会组织 | 以基层上报、被动接收为主 | 各项经济、业务、营运指标等 |
民意数据 | 单个公民或组织 | 投入人力财力、主动收集 | 健康、出行、饮食、治安、住房、穿衣、娱乐文化、社保福利、旅游、个体诉求、获得尊重等等方面的等数据 |
环境数据 | 自然环境、动植物、物体 | 以传感器自动采集为主 | 天气预报、大气、水、树木、动植物等方面的数据 |
数据按提交方式划分:强制性提交、选择性提交、志愿性提交。
3、大数据意义及影响:
大数据浪潮,汹涌来袭,与互联网的发明一样,这绝不仅仅是信息技术领域的革命,更是在全球范围启动透明政府、加速企业创新、引领社会变革的利器。
二、大数据是一种社会资源,政府需要主导对社会资源开发、利用
1、实施国家层面大数据战略规划,建立专门的数据治理机构来统筹与指导。
数据治理的重点在于数据定义的一致性和数据质量。不同系统中的数据要进行辨识和整合,因此需要完成统一的元数据定义。统一协调各个领域和行业的数据标准制定。
元数据定义和数据标准的建立,将会完全颠覆和取代掉目前政府、企业各个小系统中物料编码和物料描述等信息。将大大节约社会资源,并提高数据的共享性和流通性。当然,要完成元数据定义和数据标准建立,任务艰巨、困难重重。需要各国通力合作并进行最高层级的设计和规划,同时借助于智能技术发展来支撑。
2、建立数据开放平台,坚持开放数据。
开放数据是指将原始的数据及其相关元数据以可以下载的电子格式放在互联网上,让其他方自由使用。数据增值的关键在于整合,政府需要建立一个开放数据平台,让产生数据方能上传有关数据信息,并做好信息数据开放管理工作。
开放数据,不仅满足公民知情权,更在于让数据真正发挥资源的作用,就如同类似现金流的作用,作为一种生产资源流动起来。还可以催生创新,推动知识经济和网络经济的发展,促进经济增长由粗放型向精细型转型升级。
3、鼓励、扶持基于数据的创新和创业。
由于大数据实施投入大,战略意义重大。政府部门既要主导,同时也要引导好。出台政策鼓励数据应用创新和创业,传统手段有主导建立大数据产业园;也可拨款支持各类数据应用软件的开发,采用财政补助等形式;举办数据运用创新评比,奖励优秀的应用程序,鼓励民间创新力。
4、在全社会弘扬数据文化。
数据文化,是尊重事实、推崇理性、强调精确的文化。就现状而言,中国数据的公信力弱、质量低,数据定义的一致性差。每当政府部门公布有关GDP、CPI、PPI等指标数据时,都会引发社会广泛的争议,这方面国家曾经有过血的教训。对此,政府在这方面应该发挥主导作用,首先在公共领域推行数据治国的理念,依靠大数据来实施公共决策,而不是个人经验和长官意志。其次,加大数据治国的舆论宣传,力争在全社会形成“用数据来说话、用数据来管理、用数据来决策、用数据来创新”的文化氛围和时代特点。最后,中央及地方各级政府部门应该公开透明的公布有关数据统计的方法和方式,深入分析数据变化原因,对于争议数据要及时发声回应,适当的时候应该公布个别样本和来源。
5、政府应该围绕个人数据安全,加强隐私立法保护。
由于数据除了涉及公共数据,也牵涉个人数据,并深入到生活的方方面面,与个体息息相关。必然会涉及到个人数据安全和隐私问题。对此,政府需要尽早出台大数据应用的隐私保护,规避大数据收集、应用等方面的涉及国家安全和个体隐私等方面的风险。
三、大数据在企业中的运用将会催生商业智能
目前,企业运行中的数据细分为以下几类:
1、企业资源数据ERP;
2、产品数据管理PDM;
3、制造执行系统MES;
4、质量检化验系统QIS;
5、设备、项目管理系统。
作为企业系统核心的ERP,集合了企业各种业务数据、财务数据。但我们知道ERP系统归集的数据仅仅满足了核算、报告等基本要求,对于财务预测、分析和决策起到的作用微乎其微,更别说价值发现和创造。
互联网的大发展已经颠覆了各行各业,让我们相信借助于智能技术和互联网技术大发展,大数据的发展将会颠覆原来商业语言,催生一种新的商业语言。使得商务智能的产业链形成一个从数据整合、分析、挖掘到展示的完整闭环。
1、元数据定义和描述是形成新商业语言基础。
共享或通用物料描述标准化,实现上游的产品描述作为下游物料描述,需要借助于元数据的定义和智能技术发展。需要摒弃原来设计的物料代码,原来我们做加法,通过元数据清洗定义,我们实现做减法,减少企业间重复的产品和物料的定义工作。如果企业研发出新产品,只要发布产品有关属性或材料信息,就可以在平台上通过推送获得很多类似信息,依据运算规则会自动生成或获取已有的物料描述信息。形成了一种可交流、可沟通、唯一的、颗粒度精细的商业语言。
目前,社会各界大力推崇业财融合与管理会计等新概念,但在实际操作中仅凭目前的条件、做法会很难操作和落地,具体有以下几个原因:
1)数据颗粒度太粗,即使是业务数据,也很难有多维度的情境数据。
如会计核算的销售收入,有关业务数据在销售模块中以订单的形式体现。一般有时间或客户等维度统计某种产品的销售金额或数量。但难以清晰掌握订单需求与什么密切相关,是否与天气、原材料变化或具体日期等,他们之间是否存在内在的联系。如果单纯依靠现有的业务数据就难以提供,未来借助于大数据、传感器、智能技术、互联网技术,必然会大大提高业务数据记录的精细度,真正体现数据之大,才能挖掘大数据的价值。
2)数据收集方式落后,中间环节及人为影响因素多,影响数据收集质量。
企业的订单数据都是单独产生,订单通过企业人工操作录入,今天的录入的订单,不一定是今天下的订单。又或者客户下了三笔订单,企业合并为一笔下单。总之,人为影响因素太多,会造成数据失真和延误。借助于大数据,将社会上的企业一家家串联、连接起来,实现有关数据的时时传输和真实反映,尽可能减少中间环节。通过大数据,打通、拉近相关产业的整条产业链,在产业链条上角度考虑、解决问题,同时也体现精益生产的要义。
3)单体数据仅是个性化问题,数据量小,难以通过数据挖掘发现更有价值的信息。
单独一家企业的数据,只能是一个小数据,而不能做到大数据。在小数据中即使进行数据挖掘,也难以产生价值创造。因为一家企业小数据,就可能存在异常值或者个性化的东西,不具有规律性或趋势性东西,甚至还会误导判断与决策。
2、企业将原来独立的系统通过大数据平台进行联动与整合。
每个企业都是一个独立的数据库,通过大数据平台,建立起了多个独立的关系型数据库,经过数据整合形成统一的、多源的数据仓库。企业内部独立系统通过管道连上了大数据平台,数据时时进行互动。对于发生的业务数据要上传到大数据平台,也可让需求方能方便的查询数据,实现数据的双向互动和流通。通过平台联动、整合,企业不仅是大数据的提供者,更是大数据的应用者和参与者。
3、坚持开放数据,解决好数据分类管理。
多个独立的关系型数据库建立后,坚持数据开放原则。根据数据提交方式分类:强制性提交、选择性提交、志愿性提交,针对不同数据分类,采用不同管理方式。
本书指出公共数据开放遵循8大原则:
1)数据必须是完整的;
2)数据必须是原始的;
3)数据必须是及时的;
4)数据必须是可读取的;
5)数据必须是机器可处理的;
6)数据的获取必须是无歧视的;
7)数据格式必须是通用非专有的;
8)数据必须是不需要许可证的。
数据的开放遇到隐私权问题,所以目前各国都是基于公共数据入手尝试做好数据开放工作,做一个开放政府,需要切实做到财政透明、信息自由、财产公开和公民参与。对于企业和个人的业务数据,目前还难以做到有效开放。开放的定义也是不等于公布,就是你只要需要查询,就可以一对一的公开给你,开放的是数据库层面的,是一片一片的。开放也不一定是免费,数据既然是资源,那就有价值和价格,企业的数据,可以以收费的形式开放。开放也是有层次的,可以对某个群体、某个组织,也可以对整个社会开放。
4、解决好数据自动收集,大力促进传感器技术和硬件发展。
大数据由于数据都是以太字节为单位,必然收集数据量相比原有的方式是几何式的倍极增长。通过原有人工方式收集数据的颗粒度都很粗,既不现实也难以满足要求。唯有通过更多的自动化手段进行时时的收集和传送,才能达到大数据要求。随着互联网、传感器技术的进步,人类收集和储存记录数据方式和手段不断进步,会深入到社会的各个角度,最终落实到时时感应人、机器、动植物等有形个体的行为和作业上,甚至还能深入无形的境界,如感知人类意识或动物语言等等,满足大数据之大,同时,也确保收集数据的原始性和真实性,满足大数据的质量要求。
5、大数据的目标在于通过数据挖掘创造价值或规避风险。
对数据的记录和储存还不是数据收集的目的,通过数据的分析和数据深入挖掘,找寻其中的规律或趋势,形成新的知识,并运用这些的新知识,规避风险,实现企业目标与发展。
四、大数据将为改变、改善个体生活方式创造巨大价值
基于大数据,不仅改变我们的政府行为,影响国家民主和国家治理,还将改变企业的生存、发展方式,也深刻影响人类社会生活方式与习惯,涉及吃、穿、住、用、行及娱乐等方方面面。
我国是人口第一大国、互联网用户、手机持有量位居世界第一。在可预见的未来,手机、手环、穿戴设备、汽车乃至家电等智能化水平将越来越高,设备上加载的数据收集感应器也越来越多,这些设备将无时无刻不在收集个体的行为与作业,并为人类的健康、安全、生活挖掘出更多价值,为社会的进步创造价值。举几点简单例子:
1、通过传感器收集我们日常的食谱大数据,可以为我们私人定制最营养和可口的饭菜。并且时时监控我们不良饮食习惯,帮助我们在饮食上变得更健康。
2、根据我们的日常出行安排习惯和时时路况形成大数据,帮我们推送最经济和最便捷的交通方式和交通途径。可大大节约时间和资源。
3、根据汽车上的传感器收集驾驶者的驾驶习惯,保险公司可以评估驾驶者的驾驶风险,并根据风险指数的高低,给予定制不同价格的保险条件,而不会像现在的一刀切汽车保险。
4、通过大数据收集资料帮助我们炒股,将世界上已经存在的海量数据,包括财报、电视、几十年前的报纸、互联网、小道消息等挖掘出来,串联起来,甚至将社交平台上挖掘得到普通大众对某种股票的感情倾向,帮助快速、准确选股。
还有其他很多方面的运用,不再赘述。对于单个个体行为或意见并不重要,但是通过大数据收集1千人、1万人、十万、百万以上人的行为或意见,那将会掀起巨大的波澜,上亿人足以改变一切。另外,数据再多,但如果被屏蔽或者没有被使用,也是没有价值的。
五、结语
中国错失了前三次工业革命,落后了一百多年,目前面临着基于信息化、智能化第四次工业革命,这次我们绝不能轻易丢失机会。中国目前在对于数据三种来源方面投入及做得方面还有很大的空间,我们每年新增的数据量远不如美国。中国目前缺乏的不是可收集的数据,而是收集数据的手段和收集数据意识。我们一定要摒弃凡是差不多的意识。重视大数据的运用,学会用数据治理国家和描述事物的习惯。另外端正开发数据的态度,否则我们仍将面临着落后100年的。我们需要抓住历史机遇,重视数据,推动精准、不断进步。