- 坚守与变革?遭遇大数据时代的传统出版业
- 张立 介晶等
- 1576字
- 2020-08-29 05:00:21
第二章
互联网等新兴产业大数据状况
面对大数据时代带来的挑战,出版业应如何看待大数据?又该如何利用大数据技术推动行业发展?出版人首先需要对数据的价值有足够深刻的认识、对大数据技术有一定程度的了解,这样才能更好地利用大数据进行服务。本章主要从大数据的数据类型、大数据规模、大数据利用三个方面详细介绍我国互联网等新兴产业大数据现状。
数据类型分类标准多样,典型数据已实际应用
针对海量复杂的数据如何进行归类的问题,很多专家给出不同的分类方法,本章对大数据常见分类形式及其主要类型进行了汇总。同时,著者依据数据典型应用类型对大数据进行了分类,将其分为用户行为数据、用户消费数据、用户地理位置数据、机器和传感器数据、互联网金融数据和用户生成数据。
数据规模呈指数增长,其中我国增长最为显著
近年来,人类产生的数据呈指数增长。国际数据公司(IDC)数字宇宙研究报告《大数据,更大的数字身影,最大增长在远东》显示,到2020年数字宇宙将超出预期达到44ZB,这一数据是2011年的22倍,而人均数据预计在2020年也将达到5247GB。其中,中国的数据增长最为显著。在市场规模方面,2014年全球大数据市场规模达到920亿美元,大数据进入从概念到实际应用的关键转折期。
部分领域已广泛采集大数据并应用大数据技术
目前,很多企业已意识到大数据的重要性,应用大数据所带来的效果主要在趋势预测及产品优化等方面。大数据最先在电商、金融、交通、医疗等行业应用。
随着社交网络、博客、移动端通信等新型信息发布方式的不断涌现,以及云计算、物联网等技术的兴起,数据正在以前所未有的速度不断增长和积累。2012年以来,“大数据”(Big Data)一词越来越多地被提及。利用大数据处理问题已经成为全球性趋势,并引起产业界、学术界以及政府机构的高度重视。
国外的大数据研究工作主要集中在大数据存储、处理、分析以及管理的技术及软件应用上。早在2008年9月,学术界《自然》(Nature)期刊就推出了大数据的封面专栏,从互联网技术、超级计算和生物医学等方面来专门探讨对大数据分析、存储以及工具集的研究。《科学》(Science)在2011年推出了关于数据处理的专刊《数据处理》(Dealing with Data),探讨大数据带来的机遇和挑战。随着各种类型数据的增长,用户只要想从庞大的数据库中提取对自己有用的信息,就离不开大数据处理技术和工具。根据上面的阐述可以看出,大数据的重要性已十分凸显。
关于国内新兴产业大数据发展状况,2012年5月,在香山科学会议组织的以“大数据科学与工程 —— 一门新兴的交叉学科”为主题的会议中,与会专家深入探讨了大数据的理论与工程数据研究、应用方向等重要问题。大数据的出现也必然伴随着新兴处理工具的出现。整体来看,大数据已经告别知识普及阶段,迈入实际应用阶段。
大数据的价值不在于数据本身,而在于如何结合机器算法来分析发现规律、预测未来。于是,如何利用数据创造价值成为众多行业关注的一个焦点。2015年9月,国务院印发《促进大数据发展行动纲要》,明确提出要发展大数据在工业、新兴产业、农业等领域的应用,推动大数据发展与科研创新有机结合,推进基础研究和核心技术攻关,形成大数据产品体系,完善大数据产业链。
在大数据的浪潮下,出版业和其他行业一样,已经可以感受到大数据技术发展带来的影响。出版业应该如何看待大数据,出版业有哪些数据,这些数据是不是可以称得上“大数据”,出版业又该如何利用这些数据推动产业发展等问题,引起了出版界的关注与探索。
这些年来,出版的介质形态、生产流程、内容结构等都发生了很大的变化。可以肯定的是,经历过数字化转型的出版业积累了丰富的数据资源,但从目前看仍不具有直接应用大数据技术的条件。面对大数据时代带来的挑战,出版人只有对数据的价值有足够深刻的认识、对大数据技术有一定程度的了解,才能更好地利用大数据技术为出版业服务。
下面就从大数据的主要类型、大数据的规模、大数据的利用三个方面对大数据进行全面介绍。