一、大数据与秘书信息素养概述
(一)大数据的定义与特点
大数据(Big Data)是人类活动的产物,来自人们认识世界与改造世界的过程中,是生产与生活在网络空间的投影。虽然这个名词已经出现了有10年以上的历史了,然而至今学界对它也没有一个统一而完美的定义。麦肯锡[ ]认为:“大数据指的是所涉及的数据集规模已经超过了传统数据库软件获取、存储、管理和分析的能力”。[ ]在他的定义中,主要关注的还是大数据的规模,这是一个主观性的、可变的定义。可以预见,随着信息科学技术的发展,符合大数据评判标准的数据集的容量也会随之增长。IBM[ ]则用4个特征相结合来定义大数据:数量、种类、速度和真实与准确,简单地说,大数据就是容量庞大、速度极快、种类丰富并且真实准确的数据。[ ]Gartner[ ]则直接将大数据与“极限信息”等同,并将它分为12个维度。[ ]在这12个维度中就提到了数据的多样性、大数据量、高速、保真度等。由此可见,“大数据”这个词汇虽然是简单得不能再简单了,但它的内涵却是丰富的。经过查阅比较,我们发现虽然不同的企业和领域对大数据的定义各不相同,但是其中都广泛提及了大数据在3个主要维度上的特征,即3V——Volume(数量)、Variety(种类)和Velocity(速度)。但就大数据对现代企业秘书的信息工作而言,我们更愿意用大数据的“5V”来概括它的内涵。
相对于传统数据信息,大数据的5个典型特征(5V)分别是:⑴Volume(数据量),即数据规模越来越大,从TB(Terabyte)级别一跃而升到PB(Petabyte)级别(1TB=1024GB,1PB=1024TB)。⑵Variety(多样性),指网络中数据类型繁多,如各种声音和电影文件、文档、地理定位数据、网络日志等等。⑶Velocity(速度),简单地说就是电子网络中实时数据的数据变化率很快,不仅指数量的增加速度快,而且包含了数量变化的种类很多。例如,新浪微博中分享的内容条目每天可达上亿个,随之增加的数据每天要超过500TB。⑷Value(价值),网络中各种各样的数据都有,但是其中真正有用的、有价值的却是不多的,而这些有用的数据能产生的商业价值不可低估。简单的概括就是数据的价值密度低,而其商业价值高。就比如商场、地下停车场的视频监控,在24小时连续不间断的监控过程中,可能真正有用视频画面只有那么一两秒。⑸Veracity(真实性),采集来的大数据不能保证完全真实,但是秘书的信息工作需要真实有效的信息。在大数据的这5个典型特征中,数量、速度、种类这三个都是大家广泛认同的,毕竟一提起“大数据”这个名词让人们首先联想到的就是大量的数据,多样化的数据。而且,现在越来越先进的传输媒介的发现和使用也给大数据的快速传递提供了技术保障。然而,价值和真实性这两点特征则是大数据环境下秘书信息工作对大数据的特殊要求。如果在秘书的信息工作中,获得的数据本身价值不高,那么秘书做再多的工作,付出再大的努力,也分析不出多么有用的信息,只有在数据有价值的基础上,才能从中挖掘出更大的隐含价值。同样的,如果秘书人员利用不真实的数据进行工作分析,那么得出的结论就是无根之木,站不住脚,没有任何价值,反而白白浪费了时间精力。所以,在秘书的信息工作中数据的真实性和时效性异常重要。由此不难发现,大数据对现代企业秘书驾驭信息的能力提出了挑战,大数据环境下海量信息收集、数据处理和数据分析逐渐成为信息素养教育的重要内容。
(二)信息素养的定义与本质