○2信息即时多样化
微博具有十分便利和广泛的发布渠道,其用户可以通过互联网更新自己的微博,也可以记住手机等移动设备发布和接收信息,线上线下都可以即时发布微博消息,充分体现了微博的时效性及便利性的特点。而互联网与手机充分结合的实现,将微博与BBS、博客等传统的网络互动行为方式很好的区分开来了。
微博用户能够以非常简短的文字随心所欲的发布自己的见闻,不仅仅依靠互联网,还可以借助手机等各种客户端进行微博内容的随时上传,其方便快捷的特性无形中确保了消息的实时性。也正是由于微博本身这种“随时、随地、随性”的特点,更能受到用户的青睐。而微博内容能够即时更新,也使得微博关注者们持续关注微博动态,刷新微博页面,及时浏览到同步更新的信息,从而第一时间掌握事态进展。相比其他新闻媒体可以很明显看出,微博在获取第一手消息方面要高效很多。而在现实情况下,也确实有很多时下热点消息是我们在微博中率先获得的,越来越多的组织机构乃至个人也愈加倾向于通过微博发表自己的决定和意见等。于是有人形象的称微博为“第一新闻发言人”。
○3信息呈裂变式传播
微博中的每个人几乎都有着多面身份,既是关注者,也是被关注者。浏览别人消息的同时,自己的消息也在被别人浏览,所有人都充当着传播链中的一个个节点,相互连接起来。用户之间可能因为信息交互产生新的信息,而全部信息都全面开放且共享,并且以滚雪球的方式快速传播,各个用户不管是微博消息的发布者还是微博信息的接收者,都将围绕自己形成各种规模大小的信息传播网络。
微博信息的传播路径主要可概括发散性的和转发性的。所谓发散性的传播是指微博信息在发出后,会即时出现在所有关注它的微博用户的面前,由一点发散性传播到各点。而转发性的传播是指一旦某个关注了的用户对该消息进行了转发或者评论后,关注了该用户的其余用户也能即时浏览到微博消息的相关内容,由一点到另一点相互传递性的传播。两种传播方式相互融合,不仅极大提高微博消息传播速度,还能快速扩大其传播范围,呈现裂变式发展。整个传播过程的参与者将决定信息传播的内容,传播的速度以及范围。这种交互性的传播形式相比与传统的传播结构可以说是一大飞跃。也正是由于微博这样超常的传播形式,决定了其未来在公共领域能够扮演及其重要的角色。
内容短小、发布方式多样便捷的使得微博消息在第一时间就能发出。微博用户在对信息浏览过后也能快速转发,实现微博内容短时间内的大范围传播。
结合上面对于新浪微博特征的介绍,在对微博数据进行挖掘时需要考虑到微博属于短文本,而且一般情况下有着字数的限制。一条条微博其实就是一个个文本片段,共同构成了微博这个集合中的一个个元素。在对其进行研究时,必须充分了解其特点,才能在此领域有进一步发展。
以往的文本挖掘技术主要是针对一些长文本,但并不一定适用于微博这类的短文本,而随着即时通信工具的发展,越来越多的信息由短文本构成,这对目前的挖掘技术是一大挑战。因此在未来对微博数据进行挖掘的研究过程中需要结合微博短文本的以下的主要几个特点进行技术改进,即:
○1文本表达具有口语化的特点,比较随意;
○2文本特征词难以检测;
○3文本样本存在信息冗余度高的问题。
2.4.3 新浪微博的基本功能
作为一种新兴的网络社交平台,微博须具备一定的基本功能,以满足信息交流和传播的需要。而新浪微博的基本功能根据其功能设置,可以概括为以下方面[40]: 新浪微博中的话题突变识别与分析研究(8):http://www.751com.cn/xinwen/lunwen_18937.html