在系统管理领域,已有大量的研究工作致力于系统事件挖掘,并且提出了许多用于识别系统异常行为和事件/系统组件之间关系的算法。在这些研究工作中,事件数据往往是离散项或结构化事件的集合,而不是文本日志信息。离散化的或结构化的事件的获取、可视化和分析相对于文本日志信息而言,要容易得多。研究人员已经研发出一些可视化工具包用于宏观地展示一个庞大离散事件集上的系统行为。然而,大多数计算机系统仅生成包含许多细节信息的文本日志。因此,我们需要将文本日志转换成离散化的或结构化的事件。为实现这一目标,我们需要关注一些基于数据挖掘的方法以实现从日志中提取系统事件。27040
除了从日志文件中提取事件以外,事件摘要是数据挖掘领域事件挖掘方向相对新的研究热点之一,可以被视为是频繁项集挖掘和频繁场景挖掘的扩展。频繁模式挖掘技术通过识别离散时间之间的相关性,能揭示一些令人感兴趣的模式,往往可以作为事件摘要的构造块。论文网
现有的大部分事件挖掘研究工作都致力于场景挖掘或频繁模式发现。这些方法简单地产生相互独立的大量模式,而不能提供一种简要的和综合性的事件摘要以揭示数据集所蕴含的系统视图,且这些模式对于系统管理员而言难于获得将它们应用于降低系统运行风险的方法。
最新的事件挖掘研究工作不在聚焦于频繁模式发现,转而关注事件摘要。通常的方法是将事件序列划分为不相交的事件片段,而后为每一个事件片段产生一个事件模式用于描述片段中的事件。Peng提出了一种事件摘要方法,该方法从通过分析事件日志进而度量事件达到获取模式,Kiernan将事件摘要建模成优化问题,主要目的是平衡摘要的准确性和局部模型的缺陷,为此提出了一种基于分片的事件摘要方法,该方法将事件序列按照事件出现的频率变化划分为若干个事件片段[2]。基于上述工作,Peng进一步地提出了采用隐马尔科夫模型来刻画事件序列片段之间的状态迁移过程[3],改进基于分片的事件摘要方法然而,这些方法获得的事件摘要对于数据挖掘领域的外行而言难于理解,无法为系统管理员提供足够的帮助。 事件摘要数据挖掘国内外研究现状:http://www.751com.cn/yanjiu/lunwen_21411.html