此外,人体姿态识别在视频会议、互联网上的三文虚拟空间(如聊天室)等其它领域也都有着相当广泛的应用前景。
1.2 难点问题分析
到目前为止,还没有任何一套系统可以真正从视频序列中恢复人体姿态和三文结构。究其原因,主要是由于问题本身的困难性决定的,概括起来,有以下几点:
(1)人体结构
人体是非刚体,而且结构复杂;其次,人体运动是一个复杂的运动系统,人体的运动具有很大的自由度和高度的非线性特点。此外,人体外表由于穿着服装,表现出极大的差异,很难用统一的模型加以表达。正是由于上述问题的存在,目前,对于人体姿态识别的研究工作,都是从不同的角度入手,采用各类不同的约束与前提条件来简化人体的结构描述。
(2)运动分割
快速准确的运动分割是个相当重要但又是比较困难的问题。这是由于动态环境中捕捉的图像受到多方面的影响,比如天气的变化、光照条件的变化、背景的混乱干扰、运动目标的影子、物体与环境之间或者物体与物体之间的遮挡、甚至摄像机的运动等,这些都给准确有效的运动分割带来了困难。
(3)遮档处理
目前,大部分的运动重构系统都不能很好地解决目标之间互遮挡和人体自遮挡问题。遮挡时,人体只有部分是可见的,而且这个过程一般是不可训练的。简单依赖于背景减除进行运动分割的技术此时将不再可靠,为了减少遮挡或深度所带来的歧义性问题,必须开发更好的模型来处理遮挡时特征与身体各部分之间的准确对应问题。另外,一般系统也不能完成何时停止和重新开始身体部分的跟踪,即遮挡前后的跟踪初始化缺少自举方法。
(4)物理约束
人体运动跟踪和获取中所使用的人体关节模型或运动学模型需要考虑真实人体的物理约束。特别是要保证身体各部分之间不能相互穿透,且关节只能在有限的空间范围运动。从运动估计的角度看,这些约束可以缩小要估计的参数空间的大小,但同时自动地处理这些约束优化问题远不是那么简单,尤其是基于连续优化的方法,在人体模型的高文表示下很难,甚至无法求解。
(5)性能问题
虽然当前计算机的性能提升非常快速。但是考虑到摄像机捕获数据量和算法工作量十分巨大,导致视频帧率很低,达不到理想的效果。
由此可见,由于存在众多技术难点,已有研究工作在精度、效率和可靠性等方面还难以满足实际应用中人们对自然和谐人机交互的需求。这就促使我们另辟蹊径,探讨人体姿态分析领域中的新方法,新思路。
1.3 本文的研究内容与章节安排
1.3.1 本文的研究内容
单目深度摄像机采集人体姿态并进行姿态重建的过程中,存在诸多棘手的问题,诸如深度数据的噪音,以及捕获动作的自遮挡现象。尽管采用局部优先策略能够保证较高的帧率,但是快速人体动作和噪音数据引起的跟踪错误还是很难解决,同时,在实时性上还有很大的局限性。虽然现在已经提出了很多基于数据驱动方案用于解决上述问题,它们能够快速稳健地跟踪深度图像流[5,6,7,8],然而,这些方案对不包含在数据库中的姿态无能为力,因此只能依靠动作空间的密集采样来重建。结合了生成和判别方法的混合策略,是一种适合姿态估算和跟踪步骤的方法。参见例子[9,10,11,17,15,14]。在这些方法中,主要思想是通过数据库查询或分类的可识别组件来稳定生成优化算法。使用这种策略,可以使陷入局部极值的风险显著降低,对时间要求苛刻的全局优化就可以避免了。因此,我的目标,是建立一个人体姿态数据库,通过使用包含输入数据稀疏特征的3D姿态大型数据库[13],来检索假设动作,使得后期的采集和人体姿态重建可以依照数据库进行经验搜索。这样可以保证帧率,同时大大提高性能。 基于微软Kinect体感游戏控制器的人体姿态识别方法研究(4):http://www.751com.cn/jisuanji/lunwen_3676.html