LPFT基于局部多项式傅里叶变换的语音盲源分离(2)

自1980年以来，盲源分离(blind sources separation,BSS)技术在其中后期快速发展起来，是一种新兴的信号数据处理方法，但随着这种技术的发展，它的功能、应用方面也变得更加广泛。作为人工神经网络、统计信号处理、信息理论这几门学科相互渗透融合的产物，盲源分离具有很重要的理论方面和应用的价值，所以如今已成为各个相关领域中研究与发展的重点方向[1]。盲信号处理的发展与数理统计、神经网络、信号处理等方面密切相关，在生物医学、电子信息、图像处理、通信、雷达、声呐、语音、地球物理科学、数据等许多方面得到应用，特别是对生物医学和通信的等领域有突出的贡献，促使它们迅猛地发展起来，从而盲源分离问题成为当前国内外学术界的一个研究热点，其实用价值不容忽视。
盲源分离，是信号处理中由来已久而又充满挑战的问题，是指在无法精确得知源信号和传输通道其信息的情况下，将各个原始信号，从混迭信号（观测到的信号）中提取、恢复（分离）出来的过程。这里的“盲”意着源信号未知（不可观测），并且系统参数也没有先验知识（如非高斯性、循环平稳性、统计独立性等）的假设，因此盲分离这方法能更广泛地适用。在科学研究和科学实践应用中，很多观测信号都可以看成是多个源信号的混合，也就是说，源信号的不同组合被多个传感器接收，它们的输出就是被观测到的混合数据。而盲源分离就是要从观测到的若干信号数据中恢复出我们所需要的源信号。
“鸡尾酒会”问题（cocktail party）就是这样一个典型的案例：假设你在大厅参加一个招待会，现场有各种各样的声音，比如许多人同时的交谈声,甚至可能是中文、英文等不同的语言交杂；背景音乐声；窗外的风声、鸣笛声等等。如果在不同的未知有足够的麦克风去记录这些声音，各个麦克风记录的信号是具有不同权重的说话者语音信号的混合信号。尽管人们可以在现场很多干扰自己的情况下依然能够将注意力集中在交谈对方所说的话上，甚至你还可以边谈话边听音乐等。但计算机通过话筒采集到的是在事先不知道声源的任何信息以及话筒位置的情况下，多个说话者甚至环境中的噪声混合在一起的声音。如何仅仅从计算机采集到的杂乱的语音信号中分离出我们需要的说话者的声音？这类问题就是需要依靠盲源分离来解决的。
由此可见，盲源分离方法的研究不仅具有理论高度，还兼具了非常重要的实际意义，在各个相关领域都发挥了重要的作用。正如前面提到的cocktail party问题，首先通过对混叠信号的分离，逐一得到单个说话者的声音，然后再对其进行其他处理得到我们需要的信息；在军事通信方面，现代战场环境不可同日而语，充满着各种先进的技术。雷达接收到的可能是多个目标发出的混叠信号，如果对这杂乱的无线电信号先进行分离，再做进一步处理，辨别能力才能有显著提高，从而识别到敌方和我方的信息[2]；在移动通信应用领域，天线接收到的也是混叠信号，且因为“移动”，所以只能通过接收到的信号来确定原始信号。显然盲源分离方法也可以得到直接应用；在生物医学信号处理中，被多传感器检测到的同样是各种生物电信号混合在一起的混叠信号，当需要进行某种诊疗时，往往仅需要了解各种不同的生物电信号的其中某种特定的生物电信号的特性。还有在遥感影像分析、图像处理与识别、语音增强、地震信号勘测和噪声消除等各个方面，都会遇到类似的问题。
因此，数字信号处理方面的理论和技术不断发展，使BSS的研究也变得越来越广泛、深入。更多的有效盲源分离算法被提出，很多算法变得更加完善、优化，使得盲源分离问题发展成为当今信息处理领域中引人注目的应用热点。 LPFT基于局部多项式傅里叶变换的语音盲源分离(2):http://www.751com.cn/tongxin/lunwen_21029.html