热门搜索 :
考研考公
您的当前位置:首页正文

基于改进小波变换的语音基音周期检测

来源:伴沃教育
第38卷第6期2017年6月

白动化仪表

PROCESS AUTOMATION INSTRUMENTATION

Vol.38 No. 6June. 2017

基于改进小波变换的语音基音周期检测

吴兴铨1>2,周金治1>2

(1.西南科技大学信息工程学院,四川绵阳621010;

2.西南科技大学特殊环境机器人技术四川省重点实验室,四川绵阳621010)

摘要:基音在许多方面都有比较广泛的应用,比如语音编码、语音识别、语音转换、音乐检索以及发声系统疾病诊断等。针对目前 很多小波变换方法在测量基音周期时存在的准确度低、复杂度高、鲁棒性差等缺点,以及在带噪语音环境下,特别是在非平稳噪声下 比较难判断语音基音周期的问题,提出了一种基于改进小波变换的语音基音检测方法。首先将每帧带噪信号进行预处理,提取出有 话段的信息,消除直流分量;然后在加窗分喊后先进行端点检测,滤波后再分帧;接着再利用小波分解后取低频系数重构信号;最后结 合四阶累积法对重构信号进行基音检测。试验结果表明,该方法在不同带噪语音环境下和低信噪比条件下,提高了带噪语音基音检 测的准确性。与传统的小波变换法相比,该方法鲁棒性好且计算复杂度低,有利于语音基音周期检测。关键词:带噪语音;基音检测;小波变换;重构信号;三电平中心削波;端点检测;信噪比中图分类号:TH-3;TP391.4

文献标志码:A

DOI:10.16086/j. cnki. issnl000 -0380.201706016

Speech Pitch Period Detection Based on Improved Wavelet Transform

WU Xingquan1 2,ZH0U Jinzhi1 2

(1. School of Information Engineering,Southwest University of Science and Technology,Mianyang 621010,China;

2. Robot Technology for Special Environment Key Laboratory of Sichuan Province,

Southwest University of Science and Technology,Mianyang 621010,China)

Abstract : Pitch has been widely used in many areas, such as speech encoding, speech recognition, speech conversion, music retrieval and diagnosis of diseases of vocal system. Aiming at the disadvantages of pitch period measurement based on wavelet transform,e. g. ,low accuracy,high complexity and poor robustness,and the problem of the difficulty of judging the speech pitch period under noisy speech environment, especially under non - stationary noising, the speech pitch period detection method based on the improved wavelet transform is proposed. Firstly, each frame of noisy signal is preprocessed to extract the information with speech segments and eliminate the DC component. Then, endpoint detection is conducted after window - added framing, and re - framing after filtering ; and then the low frequency coefficient reconstructed signal is extracted after using wavelet decomposition. Finally,the pitch detection for the reconstructed signal is accomplished combining with the fourth order cumulative method. The experimental results show that under different noisy speech environment and low SNR condition, the accuracy of noisy speech pitch detection is improved. Comparing with the method of traditional wavelet transform, this method features better robustness and low computation complexity, these are helpful in speech pitch period detection.

Keywords: Noisy speech; Pitch detection; Wavelet transform; Restructured signal; Three - level center clipping; Endpoint detection ; SNR

〇引言

基音是语音信号的重要参数,语音信号中的音高

由基音频率[1]得到。基音广泛应用于各个领域,如语 音编码、语音识别、语音转换、音乐检索以及发声系统

疾病诊断等[2]。近年来,基音检测方法层出不穷,其中 具有代表性的方法有自相关函数法、平均幅度差函数 法、阴阳估计法、基于滤波器的算法、倒谱分析法、多分 辨率法和离散小波变换法[3]等。因为语音信号是一个 非平稳、非准周期的信号,会受到声道共振峰的影响,

修改稿收到日期:2017-03-16

基金项目:特殊环境机器人技术四川省重点实验室基金资助项目(13ZXTK07)

作者简介:吴兴铨(1992—),男,在读硕士研究生,主要从事语音识别、软件开发等技术的研究。E - mail :304094795@ qq. corn,

周金治(通信作者),男,硕士,副教授,主要从事计算机网络与物联网、智能家居、语音识别等技术的研究。

E - mail:zhoujinzhi@ swust. edu. cn0

• 68 •

自 动化仪表第38卷

所以到目前为止,基音检测的准确性仍较受关注。上 述所列的方法虽然在处理基音检测上有一定的可行 性,但在稳定白噪声的环境下信噪比(signal noise

ratio,SNR)会下降到0 dB,基音检测的准确率不高,仅

采用小波变换的基音检测准确率能达到80% [4]。

宋子荣等提出的小波算法[5 <能很好地适应语音 信号的时变特性,计算复杂度也适中。但小波算法也 有不足:它比较容易受到噪声和共振峰的影响,在基音 检测的计算上产生偏差。文献[7]采用改进的小波转 换,该方法削弱了噪声、降低了计算复杂度,但是计算 准确率不高。本文提出了一种改进的语音基音周期检 测的方法,在低信噪比环境下不仅能大大提高基音检 测的准确性,还能提高其鲁棒性。

1小波变换原理

小波变换主要包含两个部分:连续小波变换

(continuous wavelet transform,CWT )和离散小波变换

(discrete wavelet transform,DWT )。CWT 主要用于理

论分析,通过伸缩和平移参数连续取值,而计算机和工 程化角度的处理实现往往采用dwt[8]。1.1连续型小波变换

在连续小波变换[9]中,平方可积分函数W 0的连 续小波变换定义为:

Ws(a,b) = < s(t) j(t) x

叫匕^卜

(1)

式中为原始信号;< *,* >为内积;^ 为尺

度因子4 >0为平移因子;)为信号的傅里叶 变换;矻八0为小波变换基函数少(0的尺度伸缩^ 和时间平移6所产生的一族解析函数的结果,常数《 和^分别为尺度参数和平移参数。^中尺度参 数a的伸缩和平移参数6的平移为连续取值的小波变 换称为连续小波变换。1.2离散型小波变换

在离散小波变换[9]中,平方可积分函数W 0的连 续小波变换定义为:

Ws(a,b) = =

(2)

式中:当a=2』= l时,离散小波变换称为二进制离散小波变换[1°]。

2改进的小波变换基音检测

在非平稳、非线性的语音信号中,噪声的能量明显

低于语音段的能量™。在实际应用中,经常会有一些 强噪声的干扰,比如火车、汽车鸣笛、移动通信环境、机 械环境等。低SNR下的基音检测是语音研究中的难 点,传统的方法都存在一些不足:基于子带能量、周期 度量的方法只适用于某些噪声环境;基于熵的方法对 多路的串扰噪声效果不好;基于特征滤波的方法不仅 会增大计算量,而且会改变语音语谱结构、丢失原数据 的部分信息[12]。所以从计算量,以及在不同特征情况 下得分组合权重参数的鲁棒性考虑,以上方法都无法 从根本上解决噪声环境下的基音检测问题。

信号处理中常假设信号或噪声服从高斯分布,即 在常规的信号处理中,用二阶积累量表示随机信号的 统计特性与关系。任何类型高斯信号的三阶以上高阶 累积量均为〇。高阶累积量的这种特性可用于抑制噪 声,所以使用高阶累积量作为分析工具,对抑制噪声有 较好效果[13]。本文在采用小波分解后取低频系数重 构信号,结合四阶累积法对重构信号进行基音检测。

累积量是语音信号中一种比较重要的统计特征。 现有均值为〇的复平稳随机语音信号IZU)丨,〃 =〇,

± 1,…,± 00,其二阶累积量为:

C2,x(t) = E{x(n)x*(x + r) }

(3)

三阶累积量为:

= E{x(n)x(n + tx)x* (n + r2) } (4)

四阶积累量为:

= E\\x(n)x(n+7^%*^+t2)x* (n+t3)\\ -

E1)%(n)%(n + tx)丨£l丨%*(^^+T2)%*(^^+T3)丨-E\\x{n)x^ {n + r3)\\ E\\x(n +

r1)[%*(^i +r2)} (5)

由上式可得:任何类型的高斯语音信号,其三阶以 上的高阶累积量均为〇。

假设语音信号为,高斯噪声为〃,则带噪 语音信号表示为:

x(t) = ps(t) + qn(t)

(6)

式中^和9为增益系数。检测二元语音基音时,若采

用传统的基音检查方法,则能明显观察到,当SNR下 降时,检测的准确性急剧下降。为了实现即使在SNR 很小时,也可以得到较好的检测结果,需要计算语音信

号四阶积累量。在前文所述的高阶累积量中可以得出 玖0的四阶累积量。因为任何类型的高斯信号其三阶 以上的高阶积累量均为〇,所以可以将计算语音信号 四阶积累量的问题转换成计算带噪语音信号四阶积累 量的问题。本文采用小波分解后取低频系数重构信号 结合四阶累积法,对重构信号进行基音检测,一方面提 高了基音检测的准确性,另一方面也控制了计算量,且

第6期基于改进小波变换的语音基音周期检测吴兴铨,等• 69 •

不改变语音谱结构,保存了完整的语音信息。

在计算带噪语音信号的时候,运算量非常大,其根 本原因就是计算机进行的乘法运算非常耗时。因此, 可以采用三电平中心消波的方法对中心消波函数进行 修正。使用三电平中心消波后,可以有效避免错判为 倍频或分频的情况。将语音信号通过三电平中心削波 取的有话段的信息作DWT小波变换,用低频系数重构 信号。引入Cum表示累积量运算,则若有、(纟=1, 2,…,

= 1,2,…,A:)为随机变量,推导出:

Cum (

\\lxl

x

,\\2x2 ? *** ,^kxk)

=

(IlA,)Cum(%1,•••,〜)

(9)

器削波。三电平中心削波函数如图1所示。

1

-CL

c\\ 1

-i

图1 三电平中心削波函数

Fig. 1 The three - level center clipping function

由图1可知,其输出函数为:

y(t) = Cf[x(t) ] =

J 0

x(t) ^ CL (7) L- 1 x(t)〈- Cl根据式(6)可知,输出为<0。式(5)则说明了四 阶积累量的值,基于四阶积累量的基音检测推导出所 用的自相关函数为:

lC4Ji)C4Ji + r3),

。卜 ~ (8)

a\\/

XC4,,(^ +T3) 2

i=〇式中为窗长度。求得的峰值位置后,将这些峰值 的门限进行比较,相邻峰值的时间差就是基音周期。

经试验,在低SNR环境下,自相关法根本无法进 行基音检测,得到的结果也是错误的,而用高阶累积量 则可以准确、可靠地检测基音周期。本文就是利用小 波分解后取低频系数重构信号[14],结合四阶累积法对 重构信号进行基音检测。该方法的准确性优于带噪信 号下传统基音检测的方法,解决了在低SNR环境下无 法得到准确信号的问题。试验表明,该方法无论在低 信噪比,还是在噪声分布不均勻的条件下,对基音周期 都具有良好的检测效果,且不会出现试验数据准确率 骤然下降的现象,显示了非常好的鲁棒性。

假设带噪语音信号为沁),基音检测的步骤如下。①

对每帧带噪信号进行预处理,提取出有话段的 信息,得出语音段[15]。

② 消除直流分量,设置信噪比,叠加噪声;用所提

由前一节可知J⑴与40独立,由式(9)可以得

到的四阶累积量:

Cum[%(A: + ^i)x(k + ^2)x(k + ^3)x(k + =a x Cum[%(A: + ^)x(k +^2)x(k +^3)x(k +^4)] + bA x Cum[A: + ^)x(k + 9^2)x(k + ^3)x(k + ^4) ]

(10)

③对判断出的语音段进行基音检测。根据得到的 基音周期图判断算法的准确性和鲁棒性。

3

试验结果与分析

3.1试验环境

为了检测本文方法的可行性和有效性,选择深夜或 相对比较安静环境,在试验室录制内容为“西科大”的一 小段语音作为目标语音信号。设定录制的采样频率为

8 kHz,采样精度为32 bit;目标语音信号帧长为316 ms, 帧移为158 ms;采用标准噪声库N0ISEX -92中的高斯 白噪声、babble以及factory作为复杂干扰噪声[4]。

3.2结果分析

对原始语音波形图加入信噪比=-10 dB的

高斯白噪声后,对该加入噪声的语音信号进行预处理, 提取有话段的信息,得出语音段,消除直流分量,在加 窗分帧后先进行端点检测,滤波后再分帧,小波分解后 取低频系数重构信号。原始信号、加噪语音信号和重

构语音信号波形图如图2所示。

样点数

(C)重构信号

图2

原始信号、加嗓语音信号和重构语音信号波形图

Fig. 2 Waveforms of the original signal, speech with noise added

and the reconstructed speech signal

• 70 •自 动化仪表第38卷

*

-5 dB,用四阶累积法对重构信号进行

基音检测,其结果如图3所示。■

.X 〇L.〇

_10.5 _

1.0 1.51.5 2.0 2.5

._____3.0

Jxl〇4

样点数

(a)原始信号

‘丨__斤■醫丨響曜

〒.1 _叫

丨训4

~ 0.0

0.5

1.0

1.5 1.5

2.0 2.5

3.0

(b)样点数

加高斯噪声信号

-H

uo~

0.51.0

1.5

2.02.53.0

样点数 (c)基音周期

400

^200,

°oT

X104

0.5

1.0

1.5

2.5

样点数 (d)基音频率

图3 基音检测结果(*S7V/?= -5 dB)

Fig. 3 Pitch detection result under SNR = - 5 dB

为了更好地验证算法的准确性,也为了进一步验

证本文方法在低信噪比环境下的检测效果,图4为采 用本文方法、在

= -20 dB时的基音检测结果。

1.5

样点数 (a)原始信号

1.5 2.0样点数

(b)加髙斯噪声信号

rn

50

嵘#0,5

1.0

1.5

2.0

2.5

3.0

样点数 (c)基音周期

^200.

0.0

0.5

1.0

1.5

2.0

2.5

3.0

样点数(d)基音频率

图4基音检测结果(57V/? = -20 dB)

Fig. 4 Pitch detection result under SNR = - 20 dB

由图4可以看出,采用本文方法对小波变换进行 改进,大大提高了低信噪比下基音检测的准确性和鲁棒性。

本文通过大量的样本训练得出训练结果,并与文 献[2]中数据结果相比,列出了各种噪声下的准确率 结果。表1记录了采用小波-自相关函数加权平均幅 度差函数的方法和本文方法在不同噪声环境下的准

确率。

表1不同信噪比下的基音检测准确率

Tab. 1 Pitch detection accuracy under different SNR

信噪比准确率/%

/dB文献[2]方法

本文方法

安静

98991094995

9399-580

98-10无96-20

95

由表1可知,与文献[2]方法相比,本文方法的基 音检测准确率提高了 20%以上。本文方法在低信噪 比环境下,大大提高了基音检测准确性及其鲁棒性。

4结束语

基音检测对语音信号的后期处理具有至关重要的

作用,准确检测语音信号的基音周期对高质量的语音 分析与合成、语音压缩编码、语音识别与说话人确认等 具有重要意义[16]。本文提出了一种小波分解后取低 频系数重构信号,结合四阶累积法对重构信号进行基 音检测的方法。试验表明,该方法的基音检测准确率 明显高于目前已有的一些方法,并且在加入高斯白噪 声、低信噪比的情况下,也能得到比较精确的基音周 期,提高了整个系统的鲁棒性。

参考文献:

[1 ]唐振民,曹建红.基于哼唱的音乐检索技术研究[D].南京:南

京理工大学,2009.

[2 ]王民,曹绘,要趁红.一种改进的小波变换基音检测算法[J ].重

庆邮电大学学报(自然科学版),2012,24(3) :283 -287.

[3] 张杰,龙子夜,张博,等.语音信号处理中基频提取算法述[J].电子科技大学学报,2〇1〇(S1) :99 -102.

[4]

章小兵,李燕萍,王双杰.基于改进HHT的语音端点检测[计算机工程,2016(6) : 171 -174.

[5] HU J L,XU S,CHEN J. A modified pitch detection algorithm[ J].

IEEE Communications Letters,2001,5(2) :64 -66.[6]

宋子容,袁春,温启荣.小波分析法对多带激励声码器基音提取

的改进[J].重庆邮电学院学报,1997(2) :33 -37.

[7 ]李坤,刘加.基于小波变换和线性预测的基音提取[J].计算机

工程,2010(10) :276 -278.

[8]胡航.现代语音信号处理[M].北京:电子工业出版社,2014.

(下转第74页)

综 J].

• 74 •

自 动化仪表第38卷

表1温度数值对比

Tab. 1 Contrast of temperature values

装置 恒温箱测量表1测量表2测量表3测量表4测量表5

温度

101010101010

202020202020

303030303030

404040404040

505050505050

606060606060

707070707070

808080808080

[4] 付立华,王刚,张晓玫.基于LabVIEW的温度监测系统及软件设

计[J]•河南工程学院学报(自然科学版),2〇14,26(1) :67 - 70.

[5] YUNTENG Q,PINGKANG L,TA0TA0 J. Development of experimental

equipment on temperature control based on LabVIEW [ C ]//Control and Decision Conference (CCDC) ,2010:2596 - 2598.

[6] GIANNONE L,EICH T, FUCHS J C,et al. Data acquisition and

real - time bolometer tomography using LabVIEW RT [ J ]. Fusion engineering and design,2011,86(6/8) :1129 - 1132.[7] 南凯刚,孙小明,王少锋.基于LabVIEW的虚拟温度测试系统

设计[J].内蒙古石油化工,2016(7) :28 -30.[8] 张霞.虚拟仪器技术的研究与应用[J].电子技术与软件工程, 2014(8) :137.[9 ]史延东,杨萍,宁飞,等.基于LabVffiW的多路温度流量监测系

统设计[J].测控技术,2013,32(8):29 -31,35.[10 ]李菲,江世明.基于LabVIEW的温度测量系统设计[J ].现代电

子技术,2014,37(6) :114-116,121.[11 ]叶军,郭栋.基于LabVIEW的温度采集控制系统[J].电气电子 教学学报,2016,38(3) :71 -73,91.

[12]王敏.基于LABVIEW的虚拟仪器系统的设计与实现[J].通讯

世界,2016(22):270.[13 ]于洋,于文波,徐立波,等.虚拟仪器的发展现状及其应用[J ]. 洛阳师范学院学报,2015,34(2):48 -51.[14] 邵晓娟,黎炜.基于LabVIEW的电气教学虚拟实验室应用研

究[J] •虚拟仪器技术,2014(5) :47,59 -60.

[15] 丁宗玲.基于LabVIEW的数据采集卡控制和温度采集方法研

究[J] •大学物理实验,2013,26( 1) :8184.

[16] 王晓.基于Labview的温度监测系统设计[J].自动化技术与应

M,2016,35(10) :153 -154,159.

[17] LUNA-MORENO D,SANCHEZ Y M E,LE0N Y R P D,et al.

Virtual instrumentation in Lab VIEW for multiple opticalcharacterizations on the same opto - mechanical system [ J ]. Optik - International Journal for Light and Electron Optics,2015,126(19): 1923 -1929.[18] 王锋,杨超,赵河明.基于LabVffiW的虚拟温度检测系统[J].

测试技术学报,2013,27(5):431 -435.

[19] 李世红.基于LabVffiW和单片机的温度监测系统设计[J].湖

北农业科学,2014,54( 19) :4836 -4839.[20 ]郑越,唐阳春,杨光.基于LabVIEW的环境温度采集系统的设

计[J] •现代计算机(专业版),2015(19) :72 -77.

4.2结果分析

由表1可以看出在一段时间内温度的变化情况, 通过分析表中数据可知基于LabVffiW的温度自动检 测系统程序的准确性。通过观察恒温箱与测温表的温 度数值对比,可以准确得知在检测时间内温度的数值, 证明构建的温度检测系统实现了温度的实时监测、自 动存储等预期的功能。该系统运行平稳、采集时间设 定灵活,可以应用于不同领域的温度检测。

5结束语

本文设计了一套温度仪表自动化检测装置,通过

对接收的信号进行数据处理、图形显示,同时采集处理 后的数据与检验检测综合信息系统进行共享,实现了 仪表检验检测的自动出证。该温度检测装置不但能科 学、合理地检测温度,而且可以通过自动化技术避免油 田开发中由于温度漂移所造成的不必要的资源浪费, 提高了参数准确率,提升了产业效率。

参考文献:

[1] 魏延萍.基于LabVffiW的温度检测系统的设计[J].自动化技

术与应用,2014,33(5) : 106 -108.

[2] 彭登,罗贤虎,徐行.基于LabVIEW的多通道温度测量系统设

计[J].电子设计工程,2014,22(7) :47 -49,53.

[3] 路敬伟,王冬梅,段志伟,等.基于LabVIEW的多点温度采集实

验开发系统设计[J].电子设计工程,2013,21 (23) :4 -6.

(上接第70页)

[9 ]

究[D].青岛:青岛科技大学,2008.

张贤达.现代信号处理[M ].北京:清华大学出版社,2002.

[13 ]金晶.短波通信系统中8PSK调制方式识别技术的研究[D ].西

安:西安电子科技大学,2012.

[14]史振江,安建龙,赵玉菊.基于MATLAB的小波消噪仿真实

[10] 热依木汗•热西提,Pi:尔洪江•阿布都克力木,冯惠,等.基于二进

小波变换的语音基音检测[J]•科技展望,2016(11) :111 -112.

[11] GUO Y M, FU Q, YAN Y H. Speech endpoint detection in real noise

environments[ J]. Chinese Journal of Acoustics,2007 ,26(1) :39 - 48.

现[J].石家庄铁路职业技术学院学报,2008(1) :63 - 66.

[15 ]陈炜杰.噪声环境下的说话人识别技术研究[D ].杭州:浙江工

业大学,2008.

[16 ]张少龙,吴佳鑫.语音信息的内容分析技术研究综述[J ].现代

图书情报技术,2007(4) :28 -31.

[12] 孙海英.基于倒谱特征和浊音特性的语音端点检测方法的研

因篇幅问题不能全部显示,请点此查看更多更全内容

Top