单位文秘网 2022-02-20 08:14:04 点击: 次
思想是在原始音频信号的时间域同时嵌入水印和同步码(Synchronization Code, SC)。输入信号分帧后进行EMD得到其IMF,然后将二进制的同步码和真实的水印比特(图2)按顺序嵌入在最后一个IMF的极值中,每个极值可以嵌入一位(0或1)数据。
由于EMD后的IMF及其极值的数量取决于每一帧原始信号的特征,因此在每个IMF分量中嵌入的比特数是不相同的。一组水印和同步码不是嵌入在同一个IMF极值点中。一般情况下,每一帧信号最后IMF极值的数量比水印序列长度要小。如果设定同步码和和水印的比特数分别为N1和N2,则嵌入的二进制序列的长度等于N1+N2。这么长的序列可能分布于几个连续帧的IMF极值中。此外,对同一段水印采用了多次(P次)嵌入的方法。最后,对IMF进行EMD重构,连接各帧后得到携水印音频(见图3)。提取时,对携水印音频信号分帧后,进行EMD,在最后一个IMF中寻找同步码后,得到二进制数据序列(见图4)。
由于EMD是完全数据驱动的,因此在嵌入水印前后其分解得到的IMF数量完全相等。如果IMF的个数不同,便不能从最后的IMF中提取水印信息。为了解决这个问题,对携水印音频进行EMD时,其IMF数量强制设定为与嵌入时IMF数量相同。由于水印提取时不需要原始音频信号,因此本方案是盲水印方案。方法的详细描述如下:
1.1 同步码
设U为原始同步码,V为相同长度的未知序列,T为预先定义的阈值,对U和V按位进行比较,当不同点的数量低于阈值时,则认为V是同步码。
1.2 嵌入
同步码和水印信号组成一个二进制序列。这个二进制序列的嵌入过程如图3所示,详细描述如下:
步骤1 对原始音频进行分帧,得到互不重叠的音频帧;
步骤2 对音频帧进行经验模式分解,得到固态模式分量IMF及残余分量r;
步骤3 在最后一个固态模式分量IMF的极值点,按照均匀量化的方法嵌入水印信息,量化值可通过式(2)计算:
式中:」表示向下取整;d是量化步长;w是水印信息;x是最后一个固态模式分量中的极值点;sgn表示符号函数,当x是极大值时取“+1”,当x是极小值时取“-1”;
步骤4 利用修改后的最后一个IMF和步骤2中的其他分量,恢复出携水印音频信号;
步骤5 重复步骤2~4,直到所有水印嵌入完成。
1.3 提取
提取水印时,首先将携水印信号划分为等长度的音频信号帧,对每一帧音频信号进行EMD。利用式(3)提取二进制序列。通过逐位滑动窗口检测同步码以定位水印信号的位置。设y={m*i}为提取出的二进制序列,U为原始的同步码序列。水印提取的框图如图4所示,具体步骤如下。
步骤1 按照嵌入水印时相同的分帧方法,对将携水印音频信号进行分帧。
步骤2 对音频帧进行经验模式分解,得到固态模式分量和残余分量。
步骤3 挑选出最后一个固态模式分量的极值。
步骤5 设定长度为N1的滑动窗,并从提取出的水印中取出前N1个序列。
步骤6 将N1个水印信息序列与同步码逐位比较,当其相似度大于某一阈值时,则认为这N1个序列是同步码信息,并跳转到步骤8;否则继续步骤7。
步骤7 将滑动窗向后移动1位,重新组建N1个水印序列,并重新校验同步码相似度。
步骤8 逐位比较第二个提取出的分段V′=y(I+N1+N2:I+2N1+N2)和U的相似度。
步骤9 对I增加N1+N2位,如果I与水印序列长度相等,转到步骤10;否则,重复步骤7。
步骤10 对提取出的水印信息进行校验,得到水印信息。
水印嵌入和提取的整个过程如图5所示。
3 实验分析
为了检验方案的效果,对4种音乐类型:古典乐、爵士乐、流行乐和摇滚乐进行分析。音频采样频率为44.1kHz,位深为16b。水印信号w为M×N=40×40=1600位的二进制位图(见图6)。将二维图像转换为一维二进制序列。同步码使用16位巴克码1111100110101110。为了取得不可感知性、嵌入容量和鲁棒性之间的良好折中,将320个音频采样点作为一帧音频帧,阈值T设置为4,S固定为0.98。
3.1 不可感知性
对水印方案不可感知性的评价可以采用主观听力打分或客观计算的方法。本文采用客观评价的方法,即通过信噪比和客观差异等级(Objective Difference Grade, ODG)进行评价。表1列出了四种音频类型携水印信号的信噪比和ODG值。可以看出SNR值都在20dB以上,符合国际唱片业协会标准。ODG值介于-1与0之间,表明音频质量良好。图7是一段流行音乐信号及其携水印版的比较,可以看出,其差别很小。
3.2 鲁棒性
为了评价水印方案的鲁棒性,对携水印音频信号进行如下处理:
加噪 在携水印信号中加入信噪比为20dB的高斯白噪声;
滤波 利用维纳滤波器对携水印信号进行滤波;
剪切 随意选取携水印信号的13个位置,将512个采样点剪切,并利用加高斯白噪声后携水印信号相应位置的信号代替;
重采样 原始采样频率为44.1kHz,对音频信号进行22.05kHz的降频采样,然后再进行44.1 kHz的升频采样;
MP3压缩 利用MP3压缩软件对携水印信号进行64kb/s和32kb/s的压缩,然后再进行解压缩;
重量化 对位深为16位的携水印信号降低位深为8位,然后再升高到16位。
表2是一段流行音乐的携水印信号在不同攻击情况下的NC值和BER数值。可以看出,NC值都在0.9482以上,大部分情况下的BER值都低于3%。图8是不同攻击情况下提取出的水印,可以看出提取出的水印在视觉上与原始水印十分相似。表明了该方法对流行音乐信号的鲁棒性。
表3是其他三种音频信号类型的鲁棒性能测试结果,可以看出,其NC值都在0.9964以上,BER值都在3%以下。尽管音频文件的感知特征不同,但EMD可以自适应地抵消这个差别。
表4将几种音频水印方案和本文的方案在嵌入容量和MP3压缩攻击下的鲁棒性进行了比较。可以看出,本文方法的嵌入容量最大。同时,当MP3压缩比特率为32kb/s时,本方法提取的水印信息BER只有1%。
3.3 影响提取正确率的因素
图9是存伪率PFPE与同步码长度p的关系图,可以看出,随着p的增加,PFPE趋向于0,当p大于16时,PFPE完全接近于零,这证实了本文同步码长度选择恰当。图10是弃真率PFNE与嵌入水印比特长度的关系图,可以看出,随着嵌入比特长度的增加,PFNE趋向于0。由于本文嵌入的水印比特是1600位,因此其PFNE很低。
4 结语
本文提出了一种基于EMD的鲁棒盲音频水印方案。在EMD的最后一个IMF的极值上嵌入水印,确保了方案对常规信号处理攻击的鲁棒性。同步码的嵌入,提高了方案抵抗抖动和剪切攻击的能力。基于QIM的嵌入方法,使得提取水印时不需要原始音频信号。不同的音频类型信号的实验结果表明,方案对常见的攻击鲁棒性高。横向对比表明该方案在提高了嵌入容量的同时可以抵抗较高压缩比(32kb/s)的MP3压缩攻击。水印的嵌入没有影响携水印音频的听觉质量,算法不可感知性高。在实验中,嵌入强度S设定为常量,为了进一步提高该方法的性能,参数S应根据原始音频信号的类型和幅度自适应调整。再者,如何更好地利用人类听觉系统的特性和心理声学模型的特点,在保证不可感知性和鲁棒性的前提下,提高算法的嵌入容量成为未来的研究方向。
参考文献:
[1] LIN X. Audio watermarking for copyright verification and content authentication[J]. Journal of Computer Applications, 2010, 30(8): 2269-2271.(林晓丹. 用于版权和内容认证的音频水印[J]. 计算机应用, 2010, 30(8): 2269-2271.)
[2] KIROVESKI D, MALVAR H. Robust spreadspectrum audio watermarking[C]// Proceedings of the 2001 International Conference on Acoustics, Speech and Signal Processing. Piscataway: IEEE, 2001: 1345-1348.
[3] WU S, HUANG J, HUANG D, et al. Efficiently selfsynchronized audio watermarking for assured audio data transmission[J]. IEEE Transactions on Broadcasting, 2005, 51(1): 69-76.
[4] BHAT K V, SENGUPTA I, DAS A. An adaptive audio watermarking based on the singular value decomposition in the wavelet domain[J]. Digital Signal Processing, 2010, 20(6): 1547-1558.
[5] HUANG N E, SHEN Z, LONG S R, et al. The empirical mode decomposition and Hilbert spectrum for nonlinear and nonstationary time series analysis[J]. Proceedings of the Royal Society of London: Series A, 1998, 454(1971): 903-995.
[6] KHALDI K, BOUDRAA A O, TURKI M, et al. Audio encoding based on the empirical mode decomposition[C/OL].[2014-06-20].http://www.eurasip.org/Proceedings/Eusipco/Eusipco2009/contents/papers/1569192283.pdf.
[7] KHALDI K, BOUDRAA A O. On signals compression by EMD[J]. Electronics Letters, 2012, 48(21): 1329-1331.
[8] WANG L, EMMANUEL S, KANKANHALLI M S. EMD and psychoacoustic model based watermarking for audio[C]// Proceedings of the 2010 International Conference on Multimedia and Expo. Piscataway: IEEE, 2010: 1427-1432.
[9] ZAMAN A N K, KHALILULLAH K M I, ISLAM MD W, et al. A robust digital audio watermarking algorithm using empirical mode decomposition[C]// Proceedings of the 2010 IEEE Canadian Conference on Electrical and Computer Engineering. Piscataway: IEEE, 2010: 1-4.
[10] CHEN B, WORNELL G W. Quantization index modulation methods for digital watermarking and information embedding of multimedia[J]. Journal of VLSI Signal Processing Systems, 2001, 27(1/2): 7-33.
[11] LIE W, CHANG L. Robust and high quality timedomain audio watermarking based on lowfrequency amplitude modification[J]. IEEE Transactions on Multimedia, 2006, 8(1): 46-59.
[12] HUANG X, JIANG W, WANG H, et al. Ratiobased digital audio blind watermarking algorithm in wavelet domain[J]. Journal of the China Railway Society, 2011, 33(5): 66-71.(黄雄华, 蒋伟贞, 王宏霞, 等. 基于比值的小波域数字音频盲水印算法[J].铁道学报, 2011, 33(5): 66-71.)
[13] MANSOUR M F, TEWFIK A H. Data embedding in audio using timescale modification[J]. IEEE Transactions on Speech Audio Processing, 2005, 13(3): 432-440.
[14] LI W, XUE X, LU P. Localized audio watermarking technique robust against timescale modification[J]. IEEE Transactions on Multimedia, 2006, 8(1): 60-69.
(责任编辑:单位文秘网) )地址:https://www.kgf8887.com/show-213-100244-1.html
上一篇:浅谈企业信息门户建设流程
版权声明:
本站由单位文秘网原创策划制作,欢迎订阅或转载,但请注明出处。违者必究。单位文秘网独家运营 版权所有 未经许可不得转载使用