乌兰察布市公安局物证鉴定所 内蒙古乌兰察布 012000
摘要:声纹是把人说话的声音转化成频谱图的一项技术。人的个体差异决定了不同人的声纹差异。声纹鉴定的应用价值非常广泛,在很多领域都是非常有潜力的。这里对声纹辨识的概念进行了深入浅出的介绍,对声纹辨识在刑事案件侦破、证词真伪辨识、声纹资料库建设、发展与展望等方面的应用进行了历史与现状的探讨。
关键词:声纹;声纹鉴定;技术;应用
随着社会和科技的发展,特别是通讯工具、网络和社交软件的普及,涉案声讯的获取越来越广泛和简单,司法鉴定声讯资料作为证据的需求呈爆炸性增长,相关声讯案件和涉及声纹鉴定的案件日益增多,涉案声讯资料作为证据的司法鉴定需求越来越大,声纹鉴定技术作为新兴前沿技术,能够为公安机关破案带来新的突破口,为案件侦破过程提供新的线索和证据。同时声纹鉴定作为前沿技术,在打击犯罪、保护人民群众生命财产安全、维护社会稳定、服务公安机关刑事和行政执法等各项工作中的作用越来越突出。尤其是在破获非接触性、隐蔽性和跨地域性案件方面更具优势,也将为公安机关提高办案效率,提升案件侦破能力起到积极的推动作用。
一、声纹及声纹鉴定概述
声纹(VoicePrint),指的是带有言语信息的声波频谱。现代科学研究表明,声纹既有个体差异性性,又有相对稳定的特点。人的声音在成年后能长期保持比较稳定的状态。实验证明,无论说话的人如何有意模仿他人的声音、语调、语速,即使模仿得惟妙惟肖,说话的人的声线却始终不变。侦查人员通过声纹鉴定技术,根据声纹的这两个特征,对犯罪分子进行入库筛查、比对,很快就能确定其身份,为侦查破案提供可靠证据,从而达到侦查破案、打击利用声纹犯罪嫌疑人的目的。
声纹鉴定是指运用现代科学技术结合专业经验知识,对音像资料中的声音进行相应的分析检验,确定或推断语音(或音源)是否同一、音像资是否真实(完整)、噪音的来源、语音的内容、说话人的属性以及音像资料的录制器材等,为审判活动提供证据、为侦查活动提供线索的一种专门技术手段[1]。即把作案人和嫌疑人的说话录音分别通过语图仪(声纹仪)转换成条带状或曲线形语图(即声纹),根据语图所反映的音频、音强与时间等语音特性进行比较,就嫌疑人是否为作案时的言语人做出鉴别与判断[2]。
二、声纹鉴定技术国内外发展
声纹鉴定的研究最早开始于20世纪30年代,最早应用于林德伯格(C.A.Lindbergh)先生的儿子被拐骗一案。通过观察人对声音的实际反应,研究人的听觉机制对说话人的辨识度。
第二次世界大战后期,电话电报的贝尔实验室研究发明了“声音频谱图像显示器”,用频谱图像显示声波,以提高军事通信的效率。
Kersta成功地实现了语谱图谱匹配,提出了“声纹”(soundline)的概念,首次引入了辨识声纹的可能性,但一直没有被开发出来。
1962年由于电子计算机技术的突飞猛进,声纹作为识别个人特征的问题被重新提起。美国司法部在反复鉴定检验后,正式宣布声纹可以作为证据在法庭上使用,随后,美国科学家在一所州立大学开展了关于声纹的课题研究。1966年,美国法院第一次采用此方法进行了取证。
声纹辨识的研究从1970年代后期开始,以提取和处理声纹特征的参数和探索新的模式匹配算法为研究重点。1975年日本法院首次把声纹作为认定犯罪证据使用。
进入20世纪90年代后,现代信号处理技术的应用,使声纹研究进入了一个新的阶段,并迅速成为了目前主流的声纹鉴定技术。
Reynolds在2000年左右提出了在统一背景模型下的最大后验概率结构,实现了只需较少的样本就能自动识别声纹,大大减弱了因录音条件失配带来的影响,使声纹识别开始走出实验室向实用性迈进。
我国声纹技术起步比较晚,1988年,中国刑警学院文检系组建了声纹实验室,这是在我国诞生的第一个声纹实验室,并引进了由美国KAY公司生产的7800型语谱仪,成立了专家小组,对声纹鉴定技术开展了研究、办案和教学工作。从此正式开启了我国声纹检验技术新学科。公安部二所也于1900年购买了美国KAY公司的5500型语谱仪。自此,我国在声纹技术方面的研究正式拉开了序幕。
经过二十多年的发展,我国的声纹鉴定技术有了很大的提高,培养出了许多优秀的人才,如原中国刑警学院教授岳俊发老师、广东省公安厅刑事科学技术中心高级工程师王英利老师等,同时也涌现出很多优秀的声纹鉴定软件公司,如科大讯飞股份有限公司、杭州灵伴科技有限公司、思必驰科技股份有限公司等。
三、声纹鉴定的基本方法
1.听觉分析检验
声纹听觉分析检查是指以检查人的听觉感知为依据,对案件检材声音、样本声音所作的声音的定性分析。重点关注言语基频(音高)、发音模式、韵律、声道强度、言语特征、综合语音品质。上面提到的6个被听觉感知的参数,每个人的参数都不一样,这6个参数都是和发音的人息息相关。
2.语音声学特征分析
常用的语音声学特征有基频、共振峰、频谱、音强等,此外还包括线性预测系数(56%LPC)、梅尔倒频谱系数(MFCC)等可以进行自动提取的数字特征。语音图谱是指记录和反映语音各种声学特征的图谱。可分为波形图、振幅曲线、基频(音高)曲线、宽带三维图、窄带三维图、二维频谱等。
3.语图声学特征量的数值量化比对
通过对语音检材和样本中相同或相近的音素、音节、词语、短语声学特征量的数值进行比较,对共振峰参数、音强曲线参数、基频曲线参数、音节时长、功率谱参数、长时平均基频参数,进行多参数的统计比对,得出是否同一的结论。
4.说话人鉴别的综合分析
要仔细了解检材和样品语音形成的主客观条件,包括录音的环境、设备、语速,说话人的生理、心理状态,是否存在伪装、变声、普通话和方言混杂,分析语音是否因主客观条件的变化而发生变化等。
四、声纹鉴定技术发展
声纹鉴定技术在司法领域中有着广泛的应用,特别是在刑事案件的侦破和判决过程中。
1.刑事案件的破案
通过声纹鉴定技术可以比对被害人或嫌疑人的声纹信息,辨别声音的来源,帮助警方锁定目标和确定嫌疑人身份。比如,在电话诈骗案件中,通过声纹鉴定技术可以确定嫌疑人的真实身份。
2.证词真实性鉴定
声纹鉴定技术通过对声音的特征和语调进行分析,可以对证人的证词进行鉴定,判断证词的真实性和可信度,判断证人是否在说谎,从而为警方提供有力证据。
3.声纹数据库建设
声纹鉴定技术可以帮助警方进行声音的取证工作,声纹鉴定技术还可以用于声纹数据库的建设,通过采集和分析有关人员的声音样本,建立起完善的声纹库,为犯罪防控提供重要的支持。
4.智能安防和智能家居
声纹技术作为身份验证手段,可以应用于智能识别系统,实现智能音箱、智能门锁等智能家居设备的身份识别和控制。
五、声纹鉴定技术的局限性和展望
声纹鉴定技术虽然在司法领域中有着较为广泛的应用,但也存在一定的局限性。首先,声音的鉴定受到环境因素和其他噪声的干扰,可能导致鉴定结果的不准确。其次,声音的特征受到个体差异和身体状况等因素的影响,可能导致鉴定的误差。
但随着技术的不断发展,声纹辨识技术的日趋完善,对声纹辨识的精确度也会有进一步的提升。今后,声纹识别技术或将与指纹识别、虹膜识别、面部识别等其他生物识别技术相结合,形成进一步增强个体身份识别可靠性和安全性的多重身份认证途径。
结束语:
综上所述,声纹鉴定技术在法医学领域中发挥着重要的作用,其尤其在犯罪案件的侦破和司法判决中具有重要的意义。尽管声纹鉴定技术存在一定的局限性,但随着科技的不断进步,其准确性和可靠性将不断提高,为司法实践提供更有力的支持。
参考文献:
[1]刘泰辰,王浩彤.关于声纹技术的研究分析[J].科技新时代,2024(02).
[2]汪露,陈美华.声纹技术的介绍、应用及个人隐私保护[J].科技创新与应用,2023(22).