声纹识别声纹司法鉴定必看

声纹,也称“语图”,是由专用的电声转换仪器(语图仪)将声波特征绘制成的波谱图形。声纹鉴定就是把未知人的语声和已知人的语声,通过语图仪分别制成声纹图谱,再依据声纹图上的特征进行分析、比较和判断,确定二者是否为同一人的语声。它是文检技术中近些年发展起来的语音识别的先进科学手段。

一、声纹的意义

在实际生活中,我们都有切身体会:每个人说话时的语声,都有自己的特点。很熟悉的人之间,可以只听声音而相互辨别出来,这就是语声人各不同的特性。

  为什么人的语声会人各不同呢?因为人的发声器官实际上存在着大小、形态及功能上的差异。发生控制器官包括声带、软颚、舌头、牙齿、唇等;发声共鸣器包括咽腔、口腔、鼻腔。这些器官的微小差异都会导致发声气流的改变,造成音质、音色的差别。此外,人发声的习惯亦有快有慢,用力有大有小,也造成音强、音长的差别。音高、音强、音长、音色在语言学中被称为语音“四要素”,这些音素又可分解成九十余种特征。这些特征表现了不同声音的不同波长、频率、强度、节奏。语图仪可以把声波的变化转换成电讯号的强度、波长、频率、节奏变化,仪器又把这些电讯号的变化绘制成波谱图形,就成了声纹图。

  人的发声具有特定性和稳定性。从理论上讲,它同指纹一样具有人身识别(认定个人)的作用。虽然由于技术和经验的问题,暂时不能说完全达到了指纹那样的精确程度,但它已经被越来越多的国家认可为法庭科学的一项新技术。一九八一年在美国密执安州成立了“国际声纹鉴定学会”,旨在进一步完善声纹鉴定技术,加强推动、培训和宣传,促使声纹鉴定成为世界公认的一种人身识别的科学方法。

  目前,许多国家都己把声纹鉴定作为辨认犯罪嫌疑人的重要手段,为侦查工作提供新的线索和证据。

  (1)在获得了犯罪人的语声录音资料时,如在电话中进行的恐吓、勒索,或在其他性质的犯罪中录到了罪犯说话的声音,那么可以通过收集嫌疑人语音样本进行声纹鉴定,为认定或否定犯罪人提供鉴定结论。

  (2)在案件的侦讯或审理中(包括民事案件),通过声纹鉴定可以审查录音证据材料的其伪。

  (3)通过声纹分析,判断说话人的性别、年龄、方言(生活地区)特征,为侦查工作提供方向和范围。

二、声纹鉴定的步骤和注意事项

目前应用的语图仪可以制作七种声纹图:宽带声纹、窄带声纹、振幅声纹、等高线声纹、时间波谱声纹、断面声纹(又分宽带、窄带二种)。其中,前二种显示语声的频率与强度随时间推移的变化特征;中间三种显示语音强度或声压随时间变化的特征;断面声纹只是显示某一时间点上声波强度和频率特征的声纹图。

  在声纹鉴定中最常用的是宽带声纹图。它是用带宽为300HZ的带通滤波器分析出来的声纹。声纹图的横坐标为时间,纵坐标为频率,浓淡表示音强(见附图)。每一字的声纹前部(乱纹)是清辅音的频谱,后部是元音频谱;元音频谱中由加强的纵线条构成的水平方向的黑带为共振峰。共振峰的数量、走向及其频率是声纹分析的重要特征。

转声纹鉴定依如下程序和要求进行:

1、 采集检材语声(录音)

在采集犯罪人或证人的语声作检材时,录音宜采用高保真录音机。采集语声的要求是:

①录音应当尽量在不被对方发觉的情况下进行,以减少假象的干扰,保证语声的真实。

②应尽量防止环境噪声和录音设备的干扰。麦克风与被录对象保持适当距离。尽量不用失真大的袖珍盒式录音机,电源最好用市电,保持电流稳定。电话录音时应使用传感器,不要将听筒直接对着“麦克”录音。磁带应选用优质新带。

2、采集样本语声(录音)

除了遵照采取检材时要求的器材和注意事项外,应尽量保持同采集检材时相同、相近的语声环境、距离、设备及速度;并建议在样本中有与检材相同的词句,以供特征比对。

3、审听和选择

鉴定人员要先对捡材和样本分别反复审听和记录,从中选择正常而清晰的语声段落,再进一步选取相同的字、词、句,作为供比较的部分。然后使用语图仪分别将选好的检材与样本中的字、词、句做出声纹图。

4、声纹特征的选择

在被比较的两种声纹图谱中,分别选取明显、稳定的特征作为比较特征。一般说,共振峰的频率值及其走向是最稳定的特征,而且具有很强的特定性,利用价值最高;而时长、音强、波形等特征稳定性较差,可做参考。在鉴定过程中,还可以从同一个人的语声中选择多个相同字、词或句的语图,在分析比较中抓住其稳定而特殊的特征作为依据。

5、比较

比对检材与样本中相同字、词的声纹中的同类特征(如共振峰频率、走向及波形),进行比较分析,找出相同点和差异点。

6、综合评断

①如果被比较的全部特征完全吻合;或者稳定性强的特征完全吻合,而只是稳定性差的特征有些差异,均可做同一认定结论。

②如果被比较的稳定性强的特征差异较大,还可以补充样本再做语图比较,倘仍有差异,又无法解释,则可做否定结论。

7、声纹送检时的注意事项

  说话人在不同的环境和不同的心态下,以及不同的语气、不同的健康状况都会引起语音的某些变异。录音环境(噪音、回声、距离)的干扰以及录音设备不良,也会使录制的语音产生假性变异。因此,送检时,要把录制检材和样本时的环境状况、录制距离、录制方式、使用机器、以及在什么情况下录制等情况加以详细记载,一并提交鉴定人,以便对差异点进行客观的分析评断。

三、声纹鉴定的发展状况

  辨声之举,自古有之,说明人早知道声音人各不同。但那仅仅是凭听觉器官的分辨能力。科学的声纹研究是以完善的录音设备为基础的,而且最先是为战争服务的。第二次世界大战后期,为了提高军事通讯效率的需要,美国电话电报公司的贝尔实验室研究和发明了“音响光谱图象显示器”,把声波用光谱图象加以显示。战争结束,这项研究亦中止。

  到了五、六十年代,美国纽约市的绑票、电话恐吓案件骤增,为了侦讯工作的需要,贝尔实验室受执法部门委托,恢复对声纹的研究。他们对一百二十三名健康美国人的“I、you、it(我、你、是)等词语的二万五千个声纹图进行了五万多项鉴定分析,个人识别的准确率达到97- 99·65%。从一九六六年开始,贝尔实验室开始培训警官,推广应用这项技术。至七十年代,日本、罗马尼亚、西德等都相继开展了声纹鉴定技术,以对付恐怖犯罪活动。随着科学技术的进步,声纹鉴定手段也日益先进。目前,国际声纹鉴定并行两套系统:一是声纹的自动识别系统,它以电子计算机为主体,具备分析、储存、检索、鉴定多项功能,可以根据语声进行全自动分析,最后给出结论。但这种结论的准确性同专家设定的特征吻合量(阈值)有关。二是声纹的人工识别系统,它以语图仪为支持,鉴定人直接观察和分析声纹,寻找特征,测量数据并进行比较与评断,最后得出结论。

国内较为先进的司法声纹鉴定系统可以参考 https://www.7681198.com/a/case/design/35.html

原文地址:https://www.cnblogs.com/yt16518/p/9276980.html

时间: 2024-10-04 08:55:03

声纹识别声纹司法鉴定必看的相关文章

声纹识别PLDA模型的理解

PLDA算法解释 概念理解 在声纹识别领域中,我们假设训练数据语音由I个说话人的语音组成,其中每个说话人有J段自己不同的语音.那么,我们定义第i个说话人的第j条语音为Xij.然后,根据因子分析,我们定义Xij的生成模型为:  这个模型可以看成两个部分:等号右边前两项只跟说话人有关而跟说话人的具体某一条语音无关,称为信号部分,这描述了说话人类间的差异:等号右边后两项描述了同一说话人的不同语音之间的差异,称为噪音部分.这样,我们用了这样两个假想变量来描述一条语音的数据结构. 我们注意到等号右边的中间

声纹识别技术助力远重庆时时彩技巧程身份认证无线互联网以及智能手机的迅速发展

声纹"作为一种典型的行为特征,相比其他生理特征在远程身份认证中具有先天的优势,文章介绍了声密保在远程身份认证中的应用,解析了一些在声纹识别准确率.时变问题和噪音问题等方面的技术难点和工程解决经验,最后针对远程身份认证的安全性问题,分享了得意音通在防录音闯入上的最新研究成果.希望对广大读者有所帮助. 声纹在远程身份认证中的应用 网络安全面临重大挑战 无线互联网以及智能手机的迅速发展,给人们日常生活带来极大便利的同时也带来了不容忽视的安全隐患,如何准确.迅速.安全地实现远程身份认证成为摆在人们面前急

扒一扒:《大话西游》中的声纹识别!

近期,星爷经典作品大话西游重新上映,引发怀旧热潮.小编也买了票,想重温一下传说中那份感动. 万万没想到,看了一会,小编就没控制住大开的脑洞,陷入了离题万里的思考中:电影中,紫霞说一声"芝麻开门",盘丝洞的门就自动打开了,而至尊宝说"芝麻开门"时,门不仅没开,而且还把他砸了个半死. 十年前看的时候不明白为什么,现在再看时忽然领悟了: 盘丝洞的门肯定使用了声纹识别技术! 那么现在问题来了:何为声纹识别技术?现实世界里面有应用吗? 下面就一一为大家道来. 声纹识别技术,又

声纹识别之PLDA算法描述

之前我写过<我对说话人识别/声纹识别的研究综述>,本篇基本上可以是这个综述的续写.其实,写的也没有什么深度,想获得深度信息的朋友们可以不用往下看了,还不如下载几篇领域内的国内博士论文看看.为什么是国内呢?因为国内博士论文前面的综述写的还不错,嘿嘿~我写这个主要是给不熟悉这个领域内的朋友看的,用通熟的话描述这个领域内重要的一些算法,等于是入个门吧. PLDA算法 前面博客已经提到过声纹识别的信道补偿算法,而且重点说了LDA算法.PLDA(Probabilistic Linear Discrimi

声纹识别 ====飞讯

http://osp.voicecloud.cn/ // //  ViewController.m //  Custom声纹识别 // //  Created by 谢泽锋 on 15/4/30. //  Copyright (c) 2015年 谢泽锋. All rights reserved. // #import "ViewController.h" #import "TrainViewController.h" #import <iflyMSC/IFly

声纹识别鉴定助破案 逃亡五年“栽”在声音上

声音是什么?在专家的眼里,声音就是一张"人体身份证". 作为我国声纹鉴定技术创始人之一,广东省公安厅刑事技术中心高级工程师王英利近30年来一直致力于声纹研究.自1990年起,他办理的各类声纹鉴定案件达500余起,未出任何差错. 20世纪80年代后期,通讯技术日益现代化,私人电话和公用电话大量增加,移动通讯异军突起,这虽然方便了正常的社会交际,也使犯罪分子利用电话作案有了可乘之机.电话成为犯罪分子作案中必不可少的通讯渠道. 犯罪学中,证据的应用非常关键.在省公安厅刑事技术中心声纹实验室,

[深度学习概念]&#183;声纹识别技术简介

声纹识别技术简介 声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术.从直觉上来说,声纹虽然不像人脸.指纹的个体差异那样直观可见,但由于每个人的声道.口腔和鼻腔也具有个体的差异性,因此反映到声音上也具有差异性.如果说将口腔看作声音的发射器,那作为接收器的人耳生来也具备辨别声音的能力. 最直观的是当我们打电话给家里的时候,通过一声“喂?”就能准确地分辨出接电话的是爸妈或是兄弟姐妹,这种语音中承载的说话人身份信息的唯一性使得声纹也可以像人脸.指纹那样作为生物信息识别技术的生力军,辅助甚至

我对说话人识别/声纹识别的研究综述

GMM-UBM系统框架 最初用的特征是声学特征MFCC,这个东西我不太熟,只知道它是从wav或者其它格式语音文件直接提出. 有了特征就可以建立模型了,这里我们的模型叫做"高斯混合模型".不同说话人的差异主要表现在其短时语音谱的差异,而这又可以用每个说话人的短时谱特征所具有的概率密度函数来衡量.高斯混合模型GMM将空间分布的概率密度用多个高斯概率密度函数的加权和来拟合,可以平滑地逼近任意形状的概率密度函数,并且是一个易于处理的参数模型.在具体表示上,这个模型实际上就是把高斯混合模型的每个

关闭linux退格键和vi发出的嘟嘟声(报警声)

网上有介绍:vi /etc/inputrc,然后去掉set bell-style none 前的注释,修改完,你需要退出当前的shell,再次登录才能生效.这个时候,你可以用按下 crtl-g来测试一下.但这样的 做法只能只能命令行下的错误报警声,而用vi.less和man编辑的时候还是会发出嘟嘟的报警声. 其实这个问题根源并不是声卡发出的,而是主板的蜂鸣器,所以不能通过关闭音箱来解决.该统响铃是因为红帽企业LINUX默认安装并加载了pcspkr内核模块,要关闭系统响铃可以使用root命令执行下