简介:;自动语音识别(AutomaticSpeechRecognition)简称ASR是目前属于AI领域的一项十分重要的技术,伴随着人工智能的高速发展,智能化生活走向主流,ASR技术已经走进了人们的生活中的方方面面。先简要介绍了语音识别的发展、语音信号的接收,再重点阐述了ASR运行过程中相关的原理及方法和与ASR技术的基本算法使用语音信号的处理涉及的三大算法即朴素模式算法,KMP算法,及HMM算法。
简介:目的通过对计算机导航-聋儿听觉评估学习系统-儿童汉语语音词表进行识别测试,证实儿童汉语语音词表在“计算机导航-听觉言语评估学习系统”中运用的可行性,通过对不同年龄段儿童言语最大识别得分的标准化研究。使测试结果能够真实表达不同年龄段儿童的听觉言语识别能力。方法在正常幼儿园随机选取90名儿童,其中大班儿童(平均年龄5岁9个月)、中班儿童(平均年龄4岁9个月)、小班儿童(平均年龄3岁10个月)各30名。应用计算机导航-听觉评估学习系统,分别对不同年龄组的儿童进行声母识别、韵母识别测试。结果韵母测试词表在大班、中班、小班正确通过率分别为:99.8%,99.2%,99.3%;声母测试词表在大班、中班、小班正确通过率分别为:99.9%.99.2%、99.3%。声母及韵母单一测试词在不同年龄组的测试通过率均在93%以上。结论所有声母、韵母词表通过标准化测试结果分析,不同年龄组儿童对声母及韵母的总体通过率都在99%以上,均达到标准化测试目标。说明“计算机导航-聋儿听觉评估学习系统”中的语音识别词表图片具有可行性、准确性,能够真实地表达儿童听觉言语识别水平。
简介:摘要目的探讨提取腭裂语音中过高鼻音特征性共振峰参数建立的级联声道模型和小波包变换结合线性预测系数(LPC)2种算法模型,在识别腭裂患者高鼻音中的应用效果。方法选取2015年10月至2018年12月,在四川大学华西口腔医院语音矫治专科就诊的859例腭裂患者,其中男421例,女438例,平均年龄12.1岁。正常语音216例,轻度高鼻音220例,中度高鼻音213例,重度高鼻音210例。按照汉语普通话测试工具收集包括词组、短句的语音样本共62 707份。运用级联声道模型、小波包变换结合LPC的语音信号识别方法提取共振峰参数,采用K近邻分类器,对数据进行分类,判别有无过高鼻音及具体等级。将2种算法模型的分类结果与人工语音评估金标准结果进行对比,运用卡方检验分析其准确性。结果级联声道模型和小波包变换结合LPC提取共振峰参数这2种方法判断高鼻音有无的正确率分别为80.56%(692/859)和89.99%(773/859),对高鼻音等级判断的总正确率为72.29%(621/859)和88.13%(757/859),差异均具有统计学意义(P<0.05)。2种算法对每个高鼻音等级自动判别的正确率均为小波包变换结合LPC优于级联声道模型,且差异具有统计学意义(P<0.05)。2种方法对高鼻音等级类别的识别错误类型中,最严重的错误均为将正常语音判断为轻度高鼻音,小波包变换结合LPC法与级联声道模型分别达到了18.98%(41/216)与14.81%(32/216),但前者的其余错误率均在5%以下,优于后者。结论小波包变换结合LPC的算法与级联声道模型相比,在判断腭裂患者高鼻音有无及等级方面正确率更高,可辅助人工语音师对腭裂患者的语音评估。
简介:目的验证新编中文普通话版嘈杂语噪声下语句识别表在视、听、视+听三种模式下的等价性。方法招募27名听力正常人,采用二因素(视听模式、测试表号)重复测量实验设计,分别在单视觉.单听觉(65dBSPL言语强度、-6dB信噪比)及视听结合三种模式下,在声场中完成对27张嘈杂语噪声下语句识别表的言语识别率测试。三种视听模式及测试表号在所有受试者中均衡排布。结果综合三种视听模式的识别率,27张表的识别率无显著性差异(F=0.929,P=0.568)。视.听、视+听三种模式下的语句识别率分别为33.4±14.1%、40.9±14.4%、91.4±7.3%,两两之间均表现出显著性差异。结论视觉信息的补充,可有效提高噪声下的语句感知能力。新编中文普通话版嘈杂语噪声下语句识别表在视。听、视+听三种模式下均等价,可用于人工耳蜗植入疗效的评估。
简介:摘要目的了解语音障碍患儿辅音的特点,为临床评估及合理干预提供依据。方法回顾性研究。选取2007年1月至2018年12月于首都儿科研究所附属儿童医院保健科语言-言语门诊诊断的语音障碍患儿1 395例为研究对象,以图片命名法在单词水平进行语音测查。采用χ2趋势检验分析不同年龄患儿不同发音部位辅音错误人数比例的差异及变化趋势,χ²检验比较不同性别患儿在不同发音部位辅音中错误人数比例的差异,并分析不同发音部位辅音的错误类型及不同年龄患儿的错误类型特点。结果1 395例语音障碍患儿中男1 044例、女351例,年龄(5.1±0.8)岁。语音障碍患儿舌尖中音l的错误人数比例最高,为71.8%(1 002/1 395);唇音b最低,为9.3%(130/1 395)。不同年龄组间比较,年龄越大唇音p和f、舌尖前音z和c及s、舌尖中音t和l、舌尖后音ch和r、舌根音k和h、舌面音q的错误人数比例越低(均P<0.05);不同性别间比较,男童唇音b和m、舌尖前音z和c、舌尖中音n和l、舌尖后音sh、舌根音h、舌面音x的错误人数比例均高于女童[(10.3%(108/1 044)比6.3%(22/351)、11.4%(119/1 044)比6.0%(21/351)、64.8%(676/1 044)比51.9%(182/351)、67.8%(708/1 044)比59.8%(210/351)、16.7%(174/1 044)比8.8%(31/351)、73.7%(769/1 044)比66.1%(232/351)、58.0%(606/1 044)比47.6%(167/351)、24.0%(251/1 044)比14.2%(50/351)、39.9%(417/1 044)比27.6%(97/351),χ²=5.167、8.533、16.889、7.447、12.863、7.412、11.650、14.900、17.099,均P<0.05];辅音的错误类型有替代、省略、歪曲,其中,舌尖中音l以省略为主[53.3%(743/1 395)],舌根音h以歪曲为主[11.8%(165/1 395)],其他辅音均以替代为主。在替代类型中舌尖后音ch的错误人数比例最高,为60.2%(840/1 395)。结论语音障碍患儿辅音中舌尖中音l错误人数比例最高,男童的语音问题更为严重,替代是辅音的主要错误类型,在替代类型中舌尖后音ch的错误人数比例最高。应关注学龄前期儿童的语音发展,同时尽早开展舌尖中音l、舌尖后音ch的语音训练。