简介:语音识别技术近年来得到了飞速的发展并且在越来越多的领域得到了广泛的应用。隐马尔可夫模型(HMM)语音识别技术是一种基于训练数据提供的概率自动构造识别系统的技术,主要用于大量词汇的语音识别,而且具有良好的识别性能和抗噪性能。因此,一般的语音识别系统都采用基于HMM的识别方法作为其基本算法。本文列举了语音识别在教学中的应用示例来分析其基本算法。
简介:研究了基于认知评估原理的多维耳语音情感识别.首先,比较了耳语音情感数据库和数据采集方法,研究了耳语音情感表达的特点,特别是基本情感的表达特点.其次,分析了耳语音的情感特征,并通过近年来的文献总结相关阶特征在效价维和唤醒维上的特征.研究了效价维和唤醒维在区分耳语音情感中的作用.最后,研究情感识别算法和应用耳语音情感识别的高斯混合模型.认知能力的评估也融入到情感识别过程中,从而对耳语音情感识别的结果进行纠错.基于认知分数,可以提高情感识别的结果.实验结果表明,耳语音信号中共振峰特征与唤醒维度不显著相关,而短期能量特征与情感变化在唤醒维度相关.结合认知分数可以提高语音情感识别的结果。
简介:为了解决目前e-Learning教学系统中的情感交流匮乏问题,提出一种新的基于语音情感识别技术的e-Learning系统模型。语音作为人类最重要的交流媒介之一,不仅携带着大量的文字符号信息,还包含了人类丰富的情感信息。利用语音情感识别技术获取和识别学习者的学习情感状态,从而实现e-Learning教学系统的智能化和人性化。本文对该系统的关键技术作了详细阐述。
简介:针对各种连续数字语音信号,实现了一种基于TMS320C5x评价模块(EVM)和定点数字信号处理器ADSP2181的与特定人无关的连续数字语音识别系统。在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum-Welch重估算法,并利用ADSP2181实现语音识别的算法。有效地提高了系统的识别率。给出了实现各个阶段所需的时间,比较了不同语音特征参数对识别率的影响。在具体实现中,着重处理了抗噪、定点实时实现及连续数字串识别人的身份等问题。实验结果表明,本系统在普通环境下取得较满意的效果,正确识别率达到93.2%,为其实用化提供了较为重要的技术途径。
简介:摘 要 本文以教思考、教体验、教表达的“三教”理念,引领《3D One AI语音识别编程探究》教学课例,简述高中课堂信息技术教学培育学生核心素养的体会:激发学生兴趣,体验知识内涵;核心问题引领,促进学生编程中的计算思维;引导表达交流,提升社会信息责任,促进学生核心素养的培育。
简介:摘要:设计一款基于WeMos D1物联网开发板的智能垃圾桶,以实现对垃圾桶的远程及现场的控制,满足对垃圾分类的语音识别,并通过阿里云物联网平台实现对桶内垃圾容量的准确监控。硬件部分包括WeMosD1物联网开发板、HC-SR04超声波传感器、LDV7语音识别模块以及称重传感器;软件部分包括开发板的Arduino程序及语音识别模块的单片机程序,并通过阿里云的IOT Studio实现自建手机App。本系统的开发实现了硬件设计和软件编程,该系统能够对桶内垃圾容量进行实时监控,在容量超过上限时可通过云平台或手机APP发出报警信息提示环卫人员。智能垃圾桶的监控系统能够及时地提醒环卫人员,使垃圾桶的清理更加便捷,节省了人力物力。
简介:提出了一种基于级联投影的高斯混合模型算法。首先,针对不同的特征维度计算高斯混合模型的边缘概率,依据边缘概率模型构造出多个子分类器,每个子分类器包含不同的特征组合。采用级联结构的框架对子分类器进行动态融合,从而获得对样本的自适应能力。其次,在心电情感信号和语音情感信号上验证了算法的有效性,通过实验诱发手段,采集了烦躁、喜悦、悲伤等情感数据。最后,探讨了情感特征参数(心率变异性、心电混沌特征,语句级静态特征等)的提取方法。研究了情感特征的降维方法,包括主分量分析、顺序特征选择、Fisher区分度和最大信息系数等方法。实验结果显示,所提算法能够在2种不同的场景中有效地提高情感识别的准确率。
简介:摘要:随着人工智能技术的飞速发展,卷积神经网络有了广阔的发展空间。在各种图像识别模型中,文字识别和三维手势识别尤为突出,将文字识别和三维手势识别技术运用于局部文件录入、书本扫描和盲人辅助识读等场合,能够做到自动识别,从而节省时间,使操作更简单。为解决我国盲人群体无法阅读这一问题,并改善现有产品技术存在的携带不便、价格昂贵、输入复杂、受众单一和信息读取不全等缺陷,提出了基于卷积神经网络的盲人无障碍阅读系统,该系统作为用户功能型产品,采用三维手势识别和深度可分离卷积的文字识别双技术融合,并通过语音合成技术对识别内容进行输出,解决了目前国内市场盲人阅读器的难点,帮助盲人实现无障碍阅读。
简介:摘要:本文面向大学生心理状态评估的需求,提出了一种基于多特征融合的语音情感识别方法。该方法通过主成分分析方法充分融合语句级的全局特征以及语段级的局部特征,获取对语音信号中情感信息更具判别性的表征。本文方法在柏林语音情感数据库上进行的十折交叉验证实验取得了88.61%的识别率,验证了本文方法的有效性。