简介:大概是在十岁的时候,我读到了索尼研发随身听的故事。在上世纪70年代中期,索尼希望创造出—种小巧玲珑的卡带播放器,以便让人能够随时随地听音乐。这在当时是一个绝妙的想法,为此索尼专门成立了一个研发组。但经过几年努力,结果却令人沮丧,研发组贡献的是一个比板砖还要大的”随身听”,这显然不适合随身携带。索尼的决策层撤销了这似页目,让研发组转向其它电子产品的开发。但这个研发组却集体做出了一个惊人的决定,他们擅自挪用了其它产品的研发经费,继续秘密研发随身听。这种壮士断臂的做法,最终让他们赢得了成功。1979年第一个随身听问世,它给音乐播放方式带来了革命性的变化,所创造出的”耳机文化”—直延续到三十多年后的今天。
简介:摘要:近几十年来,在业内专家学者的努力下语音识别技术取得显著进步,已经从实验室走向市场。在这个过程中,深度学习和神经网络的发展做出不少贡献,但神经网络依赖大量数据而且神经网络模型具有不确定性,当训练数据与目标数据分布存在差异时识别效果可能非常差。在一些领域我们对识别系统的精度要求非常高。我们已经明显感觉到,语音识别技术在工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域都可以发挥重要作用。探索使用HMM模型来识别孤立词在我们的生活中具有重大意义。隐马尔可夫模型是成熟的模型,在语音识别,机器视觉等多个领域有着广泛的应用。隐马尔可夫模型能够很好地为语音等序列数据建模,可以很好地描述序列数据之间的关系。隐马尔可夫模型与GMM模型的完美融合可以使HMM模型在语音识别中更好地对状态进行建模从而提高识别率。因为GMM模型的加入使得HMM的观测矩阵更真实地贴近观测概率。加入GMM的HMM模型经过5个人的数据的训练其识别精确度可以达到87%。在数据量得到扩充的前提下效果有望达到100%。