更好的语音识别 [IBM ViaVoice Release 10 Pro USB 版]

更好的语音识别 [IBM ViaVoice Release 10 Pro USB 版]

一、更好地识别语音[IBM ViaVoice Release 10 Pro USB Edition](论文文献综述)

牛可[1](2019)在《智能家居语音识别通用语音AI云平台的设计与实现》文中进行了进一步梳理提到智能家居的语音技术,更应该强调的是语义识别技术。近几年,随着人工智能尤其是深度神经网络的发展,突破了语音识别在智能家居中的发展瓶颈。为解决现有家居控制系统在语音识别平台选择上相对被动和缺少语义分析的研究,本文结合人工智能、深度学习、Deeplearning4j框架、百度语音识别API、结巴分词等技术,设计了智能家居语音识别通用语音AI云平台,该平台不仅可以让用户自主选择合适的语音识别引擎,还可以运用神经网络模型对识别后文本进行语义分析,根据智能家居设备控制指令集,提取有效用户数据,对智能家居控制进行优化,从而达到改善智能家居控制和提升用户体验的目的。智能家居设备控制指令集的建立是实现语音控制的关键。根据对智能家居不同人群常用语音控制指令的研究,本文设计了满足智能家居控制需求的指令集。在指令集建立完成的基础上,结合云平台的需求,对云平台进行功能设计,主要包括智能云中间件、语义分析、语音接收和指令发送四大功能。中间件通过调用百度语音识别API实现语音识别功能;由于语义分析在很大程度上影响语音识别的结果,因此本文选用结巴分词工具对文本进行分词处理,选用LSTM神经网络算法搭建语义分析模型,得到了 79.03%的召回率;语音接收模块将平台与网关建立socket连接,实现语音数据从JSON字符串到语音对象的转换;指令发送模块对指令信息进行封装,通过建立socket连接,按照TCP/IP协议完成指令发送。本文采用云计算中平台即服务的软件架构,结合云平台总体框架图,使用“Spring+Spring MVC+MyBatis”技术框架对云平台进行开发,包括用户管理、设备管理、语音接收、中间件、语义识别和指令发送模块,并实现各模块功能。本文最后对平台中的语义分析模块进行了功能测试,测试结果表明,本文搭建的语义分析模型可以提高语音识别准确率,达到了改善智能家居语音控制的目的。

段云[2](2008)在《基于神经网络的语音识别在WinCE上的实现和优化》文中认为语音识别技术具有重要的理论价值和广阔的应用前景,近年来受到了人们的广泛重视。随着电子计算机和人工智能的不断进步与发展,人们越来越希望让机器能够理解人类的自然语言,这种需求使得语音识别技术有着十分广阔的发展前景。一直以来,语音识别研究大部分以线性系统理论为基础,主要包括应矢量量化(VQ)、动态时间规整(DTW)与隐马尔可夫模型(HMM)等技术。然而,人的发音实际上是一个复杂的非线性过程,基于线性系统理论的语音识别方法的局限性渐渐显示了出来。语音识别技术若要取得突破,就必须引入非线性理论的方法。近年来,人工神经网络(ANN)等非线性理论研究和应用的逐渐深入,将这些理论应用于语音识别成为可能。本文研究了基于神经网络的语音识别,对语音识别的预处理、特征提取与识别算法等技术进行了计算验证、性能分析和比较,设计并开发了基于BP神经网络的软件实验平台,提出了以不同比例对MFCC与LPCC参数进行混合的方法来训练模型,实验表明该方法具有更好的识别率。本文在WinCE嵌入式平台上对该识别模型进行了实现,并做了性能改进,测试结果表明,该嵌入式应用可以对数字0至9的特定人发音达到88.4%的正确识别率。

赵威威[3](2007)在《嵌入式语音识别及控制技术在智能家居系统中的应用》文中指出随着技术发展和生活水平的提高,人们对家居环境提出了更高要求,智能家居系统已成为目前的该领域的一个重要研究课题。语音是人类最自然的交互方式,利用语音识别与控制技术实现对家用电器的控制是智能家居的重要内容。论文基于微软公司的Microsoft Speech SDK语音开发平台,将语音识别技术集成于嵌入式操作系统Windows XP Embedded中,构建一个智能家居系统,实现对家用电器的语音控制。论文主要工作有:完成基于语音识别控制的智能家居系统方案设计。系统分软件和硬件两部分,上位机实现语音采集和识别、处理,发出相应的动作命令,通过串行通信,构成串行控制网络,控制具备符合接口规范的设备,通过语音实现对家用电器的遥控。对语音识别技术进行研究。经分析比较,采用基于HMM识别算法的Microsoft Speech SDK语音开发平台进行开发。该识别方法具有识别准确率高、便于和操作系统的无缝链接、调用简单方便等优点。研究嵌入式操作系统Windows XP Embedded在本系统中的应用,对系统配置、语音驱动等关键技术进行设计。定制的操作系统可很好的与语音识别软件包相匹配,对硬件配置要求低,有利于降低系统成本。利用单片机构建了执行机构,能和上位机进行可靠通信,并具有红外遥控等复杂控制功能,成本低廉。采用可视化编程完成应用程序设计,界面友好,具备扩展功能,功能增加便利,并便于新控制设备的加入。论文研究的智能家居控制系统能实现对家用电器的有效控制,装设便利、成本低廉、实用性强,并可方便地改造原有家居设备控制系统。论文研究的方法和技术可进一步在其它相关领域得到广泛应用。

胡纲[4](2003)在《更好地识别语音[IBM ViaVoice Release 10 Pro USB Edition]》文中研究说明

二、更好地识别语音[IBM ViaVoice Release 10 Pro USB Edition](论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、更好地识别语音[IBM ViaVoice Release 10 Pro USB Edition](论文提纲范文)

(1)智能家居语音识别通用语音AI云平台的设计与实现(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外智能家居研究现状及发展趋势
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 国内外语音识别技术研究现状及发展趋势
        1.3.1 国外研究现状
        1.3.2 国内研究现状
    1.4 论文研究内容及组织架构
第2章 云平台总体框架设计和技术分析
    2.1 云平台总体框架设计
        2.1.1 云平台需求分析
        2.1.2 云平台总体框架设计
    2.2 语音识别技术研究
        2.2.1 语音识别概述
        2.2.2 语音识别框架流程
        2.2.3 语音识别常用算法
        2.2.4 百度语音识别API分析
    2.3 语音文本处理技术分析
        2.3.1 AI技术分析
        2.3.2 分词技术分析
        2.3.3 词语特征向量化技术分析
    2.4 本章小结
第3章 智能家居设备控制指令集设计
    3.1 指令集需求分析
    3.2 指令描述语言
        3.2.1 JSON协议
        3.2.2 JSON语法
    3.3 指令描述
        3.3.1 通用格式
        3.3.2 语义对象
        3.3.3 动作执行结果提示
        3.3.4 设备对象
    3.4 指令集设计
    3.5 本章小结
第4章 基于LSTM-RNN的语义分析模型建立
    4.1 深度学习模型研究
        4.1.1 受限波尔兹曼机
        4.1.2 反向传播网络
        4.1.3 卷积神经网络
        4.1.4 循环神经网络
    4.2 LSTM网络算法原理研究
        4.2.1 LSTM模型结构分析
        4.2.2 LSTM前向传播算法分析
        4.2.3 LSTM反向传播算法分析
    4.3 LSTM-RNN算法语义分析模型实现
        4.3.1 建模语言选择
        4.3.2 Deeplearning4j深度学习框架
        4.3.3 LSTM-RNN网络模型搭建
        4.3.4 语音识别后文本预处理
        4.3.5 LSTM-RNN网络模型训练
        4.3.6 LSTM-RNN模型参数选择
    4.4 语义分析模型结果分析
    4.5 本章小结
第5章 语音识别AI云平台的设计与实现
    5.1 平台开发环境简介
    5.2 用户管理
        5.2.1 用户账号管理
        5.2.2 用户登陆
    5.3 设备管理
    5.4 语音识别
        5.4.1 语音接收模块设计
        5.4.2 指令发送模块设计
        5.4.3 智能云中间件设计
        5.4.4 语义分析模块设计
    5.5 数据库设计
        5.5.1 数据库结构设计
        5.5.2 数据库表的设计
    5.6 语义分析模块测试
    5.7 本章小结
第6章 总结与展望
    6.1 总结
    6.2 展望
致谢
参考文献
附录

(2)基于神经网络的语音识别在WinCE上的实现和优化(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 课题背景
        1.1.1 语音识别概述
        1.1.2 数字语音识别研究的意义
    1.2 语音识别的发展和现状
        1.2.1 语音识别的发展历史
        1.2.2 语音识别的应用现状
        1.2.3 语音识别的发展趋势
    1.3 语音识别的分类
        1.3.1 根据语音类型
        1.3.2 根据语音词汇量大小
        1.3.3 根据说话者的依赖程度
    1.4 语音识别的问题和困难
    1.5 本文的主要工作和创新点
    1.6 本文的研究内容安排
    1.7 本章小结
第二章 语音识别的基本原理
    2.1 语音信号的预处理
        2.1.1 语音信号预加重
        2.1.2 语音信号加窗分帧
        2.1.3 端点检测
    2.2 语音信号的特征提取
        2.2.1 线形预测系数(LPC)
        2.2.2 线形预测倒谱系数(LPCC)
        2.2.3 美尔频率倒谱系数(MFCC)
    2.3 语音信号识别的主要技术
        2.3.1 矢量量化(VQ)技术
        2.3.2 动态时间规整(DTW)
        2.3.3 隐马尔科夫模型(HMM)技术
        2.3.4 人工神经网络(ANN)技术
    2.4 本章小结
第三章 基于BP 神经网络的建模方法
    3.1 神经网络的基本概念
        3.1.1 神经元
        3.1.2 神经网络的连接方式
        3.1.3 神经网络的学习方式
        3.1.4 神经网络的学习算法
    3.2 BP 神经网络模型
        3.2.1 BP 网络的结构
        3.2.2 BP 网络的学习规则
        3.2.3 BP 网络的设计原则
        3.2.4 BP 网络的优点和不足
    3.3 BP 神经网络在语音识别中的应用
    3.4 本章小结
第四章 实验及结果分析
    4.1 语音样本库的建立
    4.2 语音信号预处理
        4.2.1 端点检测与特征提取
        4.2.2 特征参数的时间规整
    4.3 BP 神经网络的构建
        4.3.1 BP 神经网络的改进措施
        4.3.2 BP 神经网络的结构
    4.4 识别性能分析
        4.4.1 隐层神经元个数对识别性能的影响
        4.4.2 特征参数方案对识别性能的影响
        4.4.3 BP 神经网络结构的进一步精简
    4.5 本章小结
第五章 语音识别在嵌入式平台上的实现
    5.1 eBox 硬件特点
    5.2 eBox 软件平台
        5.2.1 WinCE 简介
        5.2.2 系统定制
        5.2.3 开发和调试
    5.3 语音识别的实现代码
        5.3.1 MFCC 特征提取代码
        5.3.2 LPCC 特征提取代码
        5.3.3 BP 模型代码
    5.4 代码定点化
        5.4.1 浮点数的定点化
        5.4.2 定标Q 值
        5.4.3 数据精度的处理
    5.5 结果分析
    5.6 本章小结
第六章 总结及展望
    6.1 全文总结
    6.2 工作展望
参考文献
致谢
攻读硕士期间主要研究成果

(3)嵌入式语音识别及控制技术在智能家居系统中的应用(论文提纲范文)

摘要
ABSTRACT
1 绪论
    1.1 课题背景及意义
        1.1.1 课题技术背景
        1.1.2 课题技术意义
    1.2 语音识别及控制的发展现状
        1.2.1 语音识别的概述
        1.2.2 语音识别及控制的发展过程
    1.3 课题研究目标
    1.4 本文的结构
2 语音识别及控制的关键技术
    2.1 智能家居系统的概述
    2.2 语音识别及控制系统的关键技术
        2.2.1 语音识别技术
        2.2.2 嵌入式操作系统
        2.2.3 家庭总线技术及协议
        2.2.4 Delphi 编程
    2.3 本章小结
3 嵌入式语音识别及控制技术在智能家居的应用
    3.1 系统设计要实现的功能
        3.1.1 语音开关控制
        3.1.2 语音红外控制
    3.2 系统需求规划
    3.3 总体方案设计
        3.3.1 总体方案设计框图及说明
        3.3.2 设计方案及特点
    3.4 智能家居系统的具体设计及实现
        3.4.1 嵌入式操作系统的构建
        3.4.2 Microsoft Speech 的调用
        3.4.3 系统界面的编程
        3.4.4 单片机开关控制的编程及硬件设计
        3.4.5 单片机红外控制的编程及硬件设计
        3.4.6 硬件系统的设计
    3.5 与无线网络相关的其他设计
    3.6 本章小结
4 结论与展望
致谢
参考文献
附录

四、更好地识别语音[IBM ViaVoice Release 10 Pro USB Edition](论文参考文献)

  • [1]智能家居语音识别通用语音AI云平台的设计与实现[D]. 牛可. 杭州电子科技大学, 2019(01)
  • [2]基于神经网络的语音识别在WinCE上的实现和优化[D]. 段云. 上海交通大学, 2008(12)
  • [3]嵌入式语音识别及控制技术在智能家居系统中的应用[D]. 赵威威. 重庆大学, 2007(05)
  • [4]更好地识别语音[IBM ViaVoice Release 10 Pro USB Edition][J]. 胡纲. 个人电脑, 2003(01)

标签:;  ;  ;  ;  ;  

更好的语音识别 [IBM ViaVoice Release 10 Pro USB 版]
下载Doc文档

猜你喜欢