说明:收录全文最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211266801.3 (22)申请日 2022.10.17 (71)申请人 上海城建职业学院 地址 200438 上海市杨 浦区军工路23 60号 (72)发明人 贾思远 孙文龙 (74)专利代理 机构 北京鑫知翼知识产权代理事 务所(普通 合伙) 11984 专利代理师 孙长江 (51)Int.Cl. G10L 15/26(2006.01) G10L 15/06(2013.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 小学作文语音识别文本纠错系统及方法 (57)摘要 本发明涉及一种小学作文语音识别文本纠 错系统及方法, 包括如下步骤: 选择目标小学作 文训练语料, 将选择的目标小学作文训练语料按 照句子分成长度小于512字的短句; 使用语音合 成服务, 分别按照男童音和女童音生成相应的语 音文件; 将语音作为模型输入、 文本作为模型输 出, 对语料进行自适应训练下的微调; 根据训练 后的深度模 型推断小学作文语音的文本。 本发明 主要解决小学生在写作文 过程中, 遇到不会书写 的汉字时, 通过说出想写的句子, 系统会自动快 速的提供正确的书写模式, 作为参考, 帮助学生 完成作文的写作。 权利要求书2页 说明书13页 附图3页 CN 115547334 A 2022.12.30 CN 115547334 A 1.小学作文语音识别文本纠错方法, 其特 征在于, 包括如下步骤: S1.选择目标小学作文训练语料, 将选择的目标小学作文训练语料按照句子分成长度 小于512字的短句; S2.使用语音合成服 务, 分别按照男童音和女童音生成相应的语音 文件; S3.将语音作为模型输入、 文本作为模型输出, 对语料进行自适应训练下的微调; S4.根据训练后的深度模型推断小学作文语音的文本 。 2.根据权利要求1所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S1中, 具 体包括步骤: 首先加载相关Python模型, 然后 分别加载每一篇小学作文文本, 加载完成后, 对所有文本按照句子进行分割, 获得每段文本的字数, 筛选出字数在1 ‑512之间的文本, 并 保存为文本 。 3.根据权利要求2所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S2中, 具 体包括步骤: 首先加载微软相关服务模块, 然后将文本转语音配置文件设置为中文童音, 读 取S1中筛选出的所有文本文件, 针对每一个文件使用微软的Asure服务转 成对应语音, 并按 照文本编号对语音 文件命名。 4.根据权利要求3所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S3中, 具 体包括步骤: S31.导入Transformers中语音相关的模型; S32.读取文本语料文件; S33.获取语音 文件名称; S34.将文本文件与语音 文件一一对应; S35.删除多余的字段; S36.增加全部语音的音频 数字表达; S37.获得 所有小学作文的字典表; S38.将所有样本分成训练集和验证集; S39.生成用于深度学习的DataSet; S310.加载Transformers的语音处 理程序; S311.生成适用于深度学习的训练集和验证集; S312.定义基于语音的损失函数; S313.构建基于Wav2 Vec2的Transformers模型; S314.利用Transformers的自训练模型对语音和文本进行训练。 5.根据权利要求4所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S4中, 具 体包括步骤: S41.加载Transformers的语音相关模型; S42.训练后的模型 结果; S43.加载训练后的模型 结果; S44.配置用于语音识别的模型; S45.设置分词器, 加载训练时的所有 小学作文的全部词汇; S46.设置语音处 理接口; S47.加载对应的语音 文件, 并获得 该语音文件的向量;权 利 要 求 书 1/2 页 2 CN 115547334 A 2S48.对上述语音 文件进行 预测; S49.输出对应的文本 。 6.利用权利要求5所述的小学作文语音识别文本纠错方法的纠错系统, 其特征在于, 包 括存储模块、 语音合 成模块、 语音识别模块、 训练模块、 文本输出模块, 所述存储模块用于存 储目标小 学作文训练语料文本、 短句文本、 词汇文本, 所述语音合成模块用于读取存储模块 中的文本文件, 并将其转成对应语音, 并存储, 所述语音识别模块用于接收语音输入信号, 所述训练模块用于将接收语音输入信号进 行处理和预测并对语音和文本进 行训练, 所述文 本输出模块用于根据训练模块的预测结果输出对应的文本信息 。权 利 要 求 书 2/2 页 3 CN 115547334 A 3
专利 小学作文语音识别文本纠错系统及方法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:24:33
上传分享
举报
下载
原文档
(660.9 KB)
分享
友情链接
人工智能语言对话大模型合集.pdf
DB13-T 5394-2021 冶金企业煤气管网安全管理规范 河北省.pdf
GB-T 34411-2017 基本医疗保险待遇稽核业务规范.pdf
GB-T 3389-2008 压电陶瓷材料性能测试方法 性能参数的测试.pdf
T-CPQS XF003—2023 灭火器产品维修、更换及售后服务.pdf
GB-T 33817-2017 铜及铜合金管材内表面碳含量的测定方法.pdf
GA-T 1718-2020 信息安全技术 大数据平台安全管理产品安全技术要求.pdf
GB-T 15843.2-2017 信息技术 安全技术 实体鉴别 第2部分:采用对称加密算法的机制.pdf
GB-T 7699-2022 苎麻.pdf
DB50-T 1275.2-2022 生猪智慧养殖数字化应用与管理 第2部分:基础数据 重庆市.pdf
GB-T 29767-2013 信息安全技术 公钥基础设施 桥CA体系证书分级规范.pdf
GM-T 0018-2023 密码设备应用接口规范.pdf
GB-T 33133.1-2016 信息安全技术 祖冲之序列密码算法 第1部分:算法描述.pdf
数据安全风险评估.pdf
GB-T 10886-2019 三螺杆泵.pdf
ISO SAE 21434 Road vehicles— Cybersecurity engineering.pdf
GM T 0127-2023 移动终端密码模块应用接口规范.pdf
GB-T 24421.3-2023 服务业组织标准化工作指南 第3部分:标准编制.pdf
中兴网络设备安全配置基线.doc
YD-T 1728-2008 电信网和互联网安全防护管理指南.pdf
1
/
19
评价文档
赞助2.5元 点击下载(660.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。