专利 小学作文语音识别文本纠错系统及方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211266801.3 (22)申请日 2022.10.17 (71)申请人上海城建职业学院地址 200438 上海市杨浦区军工路23 60号 (72)发明人贾思远　孙文龙　 (74)专利代理机构北京鑫知翼知识产权代理事务所(普通合伙) 11984 专利代理师孙长江 (51)Int.Cl. G10L 15/26(2006.01) G10L 15/06(2013.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称小学作文语音识别文本纠错系统及方法 (57)摘要本发明涉及一种小学作文语音识别文本纠错系统及方法，包括如下步骤：选择目标小学作文训练语料，将选择的目标小学作文训练语料按照句子分成长度小于512字的短句；使用语音合成服务，分别按照男童音和女童音生成相应的语音文件；将语音作为模型输入、文本作为模型输出，对语料进行自适应训练下的微调；根据训练后的深度模型推断小学作文语音的文本。本发明主要解决小学生在写作文过程中，遇到不会书写的汉字时，通过说出想写的句子，系统会自动快速的提供正确的书写模式，作为参考，帮助学生完成作文的写作。权利要求书2页说明书13页附图3页 CN 115547334 A 2022.12.30 CN 115547334 A 1.小学作文语音识别文本纠错方法，其特征在于，包括如下步骤： S1.选择目标小学作文训练语料，将选择的目标小学作文训练语料按照句子分成长度小于512字的短句； S2.使用语音合成服务，分别按照男童音和女童音生成相应的语音文件； S3.将语音作为模型输入、文本作为模型输出，对语料进行自适应训练下的微调； S4.根据训练后的深度模型推断小学作文语音的文本。 2.根据权利要求1所述的小学作文语音识别文本纠错方法，其特征在于，所述S1中，具体包括步骤：首先加载相关Python模型，然后分别加载每一篇小学作文文本，加载完成后，对所有文本按照句子进行分割，获得每段文本的字数，筛选出字数在1 ‑512之间的文本，并保存为文本。 3.根据权利要求2所述的小学作文语音识别文本纠错方法，其特征在于，所述S2中，具体包括步骤：首先加载微软相关服务模块，然后将文本转语音配置文件设置为中文童音，读取S1中筛选出的所有文本文件，针对每一个文件使用微软的Asure服务转成对应语音，并按照文本编号对语音文件命名。 4.根据权利要求3所述的小学作文语音识别文本纠错方法，其特征在于，所述S3中，具体包括步骤： S31.导入Transformers中语音相关的模型； S32.读取文本语料文件； S33.获取语音文件名称； S34.将文本文件与语音文件一一对应； S35.删除多余的字段； S36.增加全部语音的音频数字表达； S37.获得所有小学作文的字典表； S38.将所有样本分成训练集和验证集； S39.生成用于深度学习的DataSet； S310.加载Transformers的语音处理程序； S311.生成适用于深度学习的训练集和验证集； S312.定义基于语音的损失函数； S313.构建基于Wav2 Vec2的Transformers模型； S314.利用Transformers的自训练模型对语音和文本进行训练。 5.根据权利要求4所述的小学作文语音识别文本纠错方法，其特征在于，所述S4中，具体包括步骤： S41.加载Transformers的语音相关模型； S42.训练后的模型结果； S43.加载训练后的模型结果； S44.配置用于语音识别的模型； S45.设置分词器，加载训练时的所有小学作文的全部词汇； S46.设置语音处理接口； S47.加载对应的语音文件，并获得该语音文件的向量；权　利　要　求　书 1/2 页 2 CN 115547334 A 2S48.对上述语音文件进行预测； S49.输出对应的文本。 6.利用权利要求5所述的小学作文语音识别文本纠错方法的纠错系统，其特征在于，包括存储模块、语音合成模块、语音识别模块、训练模块、文本输出模块，所述存储模块用于存储目标小学作文训练语料文本、短句文本、词汇文本，所述语音合成模块用于读取存储模块中的文本文件，并将其转成对应语音，并存储，所述语音识别模块用于接收语音输入信号，所述训练模块用于将接收语音输入信号进行处理和预测并对语音和文本进行训练，所述文本输出模块用于根据训练模块的预测结果输出对应的文本信息。权　利　要　求　书 2/2 页 3 CN 115547334 A 3

专利 小学作文语音识别文本纠错系统及方法

专利小学作文语音识别文本纠错系统及方法