-
公开(公告)号:CN111310447B
公开(公告)日:2024-02-02
申请号:CN202010192025.1
申请日:2020-03-18
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F40/253 , G06F40/232
Abstract: 本发明实施例提供一种语法纠错方法、装置、电子设备和存储介质,其中方法包括:确定待纠错的文本;将文本输入至语法纠错模型,得到语法纠错模型输出的文本中每个字的检错结果和纠正结果;其中,语法纠错模型是基于样本文本、样本文本中每个样本字的样本检错结果和样本纠正结果训练得到的;语法纠错模型用于确定文本中每个字的检错结果,并基于每个字的检错结果所对应的解码方式,确定每个字的纠正结果。本发明实施例提供的方法、装置、电子设备和存储介质,无需人工校对即可实现语法纠错,在保证语法纠错效率的同时,提高了语法纠错的准确性和可靠性。
-
公开(公告)号:CN116741178A
公开(公告)日:2023-09-12
申请号:CN202310492855.X
申请日:2023-04-28
Applicant: 科大讯飞股份有限公司
IPC: G10L15/26 , G10L15/18 , G10L15/16 , G10L15/06 , G06F40/30 , G06F16/332 , G06F40/186
Abstract: 本申请公开了一种文稿生成方法、装置、设备和存储介质,其中,文稿生成方法包括:基于用户关于期望输出文稿的语音数据,得到对应的识别文本;基于识别文本进行分析,得到期望输出文稿的关键要素;其中,关键要素包括至少一个语义级别的子要素;基于关键要素,生成第一目标文稿。上述方案,能够缩短用户获取文稿的时间,提高用户工作效率。
-
公开(公告)号:CN116595138A
公开(公告)日:2023-08-15
申请号:CN202310506309.7
申请日:2023-05-05
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F3/0483 , G10L15/26
Abstract: 本申请实施例公开了一种知识问答方法、装置、设备及存储介质,获得文本以及针对文本的第一用户提问;第一用户提问指示获得与文本关联的知识;基于文本和第一用户提问生成第一用户提问对应的与文本关联的第一知识;输出第一知识。本申请提供的知识问答方法,只要获得文本和针对文本的用户提问就能自动获得用户提问对应的与文本关联的知识,从而帮助阅读者快速获得文本的相关知识。
-
公开(公告)号:CN116561297A
公开(公告)日:2023-08-08
申请号:CN202310506157.0
申请日:2023-05-05
Applicant: 科大讯飞股份有限公司
IPC: G06F16/34 , G06F3/0484 , G06F3/0482 , G10L15/26 , G06F40/30
Abstract: 本发明提供一种写作方法、装置、电子设备和存储介质,其中方法包括:接收用户输入;响应于用户输入,确定素材文档中的关键内容;基于所述素材文档和所述关键内容进行写作,得到目标文档,克服了传统方案中自动写作时模型输出的文稿重点不明确,且与用户实际关注的重点不相吻合,从而导致用户体验不佳的缺陷,明确了写作过程的侧重点,保证了模型输出文稿与用户关注点的契合,实现了低复杂度且优质的一键式写作,降低了写作所需的计算资源,提高了文稿的生成效率和生成质量,优化了用户体验。
-
公开(公告)号:CN115455982A
公开(公告)日:2022-12-09
申请号:CN202210995846.8
申请日:2022-08-17
Applicant: 科大讯飞股份有限公司 , 联通在线信息科技有限公司 , 广州市讯飞樽鸿信息技术有限公司
Abstract: 本申请提出一种对话处理方法、装置、电子设备及存储介质,方法包括:至少基于当前对话文本预测得到当前对话文本对应的第一语义信息;其中,第一语义信息包括:领域信息、意图信息和语义槽信息;根据预先构建的对话知识图谱,对第一语义信息以及历史对话语义信息进行语义信息融合,得到第二语义信息,其中,历史对话语义信息为根据历史对话文本而确定的语义信息;根据第二语义信息,确定与第二语义信息对应的对话提示信息。采用本方案,对当前对话文本对应的第一语义信息以及历史对话文本对应的语义信息进行融合,可以实现对话状态追踪,准确把握各个对话之间依赖关系,从而能够确定更加准确的有益信息,因此能够提高对话管理的准确度。
-
公开(公告)号:CN115374768A
公开(公告)日:2022-11-22
申请号:CN202211021117.9
申请日:2022-08-24
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06F40/216 , G06F40/284 , G06F40/154 , G06F16/31 , G06F16/33 , G06F16/35
Abstract: 本申请提供了一种新词发现方法和装置、计算机设备、存储介质,解决了现有技术中新词发现过程数据查找速度较慢的问题。其中,新词发现方法包括:采用树形存储结构对获取到的多个n元词语进行存储,多个n元词语是对预定文本序列进行n‑gram词频统计得到的,n值取从1开始的多个连续自然数,每个n元词语携带有词频和上下文信息,上下文信息包括至少一个相邻一元词语和至少一个相邻一元词语各自与n元词语的位置关系,树形存储结构的n级节点存储n元词语,同一路径中n+1级节点存储的n+1元词语取决于n级节点存储的n元词语的上下文信息;基于树形存储结构确定多个n元词语中的候选词;基于词性对候选词进行过滤,得到新词。
-
公开(公告)号:CN114492453A
公开(公告)日:2022-05-13
申请号:CN202111677576.8
申请日:2021-12-31
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/232 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种文本纠错方法及装置、存储介质及电子设备,涉及文本处理技术领域。该文本纠错方法包括:利用错误检测模型,判断待纠错文本是否有误;若待纠错文本有误,利用错误修正模型,确定待纠错文本对应的修正文本,其中,错误检测模型由对抗生成网络中的判别器训练得到,错误修正模型由对抗生成网络中的生成器训练得到。该文本纠错方法只针对有误文本进行纠错任务,减少了错误修正模型的计算量,提高了文本纠错系统的运行速度。
-
公开(公告)号:CN114282527A
公开(公告)日:2022-04-05
申请号:CN202111576592.8
申请日:2021-12-22
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F40/232 , G06F40/30 , G06F40/58 , G06F40/242 , G06F40/289 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种多语言文本检测与纠错方法、系统、电子设备及存储介质,所述方法包括获取待检测文本,并对所述待检测文本进行多语言字符识别以得到至少一个待识别语句;对所述待识别语句中的目标语言的字符进行语种检测,得到待检测语种单词,并对所述待检测语种单词进行拼写检测和语义检测;若至少一个所述待检测语种单词存在拼写错误和/或语义错误,则对存在拼写错误和/或语义错误的单词进行对应的拼写纠错和/或语义纠错。本发明可以更好地理解跨语言语境下的文本语义,对文本中的所有目标语言的字符进行检测并只对检测有错误的单词进行纠正。
-
公开(公告)号:CN114154497A
公开(公告)日:2022-03-08
申请号:CN202111467935.7
申请日:2021-12-03
Applicant: 科大讯飞河北科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC: G06F40/289 , G06F40/211 , G06F40/30 , G06K9/62
Abstract: 本发明提供一种语病识别方法、装置、电子设备和存储介质,所述方法包括:确定待识别语句;提取待识别语句中各分词的分词表示;基于待识别语句中各分词的分词表示,以及待识别语句的句法结构,对待识别语句进行语病识别;分词表示用于表征对应分词的上下文语义和对应分词与待识别语句中其余分词间的句法依赖关系。本发明提供的语病识别方法、装置、电子设备和存储介质,能够结合语义信息和句法信息对待识别语句中的句法结构问题和语义问题进行病句识别,进而准确得到病句识别结果。
-
公开(公告)号:CN114254623B
公开(公告)日:2025-05-13
申请号:CN202111527097.8
申请日:2021-12-14
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06F40/232 , G06F40/30 , G06F40/211 , G06F16/35 , G06N20/00 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/088
Abstract: 本申请提供了一种文本纠错方法、装置、设备及存储介质,方法包括:获取待纠错文本;获取多个位置分别对应的候选字符集合,所述位置对应的候选字符集合包括与位于待纠错文本中所述位置的字符的具有关联关系的候选字符;获取多个候选文本分别对应的关联分数,候选文本的每一位置的字符为该位置对应的候选字符集合中的候选字符;根据多个候选文本分别对应的关联分数,从多个候选文本中确定待纠错文本对应的纠正后文本。由于本申请考虑了候选文本的各位置的候选字符之间的关联关系,因此,候选文本的关联分数能够体现候选文本作为一个整体的准确程度,根据候选文本分别对应的关联分数,能够准确地确定出待纠错文本对应的纠正后文本。
-
-
-
-
-
-
-
-
-