-
公开(公告)号:CN113392213B
公开(公告)日:2024-05-31
申请号:CN202110420855.X
申请日:2021-04-19
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/216 , G06F40/284
Abstract: 本申请公开了一种事件抽取方法以及电子设备、存储装置,其中,事件抽取方法包括:获取事件文本的事件参数;其中,事件参数包括事件文本涉及的事件类别和事件类别的若干事件属性;在每轮抽取过程中,选择未选择过的事件参数作为当前参数,并构造关于问询当前参数的问题文本,以及将问题文本和事件文本输入事件抽取模型,以抽取得到事件文本中与当前参数对应的事件词语;其中,问题文本包括在本轮抽取之前抽取到的事件词语。上述方案,能够提高事件抽取的准确性。
-
公开(公告)号:CN116401365A
公开(公告)日:2023-07-07
申请号:CN202310379357.4
申请日:2023-04-11
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/35 , G06F16/33 , G06F18/214 , G06F18/241
Abstract: 本申请实施例公开了一种平行语料数据对的构建方法、装置及存储介质。其中,该方法包括:将具有第一风格特征的第一语料数据输入第一风格转换模型中,得到具有第二风格特征的第二语料数据;第一风格转换模型基于回译训练得到;将第一语料数据输入第二风格转换模型中,得到具有第二风格特征的第三语料数据;第二风格转换模型基于对抗训练得到;计算第二语料数据的第二风格特征对应的第一得分;计算第三语料数据的第二风格特征对应的第二得分;若第一得分大于第二得分,则利用第二语料数据和第一语料数据构建第一平行语料数据对;若第一得分不大于第二得分,则利用第三语料数据和第一语料数据构建第一平行语料数据对,解决平行语料数据对稀缺的问题。
-
公开(公告)号:CN116069876A
公开(公告)日:2023-05-05
申请号:CN202310081010.1
申请日:2023-01-16
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种基于知识图谱的问答方法、装置、设备及存储介质,本申请在生成多跳路径集合时采用了逐跳路径搜索方式,剔除掉与问题句子无关的路径,避免路径数量爆炸,保证了方案应对复杂问题的可行性。并且,通过生成多跳路径集合和约束路径集合,可以得到问题句子所有可能的答案路径,最终通过计算与问题句子的相似度,筛选相似度最高的路径的答案实体作为最终答案,提升了答案实体检索的全面性和准确性。
-
公开(公告)号:CN113536785B
公开(公告)日:2022-08-12
申请号:CN202110660904.7
申请日:2021-06-15
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/289 , G06F40/284 , G06F40/216 , G06F40/30 , G06F40/151 , G06F16/335 , G06F16/9535 , G06F16/958
Abstract: 本申请公开了一种文本推荐方法、智能终端及计算机可读存储介质,该文本推荐方法包括:获取待选文本对应的第一分词序列和历史文本序列;分别对第一分词序列和历史文本序列中的每一历史文本对应的第二分词序列进行特征提取处理,以得到待选文本特征向量和历史特征向量;其中,待选文本特征向量包括待选文本中每一分词的位置信息,历史特征向量包括每一第二分词序列中每一分词的位置信息;基于对历史特征向量进行兴趣特征提取得到的用户兴趣特征表示和待选文本特征向量,确定待选文本的预测概率值;根据预测概率值对用户进行文本推荐。上述方案,能够在提取文本特征时,充分考虑位置信息关键因素,并结合用户阅读习惯及关注点,进行文本推荐。
-
公开(公告)号:CN114492309A
公开(公告)日:2022-05-13
申请号:CN202210023406.6
申请日:2022-01-10
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/117 , G06F40/194 , G06F40/295 , G06N3/04 , G06N3/08 , G06N5/02
Abstract: 本发明提供一种序列标注方法、装置、电子设备和存储介质,其中方法包括:确定待标注文本;将待标注文本输入序列标注模型,得到序列标注模型输出的标注结果;序列标注模型是基于教师模型和学生模型之间的隐藏层对应关系,应用教师模型对学生模型中的各隐藏层进行知识迁移得到的,隐藏层对应关系是基于教师模型中的各组隐藏层与学生模型中的各隐藏层之间的相似度确定的。本发明提供的方法、装置、电子设备和存储介质,在保证教师模型和学生模型选取的灵活的同时性,提高了知识迁移效率,保证了知识迁移的可靠性,由此得到的序列标注模型,能够满足工业场景需求的高可靠性和低时延、低耗能,有助于自动化的序列标注的应用扩展。
-
公开(公告)号:CN113536785A
公开(公告)日:2021-10-22
申请号:CN202110660904.7
申请日:2021-06-15
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/289 , G06F40/284 , G06F40/216 , G06F40/30 , G06F40/151 , G06F16/335 , G06F16/9535 , G06F16/958
Abstract: 本申请公开了一种文本推荐方法、智能终端及计算机可读存储介质,该文本推荐方法包括:获取待选文本对应的第一分词序列和历史文本序列;分别对第一分词序列和历史文本序列中的每一历史文本对应的第二分词序列进行特征提取处理,以得到待选文本特征向量和历史特征向量;其中,待选文本特征向量包括待选文本中每一分词的位置信息,历史特征向量包括每一第二分词序列中每一分词的位置信息;基于对历史特征向量进行兴趣特征提取得到的用户兴趣特征表示和待选文本特征向量,确定待选文本的预测概率值;根据预测概率值对用户进行文本推荐。上述方案,能够在提取文本特征时,充分考虑位置信息关键因素,并结合用户阅读习惯及关注点,进行文本推荐。
-
公开(公告)号:CN113282742A
公开(公告)日:2021-08-20
申请号:CN202110484890.8
申请日:2021-04-30
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种摘要获取方法以及电子设备、存储装置,其中,摘要获取方法包括:获取文档组;其中,文档组包含若干文档,每一文档包含若干候选分句;分别提取若干文档中若干候选分句的句子语义表示;其中,句子语义表示包含候选分句在文档组内的第一位置信息;基于句子语义表示,选择至少一个候选分句作为目标分句;利用目标分句,得到文档组的目标摘要。上述方案,能够降低摘要冗余度,并提高摘要可读性。
-
公开(公告)号:CN112434536A
公开(公告)日:2021-03-02
申请号:CN202011233097.2
申请日:2020-11-06
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/35 , G06F40/216
Abstract: 一种文档理解方法、设备和存储介质,由文档理解模型实现。所述文档理解模型包括问题识别模型和答案识别模型。所述方法包括:获取用户输入的问题,其中,所述用户输入的问题是一个单阶问题或包括相互依赖的多个单阶问题的多阶问题;将所述问题输入至所述问题识别模型进行问题识别,得到所述问题包括的一个或多个单阶问题;将所述一个或多个单阶问题以及所述一个或多个单阶问题的候选文档输入至所述答案识别模型进行答案识别,得到所述问题的答案;以及将所述答案呈现给所述用户。使用所提供的方法,可以更精确地获取问题答案。
-
公开(公告)号:CN119783685A
公开(公告)日:2025-04-08
申请号:CN202411724204.X
申请日:2024-11-28
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/35 , G06F40/284 , G06F40/205 , G06F40/186
Abstract: 本申请公开了一种大模型提示词优化方法及相关装置,涉及大模型技术领域,包括:在得到任务需求描述之后,先基于任务需求描述,利用至少一组大模型组合,对基于任务需求描述生成的提示词进行优化得到至少一组提示词以及至少一个多轮对话信息;再进一步整合,即可得到最终优化后的提示词。本申请整个方案无需进行复杂训练,通过模型之间的对抗与合作即可实现提示词的优化,减少了人工构造高质量文本的负担,显著降低时间和资源成本,提升了提示词优化的自动化程度和效率,而且,综合多个大模型的智慧进行优化,能够消除个体大模型的盲点,增强了最终优化后的提示词的多样性与稳健性,优化效果得到了有效提升。
-
公开(公告)号:CN117520474A
公开(公告)日:2024-02-06
申请号:CN202311596889.X
申请日:2023-11-23
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/31 , G06F40/242 , G06F40/284
Abstract: 本发明提供一种信息抽取方法、装置、电子设备和存储介质,所述方法包括:确定待抽取文本;基于待抽取文本中各元事件的描述信息,确定提示文本;基于提示文本,对待抽取文本进行信息抽取,得到信息抽取结果。本发明提供的信息抽取方法、装置、电子设备和存储介质,由于提示文本中包含有待抽取文本中最小粒度的元事件要素的提示信息,从而基于提示文本能够准确且完整从待抽取文本中抽取各元事件的要素,得到精度较高的信息抽取结果。
-
-
-
-
-
-
-
-
-