-
公开(公告)号:CN112906391B
公开(公告)日:2024-05-31
申请号:CN202110282621.3
申请日:2021-03-16
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/289 , G06F40/30
Abstract: 本发明提供一种元事件抽取方法、装置、电子设备和存储介质,其中方法包括:确定待处理文本包含的触发词及其对应的各参数词;抽取触发词对应的每两个参数词在待处理文本中的关系;基于触发词对应的各参数词,以及每两个参数词之间的关系类型,构建触发词的参数关系图;遍历触发词的参数关系图,得到触发词的各元事件。本发明提供的方法、装置、电子设备和存储介质,完成了同一触发词下多元事件的事件拆分,从而实现细粒度的元事件抽取,有助于提高元事件抽取的可靠性和准确性。
-
公开(公告)号:CN115952804A
公开(公告)日:2023-04-11
申请号:CN202211714486.6
申请日:2022-12-29
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/30 , G06F16/35 , G06F40/289
Abstract: 本发明提供一种事件共指消解方法、装置、电子设备及存储介质,其中方法包括:获取事件文本;基于所述事件文本对应的事件提示文本,对所述事件文本进行语义编码,得到所述事件文本的事件语义特征,所述事件提示文本用于提示所述事件文本中待关注的参数类型;提取所述事件文本之间的比较提示文本的比较语义特征,所述比较提示文本用于提示所述事件文本之间待比较的参数类型;基于所述事件语义特征和所述比较语义特征,进行事件共指消解。本发明提供的方法、装置、电子设备及存储介质,由此,可以使得后续进行事件共指消解时,模型特别关注事件文本之间待比较的参数类型,能够更好地挖掘文本语义信息,提高事件共指消解的准确性和可靠性。
-
公开(公告)号:CN113282742B
公开(公告)日:2022-08-12
申请号:CN202110484890.8
申请日:2021-04-30
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种摘要获取方法以及电子设备、存储装置,其中,摘要获取方法包括:获取文档组;其中,文档组包含若干文档,每一文档包含若干候选分句;分别提取若干文档中若干候选分句的句子语义表示;其中,句子语义表示包含候选分句在文档组内的第一位置信息;基于句子语义表示,选择至少一个候选分句作为目标分句;利用目标分句,得到文档组的目标摘要。上述方案,能够降低摘要冗余度,并提高摘要可读性。
-
公开(公告)号:CN112906391A
公开(公告)日:2021-06-04
申请号:CN202110282621.3
申请日:2021-03-16
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/289 , G06F40/30
Abstract: 本发明提供一种元事件抽取方法、装置、电子设备和存储介质,其中方法包括:确定待处理文本包含的触发词及其对应的各参数词;抽取触发词对应的每两个参数词在待处理文本中的关系;基于触发词对应的各参数词,以及每两个参数词之间的关系类型,构建触发词的参数关系图;遍历触发词的参数关系图,得到触发词的各元事件。本发明提供的方法、装置、电子设备和存储介质,完成了同一触发词下多元事件的事件拆分,从而实现细粒度的元事件抽取,有助于提高元事件抽取的可靠性和准确性。
-
公开(公告)号:CN119514495A
公开(公告)日:2025-02-25
申请号:CN202411424560.X
申请日:2024-10-12
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/151 , G06F16/955 , G06V10/74
Abstract: 本申请公开了一种网址检测方法及相关装置、设备和存储介质,其中,网址检测方法包括:分别提取目标网址文本中不符合预设条件的各个目标字符;其中,预设条件至少包括以下两种:预设字体形式和预设网址字符;基于目标字符属于不符合预设条件的具体种类,采用与具体种类相匹配的校正方式处理目标字符,得到目标字符校正之后符合预设条件的标准字符;基于目标字符的标准字符替换目标字符,得到目标网址文本的标准网址文本。上述方案,能够提升网址检测的准确性。
-
公开(公告)号:CN116361354A
公开(公告)日:2023-06-30
申请号:CN202310101866.0
申请日:2023-01-19
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/2458 , G01S7/41 , G06F16/25 , G06F16/28 , G06F16/9537
Abstract: 本申请涉及一种中断航迹关联方法、装置、存储介质及电子设备,包括:获取中断前航迹和中断后航迹;从中断前航迹中提取至少一个目标点位信息,并从中断后航迹中提取至少一个目标点位信息,以得到点位信息序列;确定每个目标点位信息对应的点位特征信息;根据各个目标点位信息对应的点位特征信息,确定点位信息序列中的每个目标点位信息对应的与点位信息序列中的其他目标点位信息相关的目标特征信息;根据各个目标点位信息对应的目标特征信息,对中断前航迹和中断后航迹进行关联。从而能够基于中断前航迹和中断后航迹的关联特征进行中断航迹关联,无需对航迹数据进行复杂计算,且能够对环境自适应,因而能够提高中断航迹关联的准确性。
-
公开(公告)号:CN114491129A
公开(公告)日:2022-05-13
申请号:CN202210055957.0
申请日:2022-01-18
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/583 , G06F40/109 , G06F40/30
Abstract: 本发明提供一种版面分析方法、装置、电子设备和存储介质,其中方法包括:从待分析图像的句子集合中,确定各个句子的候选下句;基于各个句子及其候选下句的语义信息,从各个句子的候选下句中确定各个句子的下一句子;基于各个句子的下一句子,对句子集合进行版面排序。本发明提供的方法、装置、电子设备和存储介质,基于各个句子及其候选下句的语义信息进行上下句判断,从而从候选下句中确定句子的下一句子,实现待分析图像中句子的版面排序,全程无需应用人为制定的版面排序规则,避免了人为指定规则对于人力和时间的浪费,并且针对结构变化或者排版复杂的图像同样适用,实现了自动化且适应性更强的版面分析,有助于拓宽版面分析的应用。
-
公开(公告)号:CN114036290A
公开(公告)日:2022-02-11
申请号:CN202111257797.X
申请日:2021-10-27
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/35 , G06F40/216 , G06F40/30
Abstract: 本申请公开了一种事件脉络生成方法及相关装置、电子设备、存储介质,其中,事件脉络生成方法包括:获取新闻集合的分类信息;其中,新闻集合包括若干新闻文本,分类信息包括至少一组新闻对的第一关系类别,且新闻集合中每两个新闻文本组成一组新闻对;基于分类信息,将新闻集合划分为分别涉及若干主题的第一子集,以及基于分类信息,将第一子集划分为分别涉及若干事件的第二子集;基于分类信息,分别生成各个主题的事件脉络;其中,事件脉络包括相连的若干事件节点,各个事件节点分别对应于涉及主题的第一子集中各个第二子集。上述方案,能够提高生成事件脉络的准确性。
-
公开(公告)号:CN112861527A
公开(公告)日:2021-05-28
申请号:CN202110286434.2
申请日:2021-03-17
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/279 , G06F40/216
Abstract: 本申请提出一种事件抽取方法、装置、设备及存储介质,该方法包括:将待抽取文本输入预先训练的事件抽取模型,得到所述待抽取文本中的各个文本单元的类别标签,作为事件抽取结果;所述事件抽取模型,以文本序列作为训练样本,以所述文本序列的事件触发词位置标签,以及所述文本序列的每一文本单元的类别标签作为第一类型样本标签,训练得到,其中,文本单元的类别标签包括文本单元所属的事件触发词类型和事件论元类型的标签。上述方法能够实现事件抽取,并且能够全面地识别文本在事件中的多重角色,从而保证事件抽取的完整性。
-
公开(公告)号:CN119577109A
公开(公告)日:2025-03-07
申请号:CN202411602139.3
申请日:2024-11-11
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/334 , G06F16/35 , G06F16/3329 , G06F40/30 , G06F18/22 , G06N3/0455 , G06N5/04
Abstract: 本申请公开了一种函数调用方法及相关方法、装置、设备和存储介质,其中,函数调用方法包括:获取历史调用记录,并获取与当前需求描述相匹配的预设函数作为当前函数;其中,当前需求描述为智能体当前处理的用户需求描述,历史调用记录包含智能体处理历史需求描述最终调用的历史函数;获取当前函数分别与各个历史函数之间的函数相似度;基于由函数相似度所选择的历史函数,得到处理当前需求描述最终调用的目标函数。上述方案,能够在处理新需求时参考对历史需求的函数调用,有助于提升智能体的学习能力和执行效率。
-
-
-
-
-
-
-
-
-