-
公开(公告)号:CN117290782A
公开(公告)日:2023-12-26
申请号:CN202311228265.2
申请日:2023-09-21
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F18/2413 , G06F18/2415 , G06F18/21 , G06F16/332
Abstract: 本申请提供一种检索模型训练方法、知识问答方法、装置、设备及介质,该方法包括:获取训练数据,其包括给定问题、正样本和负样本;将训练数据输入到文本嵌入模型中,计算正样本与给定问题之间的第一相似度和负样本与给定问题之间的第二相似度;将训练数据输入到大模型计算模块中,得到正样本对应的第一可回答概率值和负样本对应的第二可回答概率值;基于预设的损失函数阈值控制给定问题与正样本之间的第一距离大于给定问题与负样本之间的第二距离以确定检索模型的参数。本申请有助于提高检索模型的准确性。
-
公开(公告)号:CN114745355B
公开(公告)日:2023-06-30
申请号:CN202210089854.6
申请日:2022-01-25
Applicant: 合肥讯飞数码科技有限公司
IPC: H04L61/4511 , G06F16/2458 , G06F16/25
Abstract: 本申请公开了一种DNS检测方法及装置、电子设备和存储介质,其中,DNS检测方法包括:获取第一DNS域名和域名数据库;且域名数据库包括若干域名访问集合,域名访问集合包含至少一组域名数据,每组域名数据包括第二DNS域名及其对应的IP地址,且每个域名访问集合中各第二DNS域名满足第一相似条件;选择域名数据库中与第一DNS域名满足第二相似条件的域名访问集合,作为目标访问集合;再基于目标访问集合的更新时间进行度量,得到第一DNS域名的可利用情况。上述方案,能够准确确定域名的可利用情况。
-
公开(公告)号:CN116187317A
公开(公告)日:2023-05-30
申请号:CN202211590603.2
申请日:2022-12-12
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/289 , G06F40/211 , G06F40/30
Abstract: 本发明提供一种文本生成方法、装置、设备及计算机可读介质,该方法根据所述关键词组,检索得到与所述关键词组匹配的文本段落;将所述关键词组和与所述关键词组匹配的文本段落输入至智能写作模型中,由所述智能写作模型生成所述关键词组的写作文本;由于关键词组的写作文本中的词由所述智能写作模型从词汇表、所述关键词组以及与所述关键词组匹配的文本段落中获取得到,且关键词组的写作文本是参考了关键词组匹配的文本段落生成的,因此即使是新领域的关键词组,智能写作模型也能在不需要新领域的文本训练的情况下,快速生成适配新领域的写作文本。
-
公开(公告)号:CN114462673A
公开(公告)日:2022-05-10
申请号:CN202111641675.0
申请日:2021-12-29
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明公开了用于预测未来事件的方法、系统、计算设备和可读介质,方法包括:获取要预测的未来事件的四元组中的三元素,所述三元素包括时间戳、主体要素和类型要素,其中所述四元组中的客体要素是未知的;对所述时间戳进行编码,获取所述时间戳的时间向量表示;使用经训练的预训练语言模型和经训练的图神经网络模型分别得到所述主体要素的主体向量表示和所述类型要素的类型向量表示;以及基于所述时间向量表示、主体向量表示和类型向量表示,得到对所述未来事件的客体要素的预测结果。本发明能够获取实体节点和事件类型的语义表示,增强了语义表达能力,并且能够预测未来可能发生的新事件。
-
公开(公告)号:CN113392213A
公开(公告)日:2021-09-14
申请号:CN202110420855.X
申请日:2021-04-19
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/216 , G06F40/284
Abstract: 本申请公开了一种事件抽取方法以及电子设备、存储装置,其中,事件抽取方法包括:获取事件文本的事件参数;其中,事件参数包括事件文本涉及的事件类别和事件类别的若干事件属性;在每轮抽取过程中,选择未选择过的事件参数作为当前参数,并构造关于问询当前参数的问题文本,以及将问题文本和事件文本输入事件抽取模型,以抽取得到事件文本中与当前参数对应的事件词语;其中,问题文本包括在本轮抽取之前抽取到的事件词语。上述方案,能够提高事件抽取的准确性。
-
公开(公告)号:CN112488316A
公开(公告)日:2021-03-12
申请号:CN202011460065.6
申请日:2020-12-11
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种事件意图推理方法、装置、设备及存储介质,本申请获取当前发生事件的事件信息,以预先训练的分类神经网络模型对事件信息进行模糊化处理,得到模糊化结果,采用模糊规则对模糊化结果进行组合及推理,得到模糊推理结果,对模糊推理结果进行去模糊化处理,得到当前发生事件的事件意图。本申请通过模糊理论来解决含义模糊信息的事件意图推理问题,同时将模糊理论与神经网络模型结合,使用分类神经网络模型进行模糊化处理,既能够学习到深度神经模型强大的特征表达能力,又继承了模糊理论的模糊推理能力,从而更加适用于对模糊性的事件意图进行推理,提高了事件意图的推理准确性。
-
公开(公告)号:CN119514495A
公开(公告)日:2025-02-25
申请号:CN202411424560.X
申请日:2024-10-12
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/151 , G06F16/955 , G06V10/74
Abstract: 本申请公开了一种网址检测方法及相关装置、设备和存储介质,其中,网址检测方法包括:分别提取目标网址文本中不符合预设条件的各个目标字符;其中,预设条件至少包括以下两种:预设字体形式和预设网址字符;基于目标字符属于不符合预设条件的具体种类,采用与具体种类相匹配的校正方式处理目标字符,得到目标字符校正之后符合预设条件的标准字符;基于目标字符的标准字符替换目标字符,得到目标网址文本的标准网址文本。上述方案,能够提升网址检测的准确性。
-
公开(公告)号:CN118014068A
公开(公告)日:2024-05-10
申请号:CN202410197991.0
申请日:2024-02-22
Applicant: 合肥讯飞数码科技有限公司
IPC: G06N5/022 , G06F16/36 , G06F16/28 , G06F40/289
Abstract: 本申请公开了一种知识图谱的实体对齐方法、装置、存储介质及设备,该方法包括:首先对获取到的第一知识图谱和第二知识图谱中各个实体的属性关系进行标准化处理,得到各个实体的标准化属性关系,然后通过对比学习的方式,提取各个实体的特征向量;接着通过计算第一知识图谱中目标实体的特征向量和第二知识图谱中各个实体的特征向量之间的相似度,从第二知识图谱中筛选出满足预设条件的K个候选实体;再将目标实体的相关信息、K个候选实体的相关信息和预设专家规则,结合prompt,输入预设的大语言模型,得到目标实体与K个候选实体的对齐结果;依次类推,将第一知识图谱中其他实体分别作为目标实体进行前述对齐处理,得到准确性更高的实体对齐结果。
-
公开(公告)号:CN117874199A
公开(公告)日:2024-04-12
申请号:CN202410040693.0
申请日:2024-01-10
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/34 , G06F16/36
Abstract: 本申请提出一种模型训练方法、问答处理方法、装置、设备、介质及产品,该方法包括:利用第一训练数据对大语言模型进行无监督预训练,所述第一训练数据包括事理图谱中的事件内容数据和/或事件关系数据;利用基于所述事理图谱构建的问答数据,对预训练后的所述大语言模型进行有监督的问答训练,得到基于所述事理图谱的问答模型;其中,所述问答数据包括事件参数问答数据、事件关系问答数据、事件关系理解问答数据和思维链式问答数据中的至少一种,所述思维链式问答数据包括待解答问题,以及解答所述待解答问题的推理过程数据。上述方案能够提高基于事理图谱的问答处理的准确度。
-
公开(公告)号:CN114745355A
公开(公告)日:2022-07-12
申请号:CN202210089854.6
申请日:2022-01-25
Applicant: 合肥讯飞数码科技有限公司
IPC: H04L61/4511 , G06F16/2458 , G06F16/25
Abstract: 本申请公开了一种DNS检测方法及装置、电子设备和存储介质,其中,DNS检测方法包括:获取第一DNS域名和域名数据库;且域名数据库包括若干域名访问集合,域名访问集合包含至少一组域名数据,每组域名数据包括第二DNS域名及其对应的IP地址,且每个域名访问集合中各第二DNS域名满足第一相似条件;选择域名数据库中与第一DNS域名满足第二相似条件的域名访问集合,作为目标访问集合;再基于目标访问集合的更新时间进行度量,得到第一DNS域名的可利用情况。上述方案,能够准确确定域名的可利用情况。
-
-
-
-
-
-
-
-
-