-
公开(公告)号:CN119358990A
公开(公告)日:2025-01-24
申请号:CN202411932111.6
申请日:2024-12-26
Applicant: 之江实验室
IPC: G06Q10/0631 , G06Q10/0639 , G06F17/10 , G06N5/02
Abstract: 本申请涉及一种人工智能代理主观问题评测的智能分配方法和系统,其中,该方法包括:通过获取开发者上传的待评测数据;待评测数据为人工智能代理的问答对数据和引用文献;基于待评测数据的领域标签,确定匹配的对象;根据开发者的开发者积分和对象的对象积分,将待评测数据分配至对应的目标对象。通过本申请,能够确定与待评测数据领域标签对应的对象后,根据开发者积分和对象积分,将待评测数据分配给目标对象,由目标对象对待评测数据进行评测,实现了待评测数据的智能分配机制,解决了无法有效、高效地分配评测任务的问题。
-
公开(公告)号:CN119357413A
公开(公告)日:2025-01-24
申请号:CN202411931432.4
申请日:2024-12-26
Applicant: 之江实验室
IPC: G06F16/38 , G06N5/022 , G06F16/335 , G06F40/103 , G06F40/30 , G06N20/00
Abstract: 本发明公开了一种基于RAG的大语言模型的论文生成方法及装置,涉及人工智能大语言模型技术领域,该方法先根据目标研究领域在知识库中进行检索,得到与之相关联的第一参考内容。将第一参考内容进行文本生成处理,生成多个初始研究方向。从初始研究方向中筛选出目标研究方向,并基于目标研究方向在知识库中进行检索,得到与之相关联的第二参考内容。将第二参考内容进行文本生成处理,以得到初始论文大纲。通过结合RAG技术的检索能力和生成能力,为大语言模型提供了知识库中额外的上下文信息。结合上下文信息生成的内容与用户的需求更为匹配,解决了相关技术中撰写的论文与用户需求的关联度低,所以针对性不强的技术问题。
-
公开(公告)号:CN119311880A
公开(公告)日:2025-01-14
申请号:CN202411798842.6
申请日:2024-12-09
Applicant: 之江实验室
IPC: G06F16/35 , G06F16/334 , G06F16/332 , G06F40/30 , G06N5/04 , G06N3/0455
Abstract: 本发明公开了一种多模态文献数据提取方法、装置及介质。该方法首先通过标准化处理文献,得到一个包含文献目录、作者信息、段落文本、段落布局、表格LaTeX代码、公式LaTeX代码和/或图像描述的结构化文档;接着,从结构化文档中根据关键词和/或向量化检索策略,针对文本、公式、表格和图像进行片段的相关检索。检索后的片段通过相关性排序进行优化,缩减需要进入大模型处理的片段数量。最后,基于用户提取需求以及排序片段,对大语言模型进行问答配置,通过提示工程技术生成结构化的回答,并确保这些结果可以通过原始片段溯源,保障问答结果的可用性,必要时提醒用户对无法溯源的部分进行核实和处理。
-
公开(公告)号:CN119107660A
公开(公告)日:2024-12-10
申请号:CN202411549300.5
申请日:2024-11-01
Applicant: 之江实验室
IPC: G06V30/41 , G06V30/14 , G06V30/19 , G06F40/186 , G06F40/258 , G06F40/30
Abstract: 本发明公开了一种基于多模态信息的论文排序方法、系统、电子设备、介质,所述方法包括:将待处理的论文PDF文档按页拆分,并将每页保存为图像数据;对每页对应的图像数据进行处理,得到每一版面区域类别以及对应的包围框坐标、文字字段;对每页中的包围框坐标进行归一化及偏移处理,对归一化及偏移处理后的包围框坐标按照从上到下、从左到右的顺序进行排序;设置无效版面区域类别,并删除,得到全文粗排序结果;设置提示词模板,将全文粗排序结果填入提示词模板后输入至大语言模型,得到全文精排序结果。
-
公开(公告)号:CN119066182A
公开(公告)日:2024-12-03
申请号:CN202411569141.5
申请日:2024-11-05
Applicant: 之江实验室
IPC: G06F16/332 , G06N5/04
Abstract: 本说明书公开了一种针对大模型多轮对话能力的测试方法以及装置。获取主题问题文本,并确定对待测模型进行测试所需的对话轮数。根据对话轮数,执行针对待测模型的多轮输入操作,其中,针对每轮对话,将该轮对话对应的输入数据输入到待测模型中,得到待测模型在该轮对话输出的回答文本,并将待测模型在该轮对话输出的回答文本以及预设的提示语句输入到预设的辅助模型中,以通过辅助模型得到下一轮对话输入到待测模型中的输入数据,当该轮对话为首轮对话时,该轮对话对应的输入数据为主题问题文本。将每轮对话对应的输入数据以及预设的评测文本输入到预设的评测模型,以得到针对待测模型的测试结果,评测文本记录有对待测模型进行评测的评测规则。
-
公开(公告)号:CN119066182B
公开(公告)日:2025-04-25
申请号:CN202411569141.5
申请日:2024-11-05
Applicant: 之江实验室
IPC: G06F16/3329 , G06N5/04
Abstract: 本说明书公开了一种针对大模型多轮对话能力的测试方法以及装置。获取主题问题文本,并确定对待测模型进行测试所需的对话轮数。根据对话轮数,执行针对待测模型的多轮输入操作,其中,针对每轮对话,将该轮对话对应的输入数据输入到待测模型中,得到待测模型在该轮对话输出的回答文本,并将待测模型在该轮对话输出的回答文本以及预设的提示语句输入到预设的辅助模型中,以通过辅助模型得到下一轮对话输入到待测模型中的输入数据,当该轮对话为首轮对话时,该轮对话对应的输入数据为主题问题文本。将每轮对话对应的输入数据以及预设的评测文本输入到预设的评测模型,以得到针对待测模型的测试结果,评测文本记录有对待测模型进行评测的评测规则。
-
公开(公告)号:CN119046444A
公开(公告)日:2024-11-29
申请号:CN202411533982.0
申请日:2024-10-31
Applicant: 之江实验室
IPC: G06F16/332
Abstract: 本发明公开了一种基于大模型的科学文献字段抽取方法及系统,包括:将科学文献(document)切分成若干片段(chunks);迭代生成亟待抽取的字段的答案,并排除chunks中不包含亟待抽取的字段的片段;之后一边生成候选答案,一边通过差异对比的方式,排除不同chunk中的冗余答案信息,排除由于幻觉导致输出的错误答案信息,并在迭代过程中融合包含正确答案的chunk,解决了针对不同片段回答零散不易整合的问题;该方法和系统在有限计算资源的条件下,能够最大发挥生成大模型对科学文献的抽取性能。
-
-
-
-
-
-