-
公开(公告)号:CN116910232A
公开(公告)日:2023-10-20
申请号:CN202311179447.5
申请日:2023-09-13
Applicant: 之江实验室
IPC: G06F16/335 , G06F16/33 , G06F16/31
Abstract: 本申请涉及一种天文文献检索方法和天文文献搜索方法,其中,该天文文献检索方法包括:获取天文检索数据,对天文检索数据进行向量化编码,得到检索向量;基于天文检索数据中的文献属性,利用知识库索引引擎从预设的文献库中为天文检索数据匹配第一候选文献数据;基于检索向量,利用向量相似矩阵结合向量索引引擎,从文献库中为天文检索数据匹配第二候选文献数据;合并第一候选文献数据和第二候选文献数据,得到检索结果。其能够基于多种索引引擎分别实现天文文献数据的检索,从而提高检索的全面度和准确度。
-
公开(公告)号:CN117077679B
公开(公告)日:2024-03-12
申请号:CN202311332338.2
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/216 , G06F16/35
Abstract: 本申请涉及一种命名实体识别方法和装置。所述方法包括:获取专业知识数据库;其中,专业知识数据库包括至少两个粒度实体;确定与粒度实体对应的价值评分,基于价值评分从粒度实体中确定目标实体,并根据目标实体以及对应于目标实体的预设指令模板,得到提示指令模板;基于提示指令模板和获取到的待识别数据,生成第一待识别文本信息,对第一待识别文本信息进行命名实体识别处理,得到命名实体识别结果。采用本方法能够实现高效且准确地针对专业领域的专业型命名实体识别。
-
公开(公告)号:CN117610541A
公开(公告)日:2024-02-27
申请号:CN202410067264.2
申请日:2024-01-17
Applicant: 之江实验室
IPC: G06F40/205 , G06F40/253
Abstract: 本申请涉及一种大规模数据的作者消歧方法、装置及可读存储介质,所述方法包括:基于所述大规模数据和预先定义的谓词,生成对应的谓词实例数据;其中,所述大规模数据包括结构化存储的文献信息和对应的作者信息;所述谓词实例数据包括文献作者对;将所述谓词实例数据切分为多个初始数据块;基于预先确定的一阶逻辑规则,对所述多个初始数据块中具有相同作者的文献作者对进行合并,生成最终数据块;基于所述最终数据块中的文献作者对,生成所述大规模数据对应的作者标识信息,解决了相关技术中存在的对大规模学术文献数据的作者消歧效率较低的问题。
-
-