-
公开(公告)号:CN119600594A
公开(公告)日:2025-03-11
申请号:CN202411674609.7
申请日:2024-11-21
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 北京大学
Abstract: 本发明属于食品种类识别技术领域,公开了一种基于图像识别的膳食营养成分计算方法、电子设备和介质,营养成分计算方法包括:获取预识别图像;根据食谱库和预识别图像计算出预识别图像的特征相似度;根据特征相似度识别出菜品名称;根据菜品名称识别出对应的食材信息,食材信息包括食材名称和标准份量;根据食材信息计算出总营养成分;根据总营养成分输出营养成分结果。本发明通过自动获取菜品图像,避免了繁琐的手动输入步骤。通过识别出预识别图像的特征,根据特征相似度进行计算,以识别出菜品名称,然后根据菜品名称识别出对应的食材信息,并计算菜品的膳食营养成分,实现了高效、准确的膳食营养成分计算,显著提升了用户体验和计算精度。
-
公开(公告)号:CN119600629A
公开(公告)日:2025-03-11
申请号:CN202411674607.8
申请日:2024-11-21
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 北京大学
IPC: G06V30/412 , G06V30/42 , G06V30/413 , G06V30/418 , G16H15/00
Abstract: 本发明属于文字处理技术领域,公开了一种检查报告单表格的识别方法、电子设备和存储介质,检查报告单表格的识别方法包括:识别出表格中的所有文本框;获取每个文本框对应的文本框信息,文本框信息包括文本框中的文字内容和对应的位置坐标;基于模糊匹配算法,根据文本框信息确定出相关联的文本框;根据相关联文本框识别出对应的结果数据。本发明识别出文本框中的文字内容和位置坐标,然后采用模糊匹配算法,根据文本框信息确定出相关联的文本框,显著提高了结构化数据提取的准确性,然后根据相关联文本框确定对应的结果数据,确保了匹配的准确性和可靠性。
-
公开(公告)号:CN106649557A
公开(公告)日:2017-05-10
申请号:CN201610984538.X
申请日:2016-11-09
Applicant: 北京大学(天津滨海)新一代信息技术研究院
Abstract: 本发明公开了一种缺陷报告与邮件列表语义关联挖掘方法。本方法为:1)对获取的目标项目的缺陷报告与邮件列表进行解析,得到缺陷报告的堆栈信息、代码片段、正文文本和邮件列表的堆栈信息、代码片段、正文文本;2)文档显式语义关联挖掘单元根据解析结果识别缺陷报告和邮件列表之间的显式语义关联,包括引用关联和共同代码元素关联;3)文档隐式语义关联挖掘单元根据解析结果识别缺陷报告和邮件列表之间的隐式语义关联,包括相似关联和潜在语义关联。本发明有利于高效地定位相关的缺陷报告与邮件列表,帮助开发人员更好地复用软件资源。
-
公开(公告)号:CN119416776A
公开(公告)日:2025-02-11
申请号:CN202411417954.2
申请日:2024-10-11
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 燕溪智能(无锡)技术有限公司
IPC: G06F40/258 , G06F40/30 , G06F40/166 , G06F16/31
Abstract: 本发明属于自然语言处理技术领域,公开了一种面向知识检索的政务文档增强生成方法、电子设备和介质,面向知识检索的政务文档增强生成方法包括:识别出政务文档的标题;将文本按标题进行切分,得到多个语义完整的文本块;对语义完整的文本块进行语义切分,得到多个中粒度文本块,中粒度文本块为符合预设长度的文本块;根据多个中粒度文本块建立索引。本发明通过识别出标题,以标题结构切分文本,能够有效地将文本按照篇章结构进行第一层级的语义切分,保证了内部的语义关联性和完整性,提高了检索的准确性。
-
公开(公告)号:CN106649557B
公开(公告)日:2020-10-20
申请号:CN201610984538.X
申请日:2016-11-09
Applicant: 北京大学(天津滨海)新一代信息技术研究院
IPC: G06F16/31 , G06F16/35 , G06F40/30 , G06F16/951
Abstract: 本发明公开了一种缺陷报告与邮件列表语义关联挖掘方法。本方法为:1)对获取的目标项目的缺陷报告与邮件列表进行解析,得到缺陷报告的堆栈信息、代码片段、正文文本和邮件列表的堆栈信息、代码片段、正文文本;2)文档显式语义关联挖掘单元根据解析结果识别缺陷报告和邮件列表之间的显式语义关联,包括引用关联和共同代码元素关联;3)文档隐式语义关联挖掘单元根据解析结果识别缺陷报告和邮件列表之间的隐式语义关联,包括相似关联和潜在语义关联。本发明有利于高效地定位相关的缺陷报告与邮件列表,帮助开发人员更好地复用软件资源。
-
公开(公告)号:CN119416878A
公开(公告)日:2025-02-11
申请号:CN202411417952.3
申请日:2024-10-11
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 燕溪智能(无锡)技术有限公司
Abstract: 本发明属于计算机自然语言技术领域,公开了一种面向政务领域大语言模型的训练数据筛选法、电子设备和存储介质,面向政务领域大语言模型的训练数据筛选法包括:获取基于政务领域的原始数据集;基于原始数据集训练得到打分模型;调用打分模型对原始数据集进行质量评估,得到质量数据集;根据质量数据集得到种子数据集;根据种子数据集得到训练数据集。本发明基于原始数据集训练打分模型,使得打分模型对大语音模型有更好的适应性,通过打分模型用于评估指令的质量,使得筛选出的训练数据更为精准。
-
公开(公告)号:CN114297350B
公开(公告)日:2024-08-06
申请号:CN202110630148.3
申请日:2021-06-07
Applicant: 北京大学
IPC: G06F16/332 , G06F16/36 , G06F40/211 , G06F40/216 , G06F40/247 , G06F40/284 , G06F40/30 , G06N3/0455 , G06N5/022 , G06N5/04
Abstract: 本发明公开了一种面向自然语言的城市领域知识模型查询方法和装置,方法包括:S100、基于城市领域知识模型,对用户输入的自然语言问题进行解析,解析之后,经过与用户迭代式交互,构建自然语言问题的词素集合;S200、基于词素集合和智慧城市领域知识模型,通过隐马模型查询图生成和隐马模型查询图排序,或者通过迭代式查询图生成和迭代式查询图排序,得到最符合自然语言问题的查询子图;S300、将查询子图与预设的模板进行筛选匹配,得到自然语言问题的答案,预设的模板为基于自然语言问题的各类型预设的查询模板。本发明利用隐马模型查询和迭代式查询推测用户问句的领域知识模型查询子图,并查询答案反馈给用户,提高了检索的准确性和检索的效率。
-
公开(公告)号:CN117807063A
公开(公告)日:2024-04-02
申请号:CN202311595548.0
申请日:2023-11-27
Applicant: 北京大学
IPC: G06F16/215 , G06F16/25
Abstract: 本申请提供一种面向知识抽取模型全生命周期管理方法、装置及相关产品,可用于人工智能技术领域。该方法包括:获取多个预设数据集;将各预设数据集中的数据转换为统一规定格式,并进行数据清洗处理及模型特有的特征抽取处理,以获得各处理后数据集;从Git仓库中获取各预设知识抽取模型;采用各处理后数据集分别对各预设知识抽取模型进行自动训练及评估,以获得各处理后数据集对应的最优预设知识抽取模型;获取待确认的目标数据集,并基于目标数据集与多个候选处理后数据集的相似度确定目标数据集对应的最优目标知识抽取模型;采用最优目标知识抽取模型对目标数据集进行预测。
-
公开(公告)号:CN114297516A
公开(公告)日:2022-04-08
申请号:CN202110677628.5
申请日:2021-06-18
Applicant: 北京大学
IPC: G06F16/9536 , G06F16/9537 , G06F16/36 , G06F16/35 , G06F16/26 , G06F40/216 , G06F40/30 , G06N3/04 , G06Q30/02 , G06Q50/26
Abstract: 本发明公开了一种基于知识图谱的事件发现与展现方法,包括:S100、对每条政府服务热线数据进行预处理;S200、按照用户指定的时间间隔将用户选择的时间段内的政府服务热线数据划分为数据帧,通过社区发现算法对各帧内的政府服务热线数据进行事件检测,获取各城市事件;S300、基于二部图最大权值匹配算法,对前后两帧的事件进行匹配,建立各城市事件演化的事件链,分析事件链中各城市事件的z‑score值,确定各城市事件的突发和紧急程度,并对其中的城市突发事件进行预警和多维可视化。本发明能够清晰地了解城市发生的各种事件,并能对城市的突发事件做出检测、预警。
-
公开(公告)号:CN114297336A
公开(公告)日:2022-04-08
申请号:CN202111119620.3
申请日:2021-09-24
Applicant: 北京大学
IPC: G06F16/33 , G06F16/29 , G06F16/335 , G06F16/34 , G06F16/36 , G06F16/9035 , G06N5/04
Abstract: 本发明涉及一种基于图数据库与文档型数据库的图表联动的知识图谱查询系统和方法,属于知识图谱检索技术领域,所述系统包括领域知识模型交互式多维可视化展现模块和交互式知识推理与探查模块;交互式多维可视化展现模块用于查询实体之间结构关系,包括力导布局视图、层次布局视图和矩阵布局视图,还包括GIS地理视图、层次递进视图、图结构视图、表结构视图、微观尺度视图和宏观尺度视图;交互式知识推理与探查模块用于精确定位数据信息,提供的数据查询方式包括全局过滤、局部过滤和本体导航。本发明提供的系统和方法在面对拥有海量数据的知识图谱时,能更好地展现和查询海量数据,从而能高效精准地找到用户所需的信息。
-
-
-
-
-
-
-
-
-