-
公开(公告)号:CN119600594A
公开(公告)日:2025-03-11
申请号:CN202411674609.7
申请日:2024-11-21
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 北京大学
Abstract: 本发明属于食品种类识别技术领域,公开了一种基于图像识别的膳食营养成分计算方法、电子设备和介质,营养成分计算方法包括:获取预识别图像;根据食谱库和预识别图像计算出预识别图像的特征相似度;根据特征相似度识别出菜品名称;根据菜品名称识别出对应的食材信息,食材信息包括食材名称和标准份量;根据食材信息计算出总营养成分;根据总营养成分输出营养成分结果。本发明通过自动获取菜品图像,避免了繁琐的手动输入步骤。通过识别出预识别图像的特征,根据特征相似度进行计算,以识别出菜品名称,然后根据菜品名称识别出对应的食材信息,并计算菜品的膳食营养成分,实现了高效、准确的膳食营养成分计算,显著提升了用户体验和计算精度。
-
公开(公告)号:CN106649557A
公开(公告)日:2017-05-10
申请号:CN201610984538.X
申请日:2016-11-09
Applicant: 北京大学(天津滨海)新一代信息技术研究院
Abstract: 本发明公开了一种缺陷报告与邮件列表语义关联挖掘方法。本方法为:1)对获取的目标项目的缺陷报告与邮件列表进行解析,得到缺陷报告的堆栈信息、代码片段、正文文本和邮件列表的堆栈信息、代码片段、正文文本;2)文档显式语义关联挖掘单元根据解析结果识别缺陷报告和邮件列表之间的显式语义关联,包括引用关联和共同代码元素关联;3)文档隐式语义关联挖掘单元根据解析结果识别缺陷报告和邮件列表之间的隐式语义关联,包括相似关联和潜在语义关联。本发明有利于高效地定位相关的缺陷报告与邮件列表,帮助开发人员更好地复用软件资源。
-
公开(公告)号:CN119600629A
公开(公告)日:2025-03-11
申请号:CN202411674607.8
申请日:2024-11-21
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 北京大学
IPC: G06V30/412 , G06V30/42 , G06V30/413 , G06V30/418 , G16H15/00
Abstract: 本发明属于文字处理技术领域,公开了一种检查报告单表格的识别方法、电子设备和存储介质,检查报告单表格的识别方法包括:识别出表格中的所有文本框;获取每个文本框对应的文本框信息,文本框信息包括文本框中的文字内容和对应的位置坐标;基于模糊匹配算法,根据文本框信息确定出相关联的文本框;根据相关联文本框识别出对应的结果数据。本发明识别出文本框中的文字内容和位置坐标,然后采用模糊匹配算法,根据文本框信息确定出相关联的文本框,显著提高了结构化数据提取的准确性,然后根据相关联文本框确定对应的结果数据,确保了匹配的准确性和可靠性。
-
公开(公告)号:CN119416776A
公开(公告)日:2025-02-11
申请号:CN202411417954.2
申请日:2024-10-11
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 燕溪智能(无锡)技术有限公司
IPC: G06F40/258 , G06F40/30 , G06F40/166 , G06F16/31
Abstract: 本发明属于自然语言处理技术领域,公开了一种面向知识检索的政务文档增强生成方法、电子设备和介质,面向知识检索的政务文档增强生成方法包括:识别出政务文档的标题;将文本按标题进行切分,得到多个语义完整的文本块;对语义完整的文本块进行语义切分,得到多个中粒度文本块,中粒度文本块为符合预设长度的文本块;根据多个中粒度文本块建立索引。本发明通过识别出标题,以标题结构切分文本,能够有效地将文本按照篇章结构进行第一层级的语义切分,保证了内部的语义关联性和完整性,提高了检索的准确性。
-
公开(公告)号:CN106649557B
公开(公告)日:2020-10-20
申请号:CN201610984538.X
申请日:2016-11-09
Applicant: 北京大学(天津滨海)新一代信息技术研究院
IPC: G06F16/31 , G06F16/35 , G06F40/30 , G06F16/951
Abstract: 本发明公开了一种缺陷报告与邮件列表语义关联挖掘方法。本方法为:1)对获取的目标项目的缺陷报告与邮件列表进行解析,得到缺陷报告的堆栈信息、代码片段、正文文本和邮件列表的堆栈信息、代码片段、正文文本;2)文档显式语义关联挖掘单元根据解析结果识别缺陷报告和邮件列表之间的显式语义关联,包括引用关联和共同代码元素关联;3)文档隐式语义关联挖掘单元根据解析结果识别缺陷报告和邮件列表之间的隐式语义关联,包括相似关联和潜在语义关联。本发明有利于高效地定位相关的缺陷报告与邮件列表,帮助开发人员更好地复用软件资源。
-
公开(公告)号:CN119416878A
公开(公告)日:2025-02-11
申请号:CN202411417952.3
申请日:2024-10-11
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 燕溪智能(无锡)技术有限公司
Abstract: 本发明属于计算机自然语言技术领域,公开了一种面向政务领域大语言模型的训练数据筛选法、电子设备和存储介质,面向政务领域大语言模型的训练数据筛选法包括:获取基于政务领域的原始数据集;基于原始数据集训练得到打分模型;调用打分模型对原始数据集进行质量评估,得到质量数据集;根据质量数据集得到种子数据集;根据种子数据集得到训练数据集。本发明基于原始数据集训练打分模型,使得打分模型对大语音模型有更好的适应性,通过打分模型用于评估指令的质量,使得筛选出的训练数据更为精准。
-
-
-
-
-