-
公开(公告)号:CN119600594A
公开(公告)日:2025-03-11
申请号:CN202411674609.7
申请日:2024-11-21
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 北京大学
Abstract: 本发明属于食品种类识别技术领域,公开了一种基于图像识别的膳食营养成分计算方法、电子设备和介质,营养成分计算方法包括:获取预识别图像;根据食谱库和预识别图像计算出预识别图像的特征相似度;根据特征相似度识别出菜品名称;根据菜品名称识别出对应的食材信息,食材信息包括食材名称和标准份量;根据食材信息计算出总营养成分;根据总营养成分输出营养成分结果。本发明通过自动获取菜品图像,避免了繁琐的手动输入步骤。通过识别出预识别图像的特征,根据特征相似度进行计算,以识别出菜品名称,然后根据菜品名称识别出对应的食材信息,并计算菜品的膳食营养成分,实现了高效、准确的膳食营养成分计算,显著提升了用户体验和计算精度。
-
公开(公告)号:CN119600629A
公开(公告)日:2025-03-11
申请号:CN202411674607.8
申请日:2024-11-21
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 北京大学
IPC: G06V30/412 , G06V30/42 , G06V30/413 , G06V30/418 , G16H15/00
Abstract: 本发明属于文字处理技术领域,公开了一种检查报告单表格的识别方法、电子设备和存储介质,检查报告单表格的识别方法包括:识别出表格中的所有文本框;获取每个文本框对应的文本框信息,文本框信息包括文本框中的文字内容和对应的位置坐标;基于模糊匹配算法,根据文本框信息确定出相关联的文本框;根据相关联文本框识别出对应的结果数据。本发明识别出文本框中的文字内容和位置坐标,然后采用模糊匹配算法,根据文本框信息确定出相关联的文本框,显著提高了结构化数据提取的准确性,然后根据相关联文本框确定对应的结果数据,确保了匹配的准确性和可靠性。
-
公开(公告)号:CN119416878A
公开(公告)日:2025-02-11
申请号:CN202411417952.3
申请日:2024-10-11
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 燕溪智能(无锡)技术有限公司
Abstract: 本发明属于计算机自然语言技术领域,公开了一种面向政务领域大语言模型的训练数据筛选法、电子设备和存储介质,面向政务领域大语言模型的训练数据筛选法包括:获取基于政务领域的原始数据集;基于原始数据集训练得到打分模型;调用打分模型对原始数据集进行质量评估,得到质量数据集;根据质量数据集得到种子数据集;根据种子数据集得到训练数据集。本发明基于原始数据集训练打分模型,使得打分模型对大语音模型有更好的适应性,通过打分模型用于评估指令的质量,使得筛选出的训练数据更为精准。
-
公开(公告)号:CN119416776A
公开(公告)日:2025-02-11
申请号:CN202411417954.2
申请日:2024-10-11
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 燕溪智能(无锡)技术有限公司
IPC: G06F40/258 , G06F40/30 , G06F40/166 , G06F16/31
Abstract: 本发明属于自然语言处理技术领域,公开了一种面向知识检索的政务文档增强生成方法、电子设备和介质,面向知识检索的政务文档增强生成方法包括:识别出政务文档的标题;将文本按标题进行切分,得到多个语义完整的文本块;对语义完整的文本块进行语义切分,得到多个中粒度文本块,中粒度文本块为符合预设长度的文本块;根据多个中粒度文本块建立索引。本发明通过识别出标题,以标题结构切分文本,能够有效地将文本按照篇章结构进行第一层级的语义切分,保证了内部的语义关联性和完整性,提高了检索的准确性。
-
公开(公告)号:CN109446231A
公开(公告)日:2019-03-08
申请号:CN201811080977.3
申请日:2018-09-17
Applicant: 北京大学 , 中国电力科学研究院有限公司 , 国网江苏省电力有限公司电力科学研究院
IPC: G06F16/2458
Abstract: 本发明涉及一种基于模式关联分析的实值时间序列规则发现方法和装置。该方法包括以下步骤:1)针对一个或多个实数值的目标时间序列,利用主题发现技术从中自动提取多种长度的主题模式;2)针对每一对主题模式,根据其在时间序列中出现的位置以及间隔,分析两者之间的配对关系;3)根据一对主题模式的配对结果,对该对主题模式所构成的候选规则进行评分,并选择评分超过预设的阈值的候选规则作为规则。该装置包括主题模式发现模块、主题模式关联分析模块和规则评分模块。本发明能够高效地自动提取蕴含有意义信息的模式;可以根据使用者需求调整模式的偏好;通过模式间的关联关系能够找到有一定关联关系规则,避免了无效规则。
-
公开(公告)号:CN108647223A
公开(公告)日:2018-10-12
申请号:CN201810241305.X
申请日:2018-03-22
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明涉及一种基于模式关联分析的实值时间序列规则发现方法和装置。该方法包括以下步骤:1)针对一个或多个实数值的目标时间序列,利用主题发现技术从中自动提取多种长度的主题模式;2)针对每一对主题模式,根据其在时间序列中出现的位置以及间隔,分析两者之间的配对关系;3)根据一对主题模式的配对结果,对该对主题模式所构成的候选规则进行评分,并选择评分超过预设的阈值的候选规则作为规则。该装置包括主题模式发现模块、主题模式关联分析模块和规则评分模块。本发明能够高效地自动提取蕴含有意义信息的模式;可以根据使用者需求调整模式的偏好;通过模式间的关联关系能够找到有一定关联关系规则,避免了无效规则。
-
公开(公告)号:CN109446231B
公开(公告)日:2023-12-26
申请号:CN201811080977.3
申请日:2018-09-17
Applicant: 北京大学 , 中国电力科学研究院有限公司 , 国网江苏省电力有限公司电力科学研究院
IPC: G06F16/2458
Abstract: 本发明涉及一种基于模式关联分析的实值时间序列规则发现方法和装置。该方法包括以下步骤:1)针对一个或多个实数值的目标时间序列,利用主题发现技术从中自动提取多种长度的主题模式;2)针对每一对主题模式,根据其在时间序列中出现的位置以及间隔,分析两者之间的配对关系;3)根据一对主题模式的配对结果,对该对主题模式所构成的候选规则进行评分,并选择评分超过预设的阈值的候选规则作为规则。该装置包括主题模式发现模块、主题模式关联分析模块和规则评分模块。本发明能够高效地自动提取蕴含有意义信息的模式;可以根据使用者需求调整模式的偏好;通过模式间的关联关系能够找到有一定关联关系规则,避免了无效规则。
-
-
-
-
-
-