-
公开(公告)号:CN114332108A
公开(公告)日:2022-04-12
申请号:CN202111499410.1
申请日:2021-12-09
Applicant: 拓尔思信息技术股份有限公司
IPC: G06T7/11 , G06K9/62 , G06T7/187 , G06V10/762
Abstract: 本发明涉及计算机技术领域,涉及图像处理,具体涉及一种图片中的虚实线局部区域的提取方法。具体包括:将图片原始图进行尺寸规格化;二值化得到第二处理图;通过像素点的宽度来判断是否是线条图;利用候选虚线判断准则判断图像的某一区域是否是候选虚线;进行虚线确认与搭接得到第三处理图;最后利用虚线确认准则,通过包围率算法,提取实际子图。本发明可以准确并快速完成虚实线结合图的子图的提取,尤其是局部外观设计图的局部保护区域的提取,提取后使用全局特征检索即可实现快速检索,解决了局部设计审查的难题,可以提高对局部外观设计专利的审查效率,对国家提出的知识产权“提质增效”的战略提供技术支持。
-
公开(公告)号:CN119721257A
公开(公告)日:2025-03-28
申请号:CN202510206413.3
申请日:2025-02-25
Applicant: 拓尔思信息技术股份有限公司
IPC: G06N5/04 , G06N5/022 , G06F16/35 , G06F40/289 , G06F40/211
Abstract: 本发明属于人工智能领域,提出一种基于事理图谱和大模型的推演方法及系统,通过构建包含现实事件和虚拟事件的事件库,并基于这些事件库建立事理图谱,能够扩展数据集的范围,使其不受实际数据的限制,这样不仅丰富了数据的多样性,还为推荐系统提供了创新的可能性,使得推荐结果更加丰富和多元;使用事理图谱构造用于大模型训练的指令数据集,能够更好地描述事件之间的复杂关系和动态过程,从而在构建指令数据集能够提供更加准确和深入的知识支持;通过指令调优即指令数据集中的指令约束大模型的输出,提高了对大模型的输出的可控性和可预测性;大模型具备了强大的推演能力,突破了事理图谱库的规模限制,推演结果可能具有一定的创新性。
-
公开(公告)号:CN118296134A
公开(公告)日:2024-07-05
申请号:CN202410718893.7
申请日:2024-06-05
Applicant: 拓尔思信息技术股份有限公司
IPC: G06F16/332 , G06F40/295 , G06F40/211 , G06Q40/12
Abstract: 本发明涉及海关数据处理技术领域,提出了一种基于提示学习的海关税收风险知识抽取方法,建立海关风险知识抽取的数据源:输入通用预训练命名实体识别模型抽取企业实体名称,并利用依存句法优化实体命名结果,得到候选名称;将候选名称放入提示学习语言模型进行验证,输出概率最高的企业实体名称;再进行风险评价提取:基于预训练语言模型的提示学习来对报道正负面做文本分类预测;最后将提取出企业实体名称、风险评价信息进行特征融合,并录入海关报关单数据库。提高实体命名识别的准确性,并解决了对海关风险信息领域的样本信息少,抽取任务准确率低的问题。
-
公开(公告)号:CN116383331A
公开(公告)日:2023-07-04
申请号:CN202310001827.3
申请日:2023-01-03
Applicant: 拓尔思信息技术股份有限公司
Abstract: 本发明提出了一种构建中文事件库及基于该元事件库对元事件分析预测的方法及系统。构建中文事件库的方法具体步骤包括:S1:元事件抽取;S2:元事件共指;S3:元事件关联;S4:元事件聚合;S5:最终通过S1‑S4形成元事件抽取库、元事件共指库、元事件关联库、元事件专题库,共同构成中文事件库。基于该元事件库形成的一种元事件可视化分析预测的方法,具体步骤包括:S1:元事件库检索;S2:元事件专题分析;S3:元事件预测分析。本发明构建一种适合中文新闻及情报数据处理、分析、预测的中文事件库,不局限于数据统计,实现对事件的语义分析,并通过该中文事件库,可视化元事件脉络,使中文元事件识别更准确,并可预测元事件的下一步发展趋势。
-
公开(公告)号:CN117909559B
公开(公告)日:2024-08-20
申请号:CN202410170696.6
申请日:2024-02-06
Applicant: 拓尔思信息技术股份有限公司
IPC: G06F16/953 , G06F40/211 , G06F40/242 , G06F40/258 , G06F40/295
Abstract: 本发明属于数据挖掘领域,提出了一种基于互联网公开数据的企业关联信息挖掘方法,通过搜索引擎自动搜索目标企业相关信息,获取特征信息,采集目标企业互联网公开数据,使用NLP技术处理采集的互联网公开数据,挖掘企业间关联关系,并分别从面向标题和面向段落的企业实体识别规则进行分阶段的提取,其对面向标题的企业实体识别规则中添加了价值判断,实现了自动且准确的从互联网采集数据中发掘企业关联信息,最大程度的解决了现有企业关联信息获取方法中存在的个人主观因素影响较大、特定站点数据不够全面、验证环节困难等问题。
-
公开(公告)号:CN116630482A
公开(公告)日:2023-08-22
申请号:CN202310919649.2
申请日:2023-07-26
Applicant: 拓尔思信息技术股份有限公司
IPC: G06T11/60 , G06N3/0464 , G06T5/00 , G06T7/13 , G06V10/25 , G06V10/74 , G06V10/764 , G06V10/80 , G06V10/82 , G06F16/532 , G06F16/583
Abstract: 本发明提出了一种基于多模态检索与轮廓引导的图像生成方法,步骤如下所述:S1:图文多模态检索生成原始图像:输入正向提示文本Prompt,对其进行分词和向量化处理,输出符合相似度阈值的图库中图像作为原始图像;S2:文字检测;S3:图像修复,去除图像中生成效果不好的元素;S4:边缘检测;S5:生成引导文本,S6:图像条件生成:设置支持外部输入条件的隐式扩散模型;输入S4生成的轮廓图作为外部条件,利用S5生成的引导文本在扩散模型中有条件的生成最终图像并输出,本发明有较好的通用性,通过检测已有图像的布局结构来引导图像生成,有效提升了图像生成效果。
-
公开(公告)号:CN105302793A
公开(公告)日:2016-02-03
申请号:CN201510696274.3
申请日:2015-10-21
Applicant: 南方电网科学研究院有限责任公司 , 中国南方电网有限责任公司电网技术研究中心 , 北京拓尔思信息技术股份有限公司
Abstract: 本发明提供了一种利用计算机自动评价科技文献新颖性的方法,其包括如下步骤:A、基于文档内容排序的新颖性检测;B、基于文档语义比对的新颖性检测;C、基于关键术语的新颖性检测;D、基于数值指标的新颖性检测;E、基于步骤A-D分别得到各自的新颖性评分,运用回归模型计算出查新文档的新颖性总分。采用本发明的方法,可基于多维度新颖性检测的科技文献自动查新,提高科技查新的效率。
-
-
-
-
-
-