-
公开(公告)号:CN109992645A
公开(公告)日:2019-07-09
申请号:CN201910250572.8
申请日:2019-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 拓尔思信息技术股份有限公司
Abstract: 本发明公开了一种基于文本数据的资料管理系统及方法,属于信息管理系统领域。资料管理系统包括数据上传模块,数据存储模块,数据解析模块,数据检索模块,数据可视化模块,工具箱和管理台。所述方法首先将本地文件利用数据上传模块上传至数据存储模块,然后数据解析模块对上传文件进行解析处理,得到上传文件的属性并进行存储。将解析后的资料内容及附件分别存储在数据存储模块中的全文索引搜索引擎数据库和关系型数据库中。最后采用相似性判断技术,利用数据检索模块对存储到数据库中的资料进行检索;利用数据可视化模块对所有资料内容按分类进行展示、文档操作功能和各种可视化展示。本发明提高了工作效率,提升了对战略研究素材的管理能力。
-
公开(公告)号:CN109992645B
公开(公告)日:2021-05-14
申请号:CN201910250572.8
申请日:2019-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 拓尔思信息技术股份有限公司
Abstract: 本发明公开了一种基于文本数据的资料管理系统及方法,属于信息管理系统领域。资料管理系统包括数据上传模块,数据存储模块,数据解析模块,数据检索模块,数据可视化模块,工具箱和管理台。所述方法首先将本地文件利用数据上传模块上传至数据存储模块,然后数据解析模块对上传文件进行解析处理,得到上传文件的属性并进行存储。将解析后的资料内容及附件分别存储在数据存储模块中的全文索引搜索引擎数据库和关系型数据库中。最后采用相似性判断技术,利用数据检索模块对存储到数据库中的资料进行检索;利用数据可视化模块对所有资料内容按分类进行展示、文档操作功能和各种可视化展示。本发明提高了工作效率,提升了对战略研究素材的管理能力。
-
公开(公告)号:CN114332108B
公开(公告)日:2024-06-04
申请号:CN202111499410.1
申请日:2021-12-09
Applicant: 拓尔思信息技术股份有限公司
IPC: G06T7/11 , G06T7/187 , G06V10/762
Abstract: 本发明涉及计算机技术领域,涉及图像处理,具体涉及一种图片中的虚实线局部区域的提取方法。具体包括:将图片原始图进行尺寸规格化;二值化得到第二处理图;通过像素点的宽度来判断是否是线条图;利用候选虚线判断准则判断图像的某一区域是否是候选虚线;进行虚线确认与搭接得到第三处理图;最后利用虚线确认准则,通过包围率算法,提取实际子图。本发明可以准确并快速完成虚实线结合图的子图的提取,尤其是局部外观设计图的局部区域的提取,并基于提取后的子图进行下一步的应用。
-
公开(公告)号:CN110321432B
公开(公告)日:2021-11-23
申请号:CN201910548427.8
申请日:2019-06-24
Applicant: 拓尔思信息技术股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F40/295 , G06N3/04
Abstract: 本发明属于信息处理技术领域,为了解决现有技术中事件信息提取的技术方案存在准确率不高的技术问题,本发明提供一种本发明第一方面提供一种文本事件信息提取方法,该方法包括:对文本进行分词划分,并将分词做向量转换后得到词向量,以及将词向量输入至神经网路模型,输出实体;基于文本格式特征定义的信息类型,按照文法定义的对应模式规则,将文本块中的分词和实体按照文法定义的对应模式规则,整理成结构化后的文本块;对结构化后的文本块进行事件信息提取处理,使用文法定义的对应模式规则实现关键字抽取,并把关键字输出到结果模板中。因此,利用神经网络深度学习与规则相结合的方式,配置事件提取模型,实现文本事件信息的准确提取。
-
公开(公告)号:CN116630482B
公开(公告)日:2023-11-03
申请号:CN202310919649.2
申请日:2023-07-26
Applicant: 拓尔思信息技术股份有限公司
IPC: G06T11/60 , G06N3/0464 , G06T5/00 , G06T7/13 , G06V10/25 , G06V10/74 , G06V10/764 , G06V10/80 , G06V10/82 , G06F16/532 , G06F16/583
Abstract: 本发明提出了一种基于多模态检索与轮廓引导的图像生成方法,步骤如下所述:S1:图文多模态检索生成原始图像:输入正向提示文本Prompt,对其进行分词和向量化处理,输出符合相似度阈值的图库中图像作为原始图像;S2:文字检测;S3:图像修复,去除图像中生成效果不好的元素;S4:边缘检测;S5:生成引导文本,S6:图像条件生成:设置支持外部输入条件的隐式扩散模型;输入S4生成的轮廓图作为外部条件,利用S5生成的引导文本在扩散模型中有条件的生成最终图像并输出,本发明有较好的通用性,通过检测已有图像的布局结构来引导图像生成,有效提升了图像生成效果。
-
公开(公告)号:CN110321432A
公开(公告)日:2019-10-11
申请号:CN201910548427.8
申请日:2019-06-24
Applicant: 拓尔思信息技术股份有限公司
Abstract: 本发明属于信息处理技术领域,为了解决现有技术中事件信息提取的技术方案存在准确率不高的技术问题,本发明提供一种本发明第一方面提供一种文本事件信息提取方法,该方法包括:对文本进行分词划分,并将分词做向量转换后得到词向量,以及将词向量输入至神经网路模型,输出实体;基于文本格式特征定义的信息类型,按照文法定义的对应模式规则,将文本块中的分词和实体按照文法定义的对应模式规则,整理成结构化后的文本块;对结构化后的文本块进行事件信息提取处理,使用文法定义的对应模式规则实现关键字抽取,并把关键字输出到结果模板中。因此,利用神经网络深度学习与规则相结合的方式,配置事件提取模型,实现文本事件信息的准确提取。
-
公开(公告)号:CN110309126A
公开(公告)日:2019-10-08
申请号:CN201910591554.6
申请日:2019-07-02
Applicant: 拓尔思信息技术股份有限公司
Abstract: 为了解决通过时间戳方式进行关系数据增量迁移过程中,存在数据丢失的技术问题,本发明提供一种关系数据库增量迁移处理方法、关系数据库中数据保存方法、电子装置和非易失性存储介质;所述关系数据库增量迁移处理方法中,基于时间偏移量Tx,调整关系数据库增量迁移处理中上次执行的时间戳为T’n-1=Tn-1-Tx,并将所述数据库迁移时间戳字段范围Tr设置为[T’n-1,Tn],对所述关系数据库中需要完成增量迁移操作、且时间戳在Tr范围内的每个迁移数据执行迁移操作。因此,即使关系数据库对应服务器的时间与数据迁移对应服务器的时间不一致,也不影响数据的准确性。
-
公开(公告)号:CN105389344A
公开(公告)日:2016-03-09
申请号:CN201510696381.6
申请日:2015-10-21
Applicant: 南方电网科学研究院有限责任公司 , 中国南方电网有限责任公司电网技术研究中心 , 北京拓尔思信息技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明公开了一种自助式查新方法及系统,该方法包括:根据用户输入的查新内容,对查新内容进行语义分析,提取出查新关键词,并通过关联检索生成相应的关联关键词;根据查新关键词和所述关联关键词,基于逻辑关系生成查新检索式;根据查新检索式检索各个资源数据库,获得检索结果;对检索结果进行多维度评价,并根据评价结果生成相应的查新报告;其中,多维度评价包括:基于检索内容相关度评价、基于查新点的相关度评价、基于关键词的相关度评价、基于技术指标的相关度评价。采用本发明实施例,能够提高科技查新的效率。
-
公开(公告)号:CN118296134B
公开(公告)日:2024-08-09
申请号:CN202410718893.7
申请日:2024-06-05
Applicant: 拓尔思信息技术股份有限公司
IPC: G06F16/332 , G06F40/295 , G06F40/211 , G06Q40/12
Abstract: 本发明涉及海关数据处理技术领域,提出了一种基于提示学习的海关税收风险知识抽取方法,建立海关风险知识抽取的数据源:输入通用预训练命名实体识别模型抽取企业实体名称,并利用依存句法优化实体命名结果,得到候选名称;将候选名称放入提示学习语言模型进行验证,输出概率最高的企业实体名称;再进行风险评价提取:基于预训练语言模型的提示学习来对报道正负面做文本分类预测;最后将提取出企业实体名称、风险评价信息进行特征融合,并录入海关报关单数据库。提高实体命名识别的准确性,并解决了对海关风险信息领域的样本信息少,抽取任务准确率低的问题。
-
公开(公告)号:CN117909559A
公开(公告)日:2024-04-19
申请号:CN202410170696.6
申请日:2024-02-06
Applicant: 拓尔思信息技术股份有限公司
IPC: G06F16/953 , G06F40/211 , G06F40/242 , G06F40/258 , G06F40/295
Abstract: 本发明属于数据挖掘领域,提出了一种基于互联网公开数据的企业关联信息挖掘方法,通过搜索引擎自动搜索目标企业相关信息,获取特征信息,采集目标企业互联网公开数据,使用NLP技术处理采集的互联网公开数据,挖掘企业间关联关系,并分别从面向标题和面向段落的企业实体识别规则进行分阶段的提取,其对面向标题的企业实体识别规则中添加了价值判断,实现了自动且准确的从互联网采集数据中发掘企业关联信息,最大程度的解决了现有企业关联信息获取方法中存在的个人主观因素影响较大、特定站点数据不够全面、验证环节困难等问题。
-
-
-
-
-
-
-
-
-