一种基于事理图谱和大模型的推演方法及系统

    公开(公告)号:CN119721257A

    公开(公告)日:2025-03-28

    申请号:CN202510206413.3

    申请日:2025-02-25

    Abstract: 本发明属于人工智能领域,提出一种基于事理图谱和大模型的推演方法及系统,通过构建包含现实事件和虚拟事件的事件库,并基于这些事件库建立事理图谱,能够扩展数据集的范围,使其不受实际数据的限制,这样不仅丰富了数据的多样性,还为推荐系统提供了创新的可能性,使得推荐结果更加丰富和多元;使用事理图谱构造用于大模型训练的指令数据集,能够更好地描述事件之间的复杂关系和动态过程,从而在构建指令数据集能够提供更加准确和深入的知识支持;通过指令调优即指令数据集中的指令约束大模型的输出,提高了对大模型的输出的可控性和可预测性;大模型具备了强大的推演能力,突破了事理图谱库的规模限制,推演结果可能具有一定的创新性。

    一种基于提示学习的海关税收风险知识抽取方法

    公开(公告)号:CN118296134A

    公开(公告)日:2024-07-05

    申请号:CN202410718893.7

    申请日:2024-06-05

    Abstract: 本发明涉及海关数据处理技术领域,提出了一种基于提示学习的海关税收风险知识抽取方法,建立海关风险知识抽取的数据源:输入通用预训练命名实体识别模型抽取企业实体名称,并利用依存句法优化实体命名结果,得到候选名称;将候选名称放入提示学习语言模型进行验证,输出概率最高的企业实体名称;再进行风险评价提取:基于预训练语言模型的提示学习来对报道正负面做文本分类预测;最后将提取出企业实体名称、风险评价信息进行特征融合,并录入海关报关单数据库。提高实体命名识别的准确性,并解决了对海关风险信息领域的样本信息少,抽取任务准确率低的问题。

    段句位的倒排索引结构设计及其限定运算全文检索的方法

    公开(公告)号:CN116578666B

    公开(公告)日:2023-09-22

    申请号:CN202310847909.X

    申请日:2023-07-12

    Abstract: 本发明提出了一种段句位的倒排索引结构设计及其限定运算全文检索的方法,具体的,设计了一种支持段句位的倒排索引结构包括:词典和与所述词典中的词对应的倒排索引列表;所述倒排索引列表包括:待索引文件ID为DocID、词频TF、位置POS、句子SEN、段落SEG。同时,本发明提出了一种段句位限定运算全文检索的方法,在倒排索引列表中存储索引词的位置(POS)、句子(SEN)、段落(SEG)等信息,通过对关键词的位置关系进行设定,在所述倒排索引列表中对位置属性校验,实现文档过滤,返回给用户满足段句位要求的文档。实现用户对段、句、字距离等高级查询需求,同时对查询语句进行相关度评分,使全文检索过程更加完善。

    构建中文事件库及基于该元事件库对元事件分析预测的方法及系统

    公开(公告)号:CN116383331A

    公开(公告)日:2023-07-04

    申请号:CN202310001827.3

    申请日:2023-01-03

    Abstract: 本发明提出了一种构建中文事件库及基于该元事件库对元事件分析预测的方法及系统。构建中文事件库的方法具体步骤包括:S1:元事件抽取;S2:元事件共指;S3:元事件关联;S4:元事件聚合;S5:最终通过S1‑S4形成元事件抽取库、元事件共指库、元事件关联库、元事件专题库,共同构成中文事件库。基于该元事件库形成的一种元事件可视化分析预测的方法,具体步骤包括:S1:元事件库检索;S2:元事件专题分析;S3:元事件预测分析。本发明构建一种适合中文新闻及情报数据处理、分析、预测的中文事件库,不局限于数据统计,实现对事件的语义分析,并通过该中文事件库,可视化元事件脉络,使中文元事件识别更准确,并可预测元事件的下一步发展趋势。

    标题生成方法和装置
    65.
    发明授权

    公开(公告)号:CN107203509B

    公开(公告)日:2023-06-20

    申请号:CN201710262158.X

    申请日:2017-04-20

    Inventor: 王洪俊 肖诗斌

    Abstract: 本发明的实施例提供了一种标题生成方法和装置。所述标题生成方法包括:获取第一新闻集合中各新闻文档的原始标题并拼接成标题文本串,其中,所述第一新闻集合包括关于同一新闻事件的至少一个新闻文档;从所述标题文本串中提取高频词串,并对提取的所述高频词串进行过滤;将经过过滤的所述高频词串中出现频次最高的词串确定为所述第一新闻集合的标题。采用本发明实施例的技术方案,可以自动为新闻文档生成了一个高质量的短标题,保证了标题的语义效果和精炼性,而且降低了短标题生成的计算难度,并具有较高的适应性。

    图像处理方法、装置、电子设备和存储介质

    公开(公告)号:CN109741394B

    公开(公告)日:2021-02-26

    申请号:CN201811506464.4

    申请日:2018-12-10

    Abstract: 本公开实施例提供一种图像处理方法、装置、电子设备和存储介质。图像处理方法包括:获取含有非空白图像区域的待处理图像;对所述待处理图像执行二值化处理,获得二值化图像;自所述二值化图像的一个顶点像素点开始,分别沿相互垂直的两个图像边界遍历所述二值化图像,获取与所述非空白图像区域的轮廓相切的多条边切线,所述边切线上包含至少一个黑色像素点且其一侧仅包含白色像素点;根据获取的多条边切线,获取至少一个外接矩形;将多个外接矩形当中面积最小的外接矩形选取为所述非空白图像区域的最小外接矩形区域。能够相对容易地计算得到图像的最小外接矩形,并且降低最小外接矩形的计算复杂度。

    用于航迹检索的航迹特征建模方法及系统、电子装置

    公开(公告)号:CN112214537A

    公开(公告)日:2021-01-12

    申请号:CN202010975489.X

    申请日:2020-09-16

    Inventor: 程涛 廖培红

    Abstract: 本发明属于飞行器轨迹建模的技术领域,为了解决现有技术中航迹检索存在精度不够、处理速度达不到实时要求中至少一个技术问题,本发明提供一种用于航迹检索的航迹特征建模方法及系统、电子装置、非易失性存储介质,通过建立多级地球位置字典,利用多级地球位置字典,设计航迹特征;再利用多级地球位置字典,快速查找相似航迹;由于地球位置编码采用多级算法,可以通过逐步细化的方法,初步筛查找到符合条件的航迹集合,然后再逐步使用细化的区域词典,最后精准定位最相似航迹;大大提高了航迹的检索效率。

    一种文本数据的聚类方法、装置和系统

    公开(公告)号:CN107273412B

    公开(公告)日:2019-09-27

    申请号:CN201710307520.0

    申请日:2017-05-04

    Abstract: 本发明的实施例提供了一种文本数据的聚类方法、装置和系统。其中,所述方法包括:子节点接收主节点针对海量文本数据进行拆分得到的待聚类的文本子集合;所述子节点将所述文本子集合中的每个文本分别与所有子节点的文本子集合中的每个文本进行文本相似度的比对,得到文本对的相似关系集合;所述子节点将所述相似关系集合发送至所述主节点,以使得所述主节点根据所有子节点发送的所述相似关系集合对所述海量文本数据进行聚类,得到所述海量文本数据的聚类结果。本发明通过引入spark分布式框架,对海量文本数据进行分布式聚类,从而获得对海量文本数据进行聚类的能力。

    一种音视频在线虚拟剪辑方法和系统

    公开(公告)号:CN105592356B

    公开(公告)日:2018-07-17

    申请号:CN201410563990.X

    申请日:2014-10-22

    Inventor: 肖诗斌 刘珅

    Abstract: 本发明提供一种精准的音视频在线虚拟剪辑方法,其包括:步骤S10,音视频对象获取;步骤S20,音视频对象转码;步骤S30,用户在线剪辑;步骤S40,音视频对象准确定位;步骤S50,剪辑关联。将剪辑工具嵌入浏览器,采用流媒体增强型定位技术,精准定位到帧,剪辑信息与父视频进行关联,以实现虚拟剪辑。此外,本发明还提供一种精准的音视频在线虚拟剪辑系统,包括:播放器、在线剪辑工具,流媒体服务器、音视频数据处理服务器,数据库三大模块,实现音视频的精准、高效的在线编辑和播放,同时避免音视频的重复存储,提高存储空间有效利用率。

    一种文本数据的聚类方法、装置和系统

    公开(公告)号:CN107273412A

    公开(公告)日:2017-10-20

    申请号:CN201710307520.0

    申请日:2017-05-04

    Abstract: 本发明的实施例提供了一种文本数据的聚类方法、装置和系统。其中,所述方法包括:子节点接收主节点针对海量文本数据进行拆分得到的待聚类的文本子集合;所述子节点将所述文本子集合中的每个文本分别与所有子节点的文本子集合中的每个文本进行文本相似度的比对,得到文本对的相似关系集合;所述子节点将所述相似关系集合发送至所述主节点,以使得所述主节点根据所有子节点发送的所述相似关系集合对所述海量文本数据进行聚类,得到所述海量文本数据的聚类结果。本发明通过引入spark分布式框架,对海量文本数据进行分布式聚类,从而获得对海量文本数据进行聚类的能力。

Patent Agency Ranking