-
公开(公告)号:CN114661892A
公开(公告)日:2022-06-24
申请号:CN202210298879.7
申请日:2022-03-25
Applicant: 中国经济信息社有限公司
IPC: G06F16/34 , G06F40/295 , G06F40/166
Abstract: 本公开涉及一种稿件摘要生成方法,包括:对当前获取的query进行分词处理,得到query中的关键词。基于关键词,由数据库中提取出包含有关键词中的实体词的稿件作为命中稿件。对于各命中稿件,将包含有关键词的语句按照段落分布提取出来作为待合并语句,并确定各待合并语句的段落关系。步骤将有段落关系的待合并语句进行合并重构得到段落语句,将没有段落关系的待合并语句单独作为一个段落语句。将各段落语句按照顺序合并,构建得到稿件摘要。本公开适用于根据用户所提供的query对数据库中的新闻稿件进行检索并对检索出的稿件根据关键词和段落关系形成稿件摘要。使所形成的摘要可以更加贴合文章的中心意思,且可读性较强字数可控。
-
公开(公告)号:CN114638233A
公开(公告)日:2022-06-17
申请号:CN202210289993.3
申请日:2022-03-22
Applicant: 中国经济信息社有限公司
IPC: G06F40/30 , G06F40/258 , G06F40/194 , G06F40/279 , G06F16/33
Abstract: 本公开提出了一种新闻稿件首发认定方法、装置和设备,该方法包括:获取待分析新闻稿件,提取出待分析新闻稿件的标题;根据标题,由新闻稿件集中进行相似稿件的筛选;在由新闻稿件集中筛选出相似稿件时,分别提取待分析新闻稿件中的实体词以及相似稿件中的实体词;对待分析新闻稿件中的实体词与相似稿件中的实体词进行匹配,并根据匹配结果确认相似稿件与待分析新闻稿件是否为同一事件的稿件;在相似稿件与待分析新闻稿件为同一事件的稿件时,由与待分析新闻稿件为同一事件的稿件中确定出首发稿件,这样,便可以提高新闻稿件首发认定结果的准确性。
-
公开(公告)号:CN118535978A
公开(公告)日:2024-08-23
申请号:CN202410535593.5
申请日:2024-04-30
Applicant: 中国经济信息社有限公司
IPC: G06F18/2411 , G06F18/213 , G06F18/22 , G06F40/30
Abstract: 本发明提供一种基于多模态大模型的新闻分析方法及系统,涉及新闻分析技术领域,方法包括:对采集到的多模态数据进行预处理;通过多模态大模型将预处理后多模态数据转换成文本数据并进行特征提取,得到多个新闻的多个语义特征向量;分别计算多个新闻的多个语义特征向量相似度值,得到多个新闻的多个相似特征向量;分别对多个新闻的多个相似特征向量进行权重计算,得到多个新闻的最优相似新闻;分别根据多个新闻的最优相似新闻生成对应的新闻关系网络,分别对多个新闻关系网络进行分析,得到多个新闻主题。本发明通过生成的新闻主题和新闻关系网络将有相似信息的新闻关联起来,得到了新闻的传播路径,实现快速且准确地对新闻进行溯源。
-
公开(公告)号:CN117056455A
公开(公告)日:2023-11-14
申请号:CN202310811702.7
申请日:2023-07-04
Applicant: 中国经济信息社有限公司
IPC: G06F16/33 , G06F40/289 , G06Q10/10
Abstract: 本发明涉及一种稿件内容安全审核方法、装置、电子设备及介质,属于数据审核技术领域,包括:S1,多个部门分类获取待检测数据并进行处理,生成文本检测数据;S2,调用安全审核接口,基于本地敏感词数据库对所述文本检测数据进行安全审核,得到敏感词数据结果,所述敏感词数据结果存储着安全审核得到的敏感词;S3,对所述敏感词数据结果匹配本地白名单表,得到第一敏感词数据和第二敏感词数据;S4,将所述第一敏感词数据添加到本地白名单表中,所述第二敏感词数据添加到本地黑名单表中。本发明解决现有技术中存在的没有对审核内容进行细致的分类,在内容审核过程中,存在识别误判情况的技术问题。
-
-
-