稿件摘要生成方法和装置、设备及存储介质

    公开(公告)号:CN114661892A

    公开(公告)日:2022-06-24

    申请号:CN202210298879.7

    申请日:2022-03-25

    Abstract: 本公开涉及一种稿件摘要生成方法,包括:对当前获取的query进行分词处理,得到query中的关键词。基于关键词,由数据库中提取出包含有关键词中的实体词的稿件作为命中稿件。对于各命中稿件,将包含有关键词的语句按照段落分布提取出来作为待合并语句,并确定各待合并语句的段落关系。步骤将有段落关系的待合并语句进行合并重构得到段落语句,将没有段落关系的待合并语句单独作为一个段落语句。将各段落语句按照顺序合并,构建得到稿件摘要。本公开适用于根据用户所提供的query对数据库中的新闻稿件进行检索并对检索出的稿件根据关键词和段落关系形成稿件摘要。使所形成的摘要可以更加贴合文章的中心意思,且可读性较强字数可控。

    数据入库方法、装置、设备以及存储介质

    公开(公告)号:CN115587091A

    公开(公告)日:2023-01-10

    申请号:CN202211097576.5

    申请日:2022-09-08

    Abstract: 本公开提供了一种数据入库方法、装置、设备以及存储介质,方法包括:响应于用户的查询操作,从数据库中获取每日数据量分布数据,将每日数据量分布数据存储的第一内存中;从第一内存的每日数据量分布数据中读取每个单日数据,对每个单日数据进行数据量判定,将每个超出数据量阈值的单日数据分段成预设数量的数据片段后存储到第二内存中,以及将每个未超出数据量阈值的单日数据作为一个数据片段后存储到第二内存中;读取第二内存中的单日数据,为每个单日数据创建线程对象,将线程对象提交到线程池的线程队列中;启动线程队列中的线程对象的任务,将线程对象对应的数据传递至搜索服务器。上述方法通过增加线程可以提高将数据录入到索引库的速度。

    一种稿件内容安全审核方法、装置、电子设备及介质

    公开(公告)号:CN117056455A

    公开(公告)日:2023-11-14

    申请号:CN202310811702.7

    申请日:2023-07-04

    Abstract: 本发明涉及一种稿件内容安全审核方法、装置、电子设备及介质,属于数据审核技术领域,包括:S1,多个部门分类获取待检测数据并进行处理,生成文本检测数据;S2,调用安全审核接口,基于本地敏感词数据库对所述文本检测数据进行安全审核,得到敏感词数据结果,所述敏感词数据结果存储着安全审核得到的敏感词;S3,对所述敏感词数据结果匹配本地白名单表,得到第一敏感词数据和第二敏感词数据;S4,将所述第一敏感词数据添加到本地白名单表中,所述第二敏感词数据添加到本地黑名单表中。本发明解决现有技术中存在的没有对审核内容进行细致的分类,在内容审核过程中,存在识别误判情况的技术问题。

Patent Agency Ranking