新闻稿件首发认定方法、装置和设备

    公开(公告)号:CN114638233A

    公开(公告)日:2022-06-17

    申请号:CN202210289993.3

    申请日:2022-03-22

    Abstract: 本公开提出了一种新闻稿件首发认定方法、装置和设备,该方法包括:获取待分析新闻稿件,提取出待分析新闻稿件的标题;根据标题,由新闻稿件集中进行相似稿件的筛选;在由新闻稿件集中筛选出相似稿件时,分别提取待分析新闻稿件中的实体词以及相似稿件中的实体词;对待分析新闻稿件中的实体词与相似稿件中的实体词进行匹配,并根据匹配结果确认相似稿件与待分析新闻稿件是否为同一事件的稿件;在相似稿件与待分析新闻稿件为同一事件的稿件时,由与待分析新闻稿件为同一事件的稿件中确定出首发稿件,这样,便可以提高新闻稿件首发认定结果的准确性。

    文本校对方法、装置、设备、介质及程序产品

    公开(公告)号:CN115204166A

    公开(公告)日:2022-10-18

    申请号:CN202210311657.4

    申请日:2022-03-28

    Abstract: 本申请公开了一种文本校对方法、装置、设备、介质及程序产品。该方法包括:对目标文本进行断句分词处理,获得至少一个目标单句、以及与该目标单句对应的初始分词序列;针对目标文本对应的每一个初始分词序列,至少根据两种预设词表校正规则进行校正处理,获得与每一初始分词序列对应的多个候选校正序列;至少根据两种概率模型,计算与各候选校正序列对应的置信值,根据置信值对候选校正序列进行筛选;根据置信值对多个筛选得到的候选校正序列进行融合处理,获得与初始分词序列对应的最优校正序列;根据目标单句在目标文本中的位置,组合各最优校正序列,获得校正文本。根据本申请实施例,本申请对文本进行校对的准确率高。

Patent Agency Ranking