-
公开(公告)号:CN115204166A
公开(公告)日:2022-10-18
申请号:CN202210311657.4
申请日:2022-03-28
Applicant: 新华通讯社
IPC: G06F40/289 , G06F40/216
Abstract: 本申请公开了一种文本校对方法、装置、设备、介质及程序产品。该方法包括:对目标文本进行断句分词处理,获得至少一个目标单句、以及与该目标单句对应的初始分词序列;针对目标文本对应的每一个初始分词序列,至少根据两种预设词表校正规则进行校正处理,获得与每一初始分词序列对应的多个候选校正序列;至少根据两种概率模型,计算与各候选校正序列对应的置信值,根据置信值对候选校正序列进行筛选;根据置信值对多个筛选得到的候选校正序列进行融合处理,获得与初始分词序列对应的最优校正序列;根据目标单句在目标文本中的位置,组合各最优校正序列,获得校正文本。根据本申请实施例,本申请对文本进行校对的准确率高。
-
公开(公告)号:CN114490960A
公开(公告)日:2022-05-13
申请号:CN202111343122.7
申请日:2021-11-12
Applicant: 新华通讯社 , 媒体融合生产技术与系统国家重点实验室 , 中国经济信息社有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/9532 , G06F40/289
Abstract: 本申请公开了一种首发新闻稿的确定方法、装置、电子设备和存储介质。该首发新闻稿的确定方法包括:获取新闻事件的第一新闻要素信息;根据第一新闻要素信息进行新闻稿搜索,得到第一新闻稿候选集,获取第一新闻稿候选集中的各候选新闻稿的第二新闻要素信息;基于第一新闻要素信息和所述第二新闻要素信息,确定特征向量;将特征向量输入预先训练好的分类器中,得到与新闻事件相匹配的第二新闻稿候选集;基于第二新闻稿候选集中的各候选新闻稿的发布时间,确定与新闻事件对应的首发新闻稿。采用本申请提供的首发新闻稿的确定方法,可以实现高效、精确的确定报道某一事件的首发新闻稿的效果。
-