一种基于跨媒体统一表征模型的跨媒体检索方法

    公开(公告)号:CN110866129A

    公开(公告)日:2020-03-06

    申请号:CN201911061277.4

    申请日:2019-11-01

    Abstract: 本发明针对跨媒体检索问题,提出了一种基于跨媒体统一表征模型的跨媒体检索方法,包括以下步骤:(1)跨媒体数据库构建,建立面向政务新闻领域大跨媒体数据库;(2)跨媒体数据预处理,文本、图像、视频和音频等数据的输入预处理;(3)跨媒体数据原域特征提取,跨媒体数据的原域特征向量提取;(4)跨媒体数据统一表征,跨媒体数据在共同表示空间的特征向量提取;(5)数据检索语义相似度计算与排序,检索目标数据与跨媒体数据库中数据语义相似度计算,并排序输出结果。本发明不仅提出了一种支持四种媒体数据的相互检索方法,同时提出多种媒体数据的统一表征模型,提高了跨媒体语义检索精度,具有关阔的应用前景。

    一种基于BERT的政务公文本体概念抽取方法

    公开(公告)号:CN110569405A

    公开(公告)日:2019-12-13

    申请号:CN201910790828.4

    申请日:2019-08-26

    Abstract: 本发明提供了一种基于BERT的政务公文本体概念抽取方法,包括以下步骤:(1)获取政务公文数据;(2)对公开的政务公文数据进行文本数据预处理;(3)建立术语的语言学规则;(4)进行公文本体术语提取;(5)估计公文本体术语的类别数目;(6)针对公文本体术语,进行词向量表示;(7)完成术语的聚类;(8)抽取公文本体概念;(9)实现本体概念抽取效果的评估与验证。本发明统筹政务工作的有效技术手段,为政务公务的共享交换、信息检索、信息抽取、政务图谱构建等应用提供强有力的支撑与保障,并提高了公文术语的聚类效果,为公文本体概念抽取的精度提供坚实的保障和支持。

Patent Agency Ranking