-
公开(公告)号:CN112559756A
公开(公告)日:2021-03-26
申请号:CN202010922395.6
申请日:2020-09-04
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F16/36 , G06F16/9532
Abstract: 一种地震事件知识图谱构建方法、应用方法,包括以下步骤:构建地震事件知识图谱的schema;构建历史地震事件信息库;识别并筛选地震事件新闻,抽取地震信息;将历史地震事件新闻信息库和抽取的地震信息进行知识融合;对融合后的地震知识进行知识加工;根据S200‑S500的步骤定时更新地震事件知识图谱。采用上述方法构建一个具有全面历史数据、同时具有实时更新能力的地震事件知识图谱。
-
公开(公告)号:CN113033201A
公开(公告)日:2021-06-25
申请号:CN202011231567.1
申请日:2020-11-06
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F40/295 , G06F40/289 , G06F40/134 , G06F40/211
Abstract: 本发明提供一种地震新闻信息抽取方法及其系统,方法包括:将实体库中的第一实体链接到新闻文本上,对链接有第一实体的新闻文本识别得到第二实体,并对识别后的新闻文本进行分句,以得到包括新闻原句的第二处理文本;对第二处理文本识别和分词后得到第二数字类社会属性新闻数组,转化得到第二数字类社会属性新闻数组中的阿拉伯数字,将元素、阿拉伯数字和新闻原句输出;根据第二处理文本的时间要素对新闻原句设置时刻信息,对新闻原句识别得到新闻原句中的第三实体和关系动词列表,根据优先级顺序获取关系动词列表中的关系动词,并将第三实体、关系动词、时刻信息和新闻原句输出。本发明的有益效果:实现了基于时间线形成全面的新闻事件脉络。
-
公开(公告)号:CN112307761A
公开(公告)日:2021-02-02
申请号:CN202011301062.8
申请日:2020-11-19
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F40/289 , G06F40/216 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于注意力机制的事件抽取方法及系统,其中抽取方法包括以下步骤:获取待处理文本及其事件类型,提取所述待处理文本中各字的向量,获得文本向量数据,提取所述事件类型中各字的向量,生成事件类型向量数据;将所述文本向量数据和所述事件类型向量数据输入预先构建的抽取词预测模型,获得所述待处理文本中每个字所对应的标签所形成的标签序列;基于所述标签序列对所述待处理文本进行事件抽取,获得相应的事件触发词和事件论元。本发明中通过引入事件类型,结合事件类型对应的特征数据对事件触发词和事件论元进行联合抽取,有效提升事件抽取的准召率。
-
公开(公告)号:CN112199599A
公开(公告)日:2021-01-08
申请号:CN202011171680.5
申请日:2020-10-28
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F16/9535 , G06F16/9536 , G06F16/35 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明公开了一种媒体画像生成方法和系统,所述方法包括如下步骤:监测目标媒体账号,获取目标媒体的推送数据;根据推送数据可选择地获取目标媒体的公共画像数据;可选择地建立至少一个目标媒体偏好画像分析模型,根据推送数据分析获取目标媒体偏好画像数据;根据公共画像数据、偏好画像数据建立可视化的媒体画像;本发明采用人工智能技术,根据媒体属性建立多个分析模型,根据分析模型生成媒体画像,通过大数据和人工智能可以给每个媒体提供多样化的标签,从而可以自动地在细分属性中体现媒体的画像内容,提高画像内容的解析深度,提高媒体画像的准确性和多样性。
-
公开(公告)号:CN115578512A
公开(公告)日:2023-01-06
申请号:CN202211204447.1
申请日:2022-09-29
Applicant: 北京开普云信息科技有限公司 , 开普云信息科技股份有限公司 , 新华通讯社新媒体中心 , 新华融合媒体科技发展(北京)有限公司
Abstract: 本申请公开一种语音播报视频的生成模型训练和使用方法、装置及设备,属于图像处理技术领域。所述方法包括:提取多个训练视频中的人脸图像和音频,训练视频为单人播报音频;利用生成模型中预先训练好的R‑Net网络对人脸图像提取出三维人脸重建系数和光照渲染系数,根据三维人脸重建系数和光照渲染系数生成二维人脸图像;利用生成模型中的卷积网络对人脸图像和音频进行特征提取,得到特征向量;对二维人脸图像和特征向量进行合成,得到合成视频帧;利用预先训练好的判别网络对合成视频帧和音频生成损失;根据损失训练生成模型。本申请利用R‑Net网络生成高清的二维人脸图像,提高合成的语音播报视频中的人脸图像的画面质量。
-
公开(公告)号:CN112101022A
公开(公告)日:2020-12-18
申请号:CN202010923698.X
申请日:2020-09-04
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F40/289 , G06F40/295 , G06F16/31 , G06Q10/06 , G06Q50/26
Abstract: 一种地震事件实体链接方法,包括:实时爬取地震局地震目录数据,将获取的地震数据以事件实体的形式存入实体库;提取地震新闻,抽取地震新闻中地震基本信息,并按照其在地震新闻中出现的顺序排列成地震信息数组;对地震信息数组先基于震源深度信息进行信息分组,并对各分组信息基于预设的地震新闻报道的顺序结构和地震信息逻辑判别方法将地震基本信息数组分成若干地震信息数组;基于实体库内注册的地震信息和地震识别方法对地震信息数组进行地震识别,并将识别出的地震与该地震新闻进行链接。本发明披露了如何提取地震新闻中的地震基本信息,并根据提取的地震基本信息进行地震识别,完成与实体库内对应的地震事件实体进行链接的方法。
-
公开(公告)号:CN112101022B
公开(公告)日:2024-02-20
申请号:CN202010923698.X
申请日:2020-09-04
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F40/289 , G06F40/295 , G06F16/31 , G06Q10/063 , G06Q50/26
Abstract: 一种地震事件实体链接方法,包括:实时爬取地震局地震目录数据,将获取的地震数据以事件实体的形式存入实体库;提取地震新闻,抽取地震新闻中地震基本信息,并按照其在地震新闻中出现的顺序排列成地震信息数组;对地震信息数组先基于震源深度信息进行信息分组,并对各分组信息基于预设的地震新闻报道的顺序结构和地震信息逻辑判别方法将地震基本信息数组分成若干地震信息数组;基于实体库内注册的地震信息和地震识别方法对地震信息数组进行地震识别,并将识别出的地震与该地震新闻进行链接。本发明披露了如何提取地震新闻中的地震基本信息,并根据提取的地震基本信息进行地震识别,完成与实体库内对应的地震事件实体进行链接的方法。
-
公开(公告)号:CN113033201B
公开(公告)日:2023-07-28
申请号:CN202011231567.1
申请日:2020-11-06
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F40/295 , G06F40/289 , G06F40/134 , G06F40/211
Abstract: 本发明提供一种地震新闻信息抽取方法及其系统,方法包括:将实体库中的第一实体链接到新闻文本上,对链接有第一实体的新闻文本识别得到第二实体,并对识别后的新闻文本进行分句,以得到包括新闻原句的第二处理文本;对第二处理文本识别和分词后得到第二数字类社会属性新闻数组,转化得到第二数字类社会属性新闻数组中的阿拉伯数字,将元素、阿拉伯数字和新闻原句输出;根据第二处理文本的时间要素对新闻原句设置时刻信息,对新闻原句识别得到新闻原句中的第三实体和关系动词列表,根据优先级顺序获取关系动词列表中的关系动词,并将第三实体、关系动词、时刻信息和新闻原句输出。本发明的有益效果:实现了基于时间线形成全面的新闻事件脉络。
-
-
-
-
-
-
-