一种地震新闻信息抽取方法及其系统

    公开(公告)号:CN113033201A

    公开(公告)日:2021-06-25

    申请号:CN202011231567.1

    申请日:2020-11-06

    Abstract: 本发明提供一种地震新闻信息抽取方法及其系统,方法包括:将实体库中的第一实体链接到新闻文本上,对链接有第一实体的新闻文本识别得到第二实体,并对识别后的新闻文本进行分句,以得到包括新闻原句的第二处理文本;对第二处理文本识别和分词后得到第二数字类社会属性新闻数组,转化得到第二数字类社会属性新闻数组中的阿拉伯数字,将元素、阿拉伯数字和新闻原句输出;根据第二处理文本的时间要素对新闻原句设置时刻信息,对新闻原句识别得到新闻原句中的第三实体和关系动词列表,根据优先级顺序获取关系动词列表中的关系动词,并将第三实体、关系动词、时刻信息和新闻原句输出。本发明的有益效果:实现了基于时间线形成全面的新闻事件脉络。

    基于注意力机制的事件抽取方法及系统

    公开(公告)号:CN112307761A

    公开(公告)日:2021-02-02

    申请号:CN202011301062.8

    申请日:2020-11-19

    Abstract: 本发明公开一种基于注意力机制的事件抽取方法及系统,其中抽取方法包括以下步骤:获取待处理文本及其事件类型,提取所述待处理文本中各字的向量,获得文本向量数据,提取所述事件类型中各字的向量,生成事件类型向量数据;将所述文本向量数据和所述事件类型向量数据输入预先构建的抽取词预测模型,获得所述待处理文本中每个字所对应的标签所形成的标签序列;基于所述标签序列对所述待处理文本进行事件抽取,获得相应的事件触发词和事件论元。本发明中通过引入事件类型,结合事件类型对应的特征数据对事件触发词和事件论元进行联合抽取,有效提升事件抽取的准召率。

    一种媒体画像生成方法和系统

    公开(公告)号:CN112199599A

    公开(公告)日:2021-01-08

    申请号:CN202011171680.5

    申请日:2020-10-28

    Abstract: 本发明公开了一种媒体画像生成方法和系统,所述方法包括如下步骤:监测目标媒体账号,获取目标媒体的推送数据;根据推送数据可选择地获取目标媒体的公共画像数据;可选择地建立至少一个目标媒体偏好画像分析模型,根据推送数据分析获取目标媒体偏好画像数据;根据公共画像数据、偏好画像数据建立可视化的媒体画像;本发明采用人工智能技术,根据媒体属性建立多个分析模型,根据分析模型生成媒体画像,通过大数据和人工智能可以给每个媒体提供多样化的标签,从而可以自动地在细分属性中体现媒体的画像内容,提高画像内容的解析深度,提高媒体画像的准确性和多样性。

    一种地震事件实体链接方法

    公开(公告)号:CN112101022A

    公开(公告)日:2020-12-18

    申请号:CN202010923698.X

    申请日:2020-09-04

    Abstract: 一种地震事件实体链接方法,包括:实时爬取地震局地震目录数据,将获取的地震数据以事件实体的形式存入实体库;提取地震新闻,抽取地震新闻中地震基本信息,并按照其在地震新闻中出现的顺序排列成地震信息数组;对地震信息数组先基于震源深度信息进行信息分组,并对各分组信息基于预设的地震新闻报道的顺序结构和地震信息逻辑判别方法将地震基本信息数组分成若干地震信息数组;基于实体库内注册的地震信息和地震识别方法对地震信息数组进行地震识别,并将识别出的地震与该地震新闻进行链接。本发明披露了如何提取地震新闻中的地震基本信息,并根据提取的地震基本信息进行地震识别,完成与实体库内对应的地震事件实体进行链接的方法。

    一种地震事件实体链接方法

    公开(公告)号:CN112101022B

    公开(公告)日:2024-02-20

    申请号:CN202010923698.X

    申请日:2020-09-04

    Abstract: 一种地震事件实体链接方法,包括:实时爬取地震局地震目录数据,将获取的地震数据以事件实体的形式存入实体库;提取地震新闻,抽取地震新闻中地震基本信息,并按照其在地震新闻中出现的顺序排列成地震信息数组;对地震信息数组先基于震源深度信息进行信息分组,并对各分组信息基于预设的地震新闻报道的顺序结构和地震信息逻辑判别方法将地震基本信息数组分成若干地震信息数组;基于实体库内注册的地震信息和地震识别方法对地震信息数组进行地震识别,并将识别出的地震与该地震新闻进行链接。本发明披露了如何提取地震新闻中的地震基本信息,并根据提取的地震基本信息进行地震识别,完成与实体库内对应的地震事件实体进行链接的方法。

    一种地震新闻信息抽取方法及其系统

    公开(公告)号:CN113033201B

    公开(公告)日:2023-07-28

    申请号:CN202011231567.1

    申请日:2020-11-06

    Abstract: 本发明提供一种地震新闻信息抽取方法及其系统,方法包括:将实体库中的第一实体链接到新闻文本上,对链接有第一实体的新闻文本识别得到第二实体,并对识别后的新闻文本进行分句,以得到包括新闻原句的第二处理文本;对第二处理文本识别和分词后得到第二数字类社会属性新闻数组,转化得到第二数字类社会属性新闻数组中的阿拉伯数字,将元素、阿拉伯数字和新闻原句输出;根据第二处理文本的时间要素对新闻原句设置时刻信息,对新闻原句识别得到新闻原句中的第三实体和关系动词列表,根据优先级顺序获取关系动词列表中的关系动词,并将第三实体、关系动词、时刻信息和新闻原句输出。本发明的有益效果:实现了基于时间线形成全面的新闻事件脉络。

Patent Agency Ranking