一种用于新闻稿件标注的事件分割方法及系统

    公开(公告)号:CN115600577B

    公开(公告)日:2023-05-23

    申请号:CN202211294322.2

    申请日:2022-10-21

    发明人: 宋永生 王楠

    摘要: 本发明提供了一种用于新闻稿件标注的事件分割方法及系统,应用于新闻稿件标注技术领域,该方法包括:通过采集获得新闻稿件数据。构建初始分级特征,对新闻稿件数据的识别划分,获得初始层级拆分结果。通过新闻稿件数据的拆分前排布构建层级关联关系。对初始层级拆分结果进行逐层级特征词识别,生成层级特征词标识集合,对初始层级拆分结果进行结构化关联评价,生成结构化关联评价结果。通过层级关联关系、层级特征词标识集合和结构化关联评价结果进行所述初始层级拆分结果的关联度评价。通过关联度评价结果进行事件划分聚合标注。解决了现有技术新闻稿件标注采取人工标注的方式进行,导致标注效率较低且需要耗费大量的时间和人力资源的技术问题。

    一种基于事件分类模型的概念抽象系统及方法

    公开(公告)号:CN116011461A

    公开(公告)日:2023-04-25

    申请号:CN202310264026.6

    申请日:2023-03-02

    发明人: 宋永生 王楠

    摘要: 本发明提供了一种基于事件分类模型的概念抽象系统及方法,涉及计算机语言处理技术领域,将待输入事件信息输入信息缺陷检测模型中获取缺陷检测结果,进行语句分类并对存在缺陷的语句集合进行语句转换,将不存在缺陷的语句集合和转换语句集合输入语义识别模型,以每个语义元为节点搭建事件分类树,将一级叶节点作为事件分类模型的输出结果,解决了现有技术中事件分析方法不够智能化,识别过程不够灵活,使得识别效率低下且最终的解析结果较之需求信息不够精准,信息简洁度不足的技术问题,通过进行语句预处理,对预处理结果进行语义结构化,逐步构建事件分类树确定最终的主体事件,梳理完整的概念体系,在保障信息准确度的基础上进行信息简化。

    一种二元配置远程会议的协同管理方法和装置

    公开(公告)号:CN111542034B

    公开(公告)日:2022-05-13

    申请号:CN202010341156.1

    申请日:2020-04-27

    发明人: 宋永生 王楠

    IPC分类号: H04W4/80 H04W76/10

    摘要: 本发明提供了一种二元配置远程会议的协同管理方法和装置,涉及通信技术领域,通过获得智能音箱向移动终端发送的第一请求信息,智能音箱与移动终端配置有蓝牙双工连接模块;根据第一请求信息获得移动终端的第一应答信息,且移动终端向智能音箱发送的第二请求信息;根据第一应答信息确定智能音箱与移动终端之间建立下行通道;根据第二请求信息获得智能音箱的第二应答信息;根据第二应答信息确定移动终端与智能音箱之间建立上行通道;根据上行通道与下行通道确定第一请求应答闭环,其中第一请求应答闭环控制移动终端的远程会议人员连接与智能音箱的远程会议语音管理,达到了保证智能音箱和手机相互控制、相互服务的灵活性和一致性的技术效果。

    一种从文章标题层次结构提取过程体系的方法和装置

    公开(公告)号:CN111737985B

    公开(公告)日:2021-02-12

    申请号:CN202010727220.X

    申请日:2020-07-27

    发明人: 宋永生 王楠

    IPC分类号: G06F40/258

    摘要: 本发明提供了一种从文章标题层次结构提取过程体系的方法和装置,涉及人工智能技术领域,通过识别第一文章的第一文章格式信息获得第一级别标题以及第一段落;对第一级别标题进行过程识别,确定第一级别标题为第一过程的部分;获得第一级别标题的上层标题的第一过程名称与第一级别标题所在的下层标题,并获得在下层标题中描述第一过程的第二级别标题以及第二段落;根据时间识别第一段落与第二段落,获得第一级别标题与第二级别标题在第一过程中的第一步骤序列;获得多篇第二文章的第一过程中的第二步骤序列;根据第一过程名称集合第一步骤序列与第二步骤序列获得第一过程体系与第一过程体系的步骤序列,实现过程体系的完整性和一致性的技术效果。

    一种从文章标题层次结构提取过程体系的方法和装置

    公开(公告)号:CN111737985A

    公开(公告)日:2020-10-02

    申请号:CN202010727220.X

    申请日:2020-07-27

    发明人: 宋永生 王楠

    IPC分类号: G06F40/258

    摘要: 本发明提供了一种从文章标题层次结构提取过程体系的方法和装置,涉及人工智能技术领域,通过识别第一文章的第一文章格式信息获得第一级别标题以及第一段落;对第一级别标题进行过程识别,确定第一级别标题为第一过程的部分;获得第一级别标题的上层标题的第一过程名称与第一级别标题所在的下层标题,并获得在下层标题中描述第一过程的第二级别标题以及第二段落;根据时间识别第一段落与第二段落,获得第一级别标题与第二级别标题在第一过程中的第一步骤序列;获得多篇第二文章的第一过程中的第二步骤序列;根据第一过程名称集合第一步骤序列与第二步骤序列获得第一过程体系与第一过程体系的步骤序列,实现过程体系的完整性和一致性的技术效果。

    一种基于神经网络的复杂PDF结构解析方法及装置

    公开(公告)号:CN110598191B

    公开(公告)日:2020-04-07

    申请号:CN201911124192.6

    申请日:2019-11-18

    发明人: 宋永生 汤铭 王楠

    摘要: 本说明书实施例提供了一种基于神经网络的复杂PDF结构解析方法及装置,通过获得PDF文档的特征信息;根据最大熵模型对所述PDF文档的特征信息进行粗颗粒划分,获得所述PDF文档的分层段落;根据大规模语料集中训练的两层双向语言模型转化所述PDF文档的分层段落获得段落词向量,压缩所述段落词向量获得段落语义向量;将所述段落语义向量输入多层双向长短时记忆网络,获得所述PDF文档的所有段落的层级序列。解决了由于PDF文档结构不单一,存在泛化能力较差的技术问题,达到了避免人工设计规则逻辑的局限性,能够高水平的解析复杂PDF文档结构,泛化性强的技术效果。

    一种基于方面词的主语义分析方法及系统

    公开(公告)号:CN115841120A

    公开(公告)日:2023-03-24

    申请号:CN202310170278.2

    申请日:2023-02-27

    摘要: 本发明公开了一种基于方面词的主语义分析方法及系统,涉及人工智能领域,所述方法包括:通过获得预设文本的基本特征信息,并确定目标主题;采集目标主题的文本信息并组成目标文本集;分析构建方面词集;遍历得到预设文本的预设方面词集;对预设方面词集进行聚类得到预设方面词类别集;提取预设方面词类别集中任意一个预设方面词类别,并统计任意一个预设方面词类别的出现总次数;对出现总次数降序处理,得到预设方面词类别列表;根据预设方面词类别列表得到主语义分析结果。解决了现有技术在对文本主语义进行分析时忽略方面词含义分析,文本分析速度慢、语义结果不准确,甚至偏离文本主语义的问题。达到了提高文本主语义分析准确率的效果。

    一种高保真文本主语义提取系统及方法

    公开(公告)号:CN115422949A

    公开(公告)日:2022-12-02

    申请号:CN202211372952.7

    申请日:2022-11-04

    发明人: 宋永生 王楠

    摘要: 本发明提供了一种高保真文本主语义提取系统及方法,涉及数据处理技术领域,通过匹配文本类型生成类型约束参数,匹配文本作者写作特征生成用户特征语义约束参数,对文本进行多层级分割生成文本的多层级分割结果,通过类型约束参数和用户特征语义约束参数对多层级分割结果进行文本分割聚合选择,基于文本类型匹配识别数据库进行文本分割聚合选择结果的语义识别,基于语义识别结果生成语义提取结果。解决现有技术中存在智能识别文本语义准确度较低,无法获得较为准确的文章主语义的缺陷,导致文本语义识别的人工依赖度和识别成本较高的技术问题。达到提高智能识别文本语义准确度,降低文本语义识别对于人工经验的需求,降低识别成本的技术效果。

    一种基于语义分析的事件层次网络识别系统及方法

    公开(公告)号:CN115422948A

    公开(公告)日:2022-12-02

    申请号:CN202211372951.2

    申请日:2022-11-04

    发明人: 宋永生 王楠

    摘要: 本申请公开了一种基于语义分析的事件层次网络识别系统及方法,包括:为待分析的目标文本指定主题描述;对指定的主题描述进行分词处理,并基于预设概念库查找出各分词的关联语义概念,完成事件识别;利用扩展主题描述对目标文本进行初次过滤,以在过滤后获得候选文本段;确定所提取的文段特征向量与扩展主题向量的相关度,以进行二次过滤,获得目标事件的相关文本;从相关文本中提取多个子事件,并确定与目标事件之间的关联关系,从而提取事件和事件之间的关系;基于所确定的关联关系构建目标事件的事件层次网络。本申请实施例的事件层次网络识方法能够自动构建事件层次网络图谱,解决人工标注成本高、效率低的问题。

    一种二元配置远程会议的协同管理方法和装置

    公开(公告)号:CN111542034A

    公开(公告)日:2020-08-14

    申请号:CN202010341156.1

    申请日:2020-04-27

    发明人: 宋永生 王楠

    IPC分类号: H04W4/80 H04W76/10

    摘要: 本发明提供了一种二元配置远程会议的协同管理方法和装置,涉及通信技术领域,通过获得智能音箱向移动终端发送的第一请求信息,智能音箱与移动终端配置有蓝牙双工连接模块;根据第一请求信息获得移动终端的第一应答信息,且移动终端向智能音箱发送的第二请求信息;根据第一应答信息确定智能音箱与移动终端之间建立下行通道;根据第二请求信息获得智能音箱的第二应答信息;根据第二应答信息确定移动终端与智能音箱之间建立上行通道;根据上行通道与下行通道确定第一请求应答闭环,其中第一请求应答闭环控制移动终端的远程会议人员连接与智能音箱的远程会议语音管理,达到了保证智能音箱和手机相互控制、相互服务的灵活性和一致性的技术效果。