一种基于句用分析的文本主题提取系统及方法

    公开(公告)号:CN115983251A

    公开(公告)日:2023-04-18

    申请号:CN202310120443.3

    申请日:2023-02-16

    摘要: 本发明提供了一种基于句用分析的文本主题提取系统及方法,涉及自然语言处理技术领域,通过对待处理文本进行预处理并按照划分特征对预处理文本进行划分,获取划分结果内出现频率达到预设次数的词语作为高频词语集合;获取样本文本内出现频率达到预设次数的词语作为样本高频词语集合,将高频词语集合和样本高频词语集合中重复词语删除获得文本主题词语集合,将文本主题词语集合输入文本主题分析模型输出预处理文本的文本主题。解决现有技术存在文本标注作业的准确度和效率较低的技术问题。达到提高文本主题确定的准确性,从而辅助标注作业人员参考进行文本标注,提高文本标注效率和标注有效性的技术效果。

    一种基于语义工程和案例学习的计算机认知方法及系统

    公开(公告)号:CN114281940B

    公开(公告)日:2023-04-18

    申请号:CN202111511900.9

    申请日:2021-12-07

    发明人: 王楠 宋永生

    摘要: 本申请公开了一种基于语义工程和案例学习的计算机认知方法及系统,所述方法包括:通过根据网络爬虫技术对人类大规模文本案例进行收集,获得第一标准案例;根据基于全局的NLP技术,构建语义识别推理模型;根据所述语义识别推理模型,获得第一因果关系;根据所述语义识别推理模型,解析所述第一标准案例中的计算机认知空间框架要素,获得第一框架要素;构建第一计算机认知空间;根据所述第一因果关系和第一计算机认知空间,对第一标准案例进行语义的识别推理,获得第一计算机语义集;根据所述第一计算机认知空间和所述第一计算机语义集,构建第一计算机认知系统。解决了现有技术中存在计算机认知系统对人类语义理解不够准确的技术问题。

    一种基于图神经网络提取文章的过程体系的方法和装置

    公开(公告)号:CN111598239A

    公开(公告)日:2020-08-28

    申请号:CN202010727219.7

    申请日:2020-07-27

    发明人: 宋永生 王楠

    IPC分类号: G06N3/08 G06N3/04 G06F16/34

    摘要: 本发明提供了一种基于图神经网络提取文章的过程体系的方法和装置,涉及人工智能技术领域,通过对第一文章的格式信息进行分析,识别出第一文章不同级别标题的层次结构;判断各个标题是否为描述第一过程的行为词,当第一级别标题为描述第一过程的行为词时,建立第一级别标题所在的下层标题中第一级别标题与第二级别标题的时间向量,以及建立第一级别标题的上层标题到下层标题的所属向量,进而以时间向量、所属向量建立第一标题网络图,并对大量第二文章的第二标题网络图进行图神经网络的无监督学习,获得第一过程体系与第一过程体系的步骤序列,达到图神经网络对文章标题层次结构迭代学习的结果准确性的最大化的技术效果。

    一种基于语义分析的档案自动开放鉴定方法及系统

    公开(公告)号:CN112989018A

    公开(公告)日:2021-06-18

    申请号:CN202110542853.8

    申请日:2021-05-19

    摘要: 本发明公开了一种基于语义分析的档案自动开放鉴定方法及系统,其中,所述方法包括:获得批量集待鉴定档案信息;将批量集待鉴定档案信息转换为批量集纯文本档案信息;将批量集纯文本档案信息输入格式语义库,获得第一训练结果和第二训练结果;将第二批次纯文本档案信息输入关键词库,获得第三训练结果和第四训练结果;将第四批次纯文本档案信息输入语义知识库,获得第五训练结果和第六训练结果;将第六批次纯文本档案信息发送至人工审核端进行内容语义审核,生成第一审核结果;获得可开放档案信息。解决了现有技术中的基于单一的光学字符识别技术对档案进行开放鉴定,使得鉴定结果存在误判率高、准确率低的缺陷的技术问题。

    一种二元配置远程会议的协同管理方法和装置

    公开(公告)号:CN111542034A

    公开(公告)日:2020-08-14

    申请号:CN202010341156.1

    申请日:2020-04-27

    发明人: 宋永生 王楠

    IPC分类号: H04W4/80 H04W76/10

    摘要: 本发明提供了一种二元配置远程会议的协同管理方法和装置,涉及通信技术领域,通过获得智能音箱向移动终端发送的第一请求信息,智能音箱与移动终端配置有蓝牙双工连接模块;根据第一请求信息获得移动终端的第一应答信息,且移动终端向智能音箱发送的第二请求信息;根据第一应答信息确定智能音箱与移动终端之间建立下行通道;根据第二请求信息获得智能音箱的第二应答信息;根据第二应答信息确定移动终端与智能音箱之间建立上行通道;根据上行通道与下行通道确定第一请求应答闭环,其中第一请求应答闭环控制移动终端的远程会议人员连接与智能音箱的远程会议语音管理,达到了保证智能音箱和手机相互控制、相互服务的灵活性和一致性的技术效果。

    一种表格数据提取方法及装置

    公开(公告)号:CN111259873A

    公开(公告)日:2020-06-09

    申请号:CN202010336373.1

    申请日:2020-04-26

    发明人: 宋永生 王楠 徐杰

    IPC分类号: G06K9/00

    摘要: 本发明公开了一种表格数据提取方法及装置,所述方法包括:获得第一图像信息,所述第一图像信息为文档背景图像信息;将所述第一图像信息输入训练模型,获得所述训练模型的输出信息,其中,所述输出信息包括第二图像信息,所述第二图像信息为包含表格特征的背景图像信息;根据所述第二图像信息,获得所述第二图像信息中单元格信息;按行列两个方向对所述第二图像信息中单元格信息进行分组;根据所述第二图像信息,获得所述第二图像信息中的文字信息和文字坐标;将所述文字信息、所述文字坐标于所述单元格信息建立关联,获得结构化表格信息。达到提高表格数据提取准确度的技术效果。

    一种基于句用分析的文本主题提取系统及方法

    公开(公告)号:CN115983251B

    公开(公告)日:2023-06-09

    申请号:CN202310120443.3

    申请日:2023-02-16

    摘要: 本发明提供了一种基于句用分析的文本主题提取系统及方法,涉及自然语言处理技术领域,通过对待处理文本进行预处理并按照划分特征对预处理文本进行划分,获取划分结果内出现频率达到预设次数的词语作为高频词语集合;获取样本文本内出现频率达到预设次数的词语作为样本高频词语集合,将高频词语集合和样本高频词语集合中重复词语删除获得文本主题词语集合,将文本主题词语集合输入文本主题分析模型输出预处理文本的文本主题。解决现有技术存在文本标注作业的准确度和效率较低的技术问题。达到提高文本主题确定的准确性,从而辅助标注作业人员参考进行文本标注,提高文本标注效率和标注有效性的技术效果。