一种基于边界检测的中文命名实体识别方法

    公开(公告)号:CN114818713A

    公开(公告)日:2022-07-29

    申请号:CN202210532724.5

    申请日:2022-05-11

    IPC分类号: G06F40/295 G06F16/35 G06N3/04

    摘要: 本发明公开了一种基于边界检测的中文命名实体识别方法,可以广泛应用于信息处理领域中。包括以下步骤:S1对目标文本进行处理和多粒度表示;S2利用以多粒度嵌入向量为输入的双向门控循环网络BiGRU获得字粒度的上下文相关信息;S3根据每个字的上下文相关信息,神经网络判断每个字是否为实体的边界位置;S4将每个实体边界位置组装成候选实体,并共享S2中的上下文信息表示候选实体;S5利用实体分类器对候选实体进行细粒度处理,识别实体类型,完成命名实体识别。本发明检测出实体的边界位置后,根据边界位置组装候选实体,再对候选实体进行分类命名,完成命名实体识别,在保证了中文命名实体识别准确率的同时,提高中文命名实体识别的召回率。

    一种基于知识增强图神经网络的中文专利文本去冗余方法

    公开(公告)号:CN116681068A

    公开(公告)日:2023-09-01

    申请号:CN202310644149.2

    申请日:2023-05-31

    摘要: 本发明公开了一种基于知识增强图神经网络的中文专利文本去冗余方法,属于自然语言处理领域的文本处理技术,包括以下步骤:步骤1:专利数据获取,根据权利要求书的文本结构进行分割处理;步骤2:基于知识图谱嵌入与实体关系抽取方法,获取实体结点信息与边信息,将每一条权利要求文本转化为对应的图结构;步骤3:基于图卷积神经网络,通过更新结点信息的方式,逐条获取权利要求书的文本特征向量;步骤4:基于语义相似度的文本过滤方法,通过设置阈值,降低专利文本冗余。本发明采用引入知识图谱的方法,提高专利文本中实体语义的准确度,并将权利要求书文本转化为图结构,使用图卷积网络获取文本表征,最后通过文本相似度来降低文本冗余,为专利机构进行专利数据管理提供技术支持。

    一种智能盲杖控制系统
    3.
    发明公开

    公开(公告)号:CN115054494A

    公开(公告)日:2022-09-16

    申请号:CN202210646750.0

    申请日:2022-06-08

    摘要: 本发明公开了一种智能盲杖控制系统。该系统主要由主控芯片、定位导航模块、避障模块、情感交流模块、人机交互模块、语音模块、电源电路等部分组成。在工作时,盲杖用户可选择不同人机交互方式;在盲杖握柄内加入膜片式压力传感器用于检测用户情绪,当握力长时间超出正常范围即用户处于较低情绪时,唤醒人工客服对其进行疏导(人工客服是相互合作且处于空闲状态的专业心理疏导医生),预防用户出现潜在的心理疾病,用户与人工客服通过无线通信技术进行通信。定位导航模块可以获得用户的位置信息,可进行路线导航,无线通信技术实现盲杖用户与监护者之间长距离的无线通信,将位置信息发送给监护者;避障模块采用鱼眼摄像头对障碍物进行探测,利用模糊避障算法进行避障路线规划并通过蓝牙耳机语音传输给用户。

    一种多模态融合的视频弹幕筛选方法

    公开(公告)号:CN116681069A

    公开(公告)日:2023-09-01

    申请号:CN202310644172.1

    申请日:2023-05-31

    摘要: 本发明提供了一种多模态融合的视频弹幕筛选方法,涉及自然语言处理领域中的文本分类技术。S1数据处理:获取网络上的视频与视频标签,进行文本预处理与视频关键帧采样;S2过滤垃圾弹幕:过滤新视频中的垃圾弹幕,并划分至“垃圾类”弹幕列表;S3获取多主题文本:构建视频主题检索模型,以获取新视频的多个主题文本;S4弹幕文本的多主题分类:通过弹幕文本‑主题文本语义匹配,找出与视频主题相似的弹幕并划分至“主题相关类”弹幕列表;S5弹幕分类可视化:将剩余弹幕划分至“普通类”弹幕列表,并将“主题相关类”、“普通类”、“垃圾类”三类弹幕列表返回给用户。利用本发明的方案能够解决不同类别弹幕的筛选,有助于维护用户的视频观看体验与心理健康,增强用户对弹幕可视化的控制,营造和谐网络环境,具有一定的实际应用价值和现实意义。

    一种基于边界检测的中文命名实体识别方法

    公开(公告)号:CN114818713B

    公开(公告)日:2024-09-06

    申请号:CN202210532724.5

    申请日:2022-05-11

    摘要: 本发明公开了一种基于边界检测的中文命名实体识别方法,可以广泛应用于信息处理领域中。包括以下步骤:S1对目标文本进行处理和多粒度表示;S2利用以多粒度嵌入向量为输入的双向门控循环网络BiGRU获得字粒度的上下文相关信息;S3根据每个字的上下文相关信息,神经网络判断每个字是否为实体的边界位置;S4将每个实体边界位置组装成候选实体,并共享S2中的上下文信息表示候选实体;S5利用实体分类器对候选实体进行细粒度处理,识别实体类型,完成命名实体识别。本发明检测出实体的边界位置后,根据边界位置组装候选实体,再对候选实体进行分类命名,完成命名实体识别,在保证了中文命名实体识别准确率的同时,提高中文命名实体识别的召回率。

    一种判别法律文书公正性的方面级情感分析方法

    公开(公告)号:CN116663551A

    公开(公告)日:2023-08-29

    申请号:CN202310633613.8

    申请日:2023-05-31

    摘要: 本发明公开了一种判别法律文书公正性的方面级情感分析方法,属于自然语言处理领域中的情感分析技术,包括以下步骤:步骤1:对数据进行预处理,主要包括对数据进行采集和分词;步骤2:采用TF‑IDF方法获取法律文书中具有代表性的语言特征词,并进行加权处理;步骤3:采用Word2Vec将分词结果和法律文书中具有代表性的语言特征词转化为向量表示并进行拼接;步骤4:通过Bi‑LSTM‑CRF模型和注意力机制获取方面实体与方面信息的相关特征,进行方面级情感分析。本发明有效地将全局特征和局部特征进行融合,提出一种新的方面级情感分析方法并证明其有效性,并结合Bi‑LSTM‑CRF模型和注意力机制,深入挖掘语义特征,为保障司法程序的公正性提供技术支持。