-
公开(公告)号:CN116362243A
公开(公告)日:2023-06-30
申请号:CN202310443963.8
申请日:2023-04-23
Applicant: 重庆邮电大学
IPC: G06F40/289 , G06F40/268 , G06F16/31 , G06F16/335 , G06F40/30 , G06F16/35 , G06F18/22 , G06F40/216
Abstract: 本发明属于自然语言处理领域,具体涉及一种融入句子间关联关系的文本关键短语提取方法、存储介质及装置,包括:采用词性组合方式提取名词性短语;结合两个Trie树对名词性短语进行过滤,得到候选短语集;计算候选短语的全局语义相似度得分;对各个句子进行聚类,得到包含不同语义信息的句子簇;根据候选短语的全局语义相似度得分,对句子簇中的候选短语排序得到关键短语集;本发明在基于嵌入的无监督关键短语提取模型中融入句子间关系,提高了模型的准确率,同时构建不同的Trie树来计算互信息与左右信息熵的方式来作为关键短语提取模型中的候选短语提取方法,降低了提取到的候选短语集中的出现语义信息不完整的短语出现的概率。
-
公开(公告)号:CN115906868A
公开(公告)日:2023-04-04
申请号:CN202211531365.8
申请日:2022-12-01
Applicant: 重庆邮电大学
IPC: G06F40/30 , G06F40/289 , G06F18/214 , G06F18/25 , G06N3/04 , G06N3/0442 , G06N3/0499
Abstract: 本发明属于自然语言处理领域,设特别涉及一种基于义原知识与抽象语义表征用于复述识别的方法及系统,包括:对语句进行分词处理并进行词汇级向量表征和义原知识知识表征;将义原知识表征结果采用均值处理,并使用全局语义信息对均值处理结果进行交互注意力特征信息提取得到全局义原表征;从句子结构上对待识别复述语句进行抽象语义解析得到单根有向无环图,并进行全局义原表征与词汇级向量表征;按照无环图有向的顺序提取全局和局部特征信息,并对该信息进行距离特征度量;将距离特征度量结果输入到神经网络中,得到识别结果;本发明引入外部义原知识来进行语义表征,通过全局语义信息辅助义原知识表征的准确性,并解析中文复述语句的抽象语义获取其语义关系,从而提高复述识别的准确性。
-
公开(公告)号:CN112434514B
公开(公告)日:2022-06-21
申请号:CN202011333910.3
申请日:2020-11-25
Applicant: 重庆邮电大学
IPC: G06F40/211 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明属于自然语言处理领域,设特别涉及一种基于多粒度多通道的神经网络的语义匹配方法、装置及计算机设备,所述方法包括使用预训练语言模型将输入的两个待检测句子划分为词语级和字符级的句子表示,并进行预处理;使用双向长短时记忆网络提取句子表示矩阵的上下文知识,并使用余弦距离处理双向长短时记忆网络提取的特征;使用一种基于交互的自注意力机制提取句子表示矩阵及其交互矩阵中的重点特征;将获取的两种不同的匹配向量进行拼接,由前馈神经网络得到高级特征向量并计算分类结果;本发明使用双向长短时记忆网络提取全局特征,使用自注意力机制侧重局部特征,使得模型学习到的权重更加全面,更加精准。
-
公开(公告)号:CN112434514A
公开(公告)日:2021-03-02
申请号:CN202011333910.3
申请日:2020-11-25
Applicant: 重庆邮电大学
IPC: G06F40/211 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明属于自然语言处理领域,设特别涉及一种基于多粒度多通道的神经网络的语义匹配方法、装置及计算机设备,所述方法包括使用预训练语言模型将输入的两个待检测句子划分为词语级和字符级的句子表示,并进行预处理;使用双向长短时记忆网络提取句子表示矩阵的上下文知识,并使用余弦距离处理双向长短时记忆网络提取的特征;使用一种基于交互的自注意力机制提取句子表示矩阵及其交互矩阵中的重点特征;将获取的两种不同的匹配向量进行拼接,由前馈神经网络得到高级特征向量并计算分类结果;本发明使用双向长短时记忆网络提取全局特征,使用自注意力机制侧重局部特征,使得模型学习到的权重更加全面,更加精准。
-
-
-