-
公开(公告)号:CN117708332A
公开(公告)日:2024-03-15
申请号:CN202311775887.7
申请日:2023-12-21
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 刘宁
IPC: G06F16/35 , G06F40/211 , G06F40/30 , G06N3/0455 , G06F40/232
Abstract: 本公开实施例提供了文本纠错方法、装置、计算机设备、可读存储介质,涉及自然语言处理技术领域。方法包括:获取输入文本的错误类型;根据所述错误类型确定初步纠错策略;通过所述初步纠错策略获取所述输入文本的初步纠错文本;根据所述初步纠错文本获取文本规范相关知识;根据所述文本规范相关知识和所述初步纠错文本获取最终纠错文本。本公开实施例提供的方法,可以实现文本内容的纠错。
-
公开(公告)号:CN116701638A
公开(公告)日:2023-09-05
申请号:CN202310869861.2
申请日:2023-07-14
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 刘宁
IPC: G06F16/35 , G06F16/332 , G06F40/30 , G06F18/2431 , G06F18/2415 , G06F18/25 , G06N3/047 , G06N3/048 , G06N3/0442 , G06N3/0499 , G06N3/08
Abstract: 本公开提供了一种文本属性词情感分类方法、装置、设备和介质,涉及自然语言处理技术领域。该方法包括:获取文本数据;确定目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,其中,目标句子为文本数据中的任意一个句子,属性词的属性句法距离为句子中与属性词关联的上下文词构成的词对与属性词在句法结构上的距离;将目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,输入至预先训练好的属性词情感分类模型中,输出目标句子中属性词的情感分类结果。本公开增强属性词情感分类模型对文本数据中属性词及其相关信息的感知能力,从而更准确地判别文本数据中属性词的情感类别。
-
公开(公告)号:CN119782528A
公开(公告)日:2025-04-08
申请号:CN202411856010.5
申请日:2024-12-16
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F16/334 , G06F40/284 , G06F40/30 , G06N3/08 , G06N5/022
Abstract: 本公开提供一种文本分析方法、装置和相关产品,涉及自然语言处理技术领域。该方法包括:获取待分析文本以及待分析文本对应的嵌入编码;对待分析文本对应的嵌入编码进行自注意力计算,获得待分析文本中各个单词的自注意力权重;对待分析文本进行抽象语义分析,获得待分析文本的抽象语义表示图谱;将抽象语义表示图谱中的节点关系映射为向量,获得图谱关系嵌入编码;通过图谱关系嵌入编码对待分析文本中各个单词的自注意力权重进行增强,获得增强后自注意力权重;基于增强后自注意力权重和待分析文本中各个单词的嵌入编码,获得待分析文本的增强后文本编码,以便基于增强后文本编码进行文本分析。本公开实施例可以提升任务分析的准确性。
-
公开(公告)号:CN116860975A
公开(公告)日:2023-10-10
申请号:CN202310868511.4
申请日:2023-07-14
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 刘宁
IPC: G06F16/35 , G06F16/33 , G06F16/332 , G06F40/30 , G06N20/00
Abstract: 本公开提供了一种文本属性类别抽取方法、装置、设备及介质,涉及情感分析技术领域。该方法包括:获取待抽取属性类别的文本数据,文本数据中包括多个句子,每个句子包括多个词,每个句子包含的多个词构成每个句子的上下文信息;对于文本数据中的每个句子,筛选出每个句子中满足预设词性的目标词,并计算句子中每个词与目标词之间的感知距离,得到句子中每个词对应的词性感知距离;将文本数据中每个句子包含的多个词以及每个词对应的词性感知距离,输入至预先训练好的属性类别抽取模型中,输出文本数据中每个句子对应的属性类别信息。本公开能够提升属性类别抽取模型的可扩展性和泛化能力。
-
公开(公告)号:CN119226517A
公开(公告)日:2024-12-31
申请号:CN202411365394.0
申请日:2024-09-27
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 刘宁
IPC: G06F16/35 , G06F18/241 , G06F16/33
Abstract: 本公开提供了一种分类方法及装置、存储介质及电子设备,涉及人工智能技术领域。该方法包括:对输入文本进行数据增强并拼接属性词,确定拼接序列;获取所述拼接序列中单词的开始上下文表征和结束上下文表征;根据所述拼接序列中单词的开始上下文表征和结束上下文表征,确定融合情感表格;将所述融合情感表格输入情感预测分类模型,确定所述输入文本中属性词的情感极性分类。能够有效地将获得领域内更多的高质量标注数据以及使不同的情感极性分布更加均匀的数据增强方法融入到属性情感极性预测中,使模型能够学习到更精准和蕴含更多有益信息的情感表征,提升模型的属性级情感表述的捕捉能力和模型的性能表现,实现高效准确的情感极性分类。
-
公开(公告)号:CN117193582A
公开(公告)日:2023-12-08
申请号:CN202311278884.2
申请日:2023-09-28
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F3/0481 , G06F16/332 , G06F16/335 , G06F40/289
Abstract: 本公开实施例是关于一种交互控制方法及系统、电子设备,涉及人工智能技术领域,该方法包括:将交互应用的记忆内容进行存储,所述记忆内容包括交互应用的反馈信息以及属性特征;从记忆内容中进行检索,得到目标任务操作对应的检索结果;基于所述检索结果得到所述目标任务操作对应的任务结果,并根据所述任务结果更新记忆内容;获取待查询信息,基于更新后的记忆内容对所述待查询信息进行检索,并根据检索得到的总体概述摘要确定针对所述待查询信息的响应结果。本公开能够提高交互控制的交互效果。
-
公开(公告)号:CN116805008A
公开(公告)日:2023-09-26
申请号:CN202310862967.X
申请日:2023-07-13
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 刘宁
IPC: G06F16/35 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本公开提供了一种文本分类方法、装置、电子设备以及计算机可读存储介质,涉及自然语言处理技术领域。该方法包括:获取待分类的文本;将待分类的文本输入至训练好的文本类别预测模型,输出文本的文本类别,其中,文本类别包括属性类别和/或领域类别,文本类别预测模型包括格式转换层、向量处理层、目标信息处理层、预测层,目标信息处理层用于处理预定格式的文本中每个词的词向量,得到文本的全局向量,预测层用于根据全局向量以及文本中每个词的词向量,预测文本的属性类别和领域类别。本公开能够在一定程度上克服相关技术中忽略了文档的领域信息,对全局属性信息建模的能力较弱的问题。
-
公开(公告)号:CN117076673A
公开(公告)日:2023-11-17
申请号:CN202311030071.1
申请日:2023-08-15
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 刘宁
IPC: G06F16/35 , G06F16/36 , G06F40/211 , G06F40/284 , G06F40/30 , G06F18/25 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/0464
Abstract: 本公开提供一种语言情感预测方法、装置、存储介质与电子设备,涉及自然语言处理技术领域。该方法包括:获取待处理序列,获取待处理序列中的词的句法依存类型以及词的属性感知距离;进行嵌入处理,得到词的上下文表征信息、句法依存表征信息、属性感知距离表征信息;并得到属性词的初始表征信息;利用注意力机制进行处理,根据处理结果生成邻接矩阵;通过将词的上下文表征信息、句法依存表征信息、属性感知距离表征信息进行聚合,得到词的聚合表征信息;确定属性词的关联词,基于邻接矩阵将关联词的聚合表征信息进行融合,得到属性词的最终表征信息;利用情感预测模型进行处理,得到属性词的情感预测结果。本公开有利于提高情感预测的准确性。
-
公开(公告)号:CN119578427A
公开(公告)日:2025-03-07
申请号:CN202411621516.8
申请日:2024-11-13
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 刘宁
IPC: G06F40/30 , G06F40/211 , G06F16/353 , G06N20/00 , G06F16/334
Abstract: 本公开实施例公开了一种属性级情感分类方法及设备,涉及自然语言处理技术领域。该方法包括:获得文本及文本中属性词的上下文表征,文本中每个词与属性词之间的上下文距离及其上下文距离表征、句法依存距离及其句法依存距离表征以及语义感知距离及其语义感知距离表征;根据文本中每个词与属性词之间的上下文距离、句法依存距离以及语义感知距离,获得多距离感知表征;根据文本及文本中属性词的上下文表征,文本中每个词与属性词之间的上下文距离表征、句法依存距离表征以及语义感知距离表征,获得语义噪声感知表征;根据多距离感知表征和语义噪声感知表征获得属性词的情感极性。
-
公开(公告)号:CN118940752A
公开(公告)日:2024-11-12
申请号:CN202410978599.X
申请日:2024-07-19
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 刘宁
IPC: G06F40/284 , G06F40/295 , G06F40/30 , G06F18/24 , G06N3/045 , G06N3/0442 , G06N3/084
Abstract: 本公开是关于一种情感分类模型的训练、情感分类方法、存储介质、设备,涉及机器学习技术领域,该方法包括:计算文本拼接序列的原始词性序列、原始依存句法序列以及原始句法感知距离序列;将文本拼接序列、原始词性序列、原始依存句法序列以及原始句法感知距离序列输入至待训练的网络模型中,得到原始属性词的第一极性预测结果、第二极性预测结果以及第一极性参考结果;根据第一极性预测结果以及第一极性参考结果,构建第一损失函数,并根据第二极性预测结果以及属性词的实际极性标签,构建第二损失函数;根据第一损失函数以及第二损失函数对待训练的网络模型中的参数进行调整,得到情感分类模型。本公开提高了情感分类模型的准确率。
-
-
-
-
-
-
-
-
-