Patent search ap:("哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)") AND inv:"喻曦" Page 1

1.

发明公开
一种基于依存图解析的一体化中文信息抽取方法及装置有权

公开(公告)号：CN118551021A

公开(公告)日：2024-08-27

申请号：CN202411009247.X

申请日：2024-07-26

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 张梅山 , 李欣欣 , 喻曦

IPC: G06F16/332 , G06F16/35 , G06F18/241 , G06F18/214 , G06F40/284

Abstract: 本发明涉及自然语言处理技术领域，特别是指一种基于依存图解析的一体化中文信息抽取方法及装置。方法包括：构建待处理文本的依存图；构建模型框架并训练模型框架，获得中文信息抽取模型；通过中文信息抽取模型获取待处理文本中文字之间的关系，获得待处理文本中字与字之间预测边的概率；提取字与字之间预测边的概率超过0.5的数据，输入至解码器中进行解码，并从相应的预测标签的分布中取到该字与字之间的标签，获得待处理文本的依存图，完成基于依存图解析的一体化中文信息抽取。本发明脱离特定的任务独立的运行并且有很好的性能，同时由于使用字粒度的方式进行建图来表示关系，能够对不同的数据集都采用一致的处理方式，得到统一的模型输入。

2.

发明授权
一种基于依存图解析的一体化中文信息抽取方法及装置有权

公开(公告)号：CN118551021B

公开(公告)日：2024-11-08

申请号：CN202411009247.X

申请日：2024-07-26

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 张梅山 , 李欣欣 , 喻曦

IPC: G06F16/332 , G06F16/35 , G06F18/241 , G06F18/214 , G06F40/284

Abstract: 本发明涉及自然语言处理技术领域，特别是指一种基于依存图解析的一体化中文信息抽取方法及装置。方法包括：构建待处理文本的依存图；构建模型框架并训练模型框架，获得中文信息抽取模型；通过中文信息抽取模型获取待处理文本中文字之间的关系，获得待处理文本中字与字之间预测边的概率；提取字与字之间预测边的概率超过0.5的数据，输入至解码器中进行解码，并从相应的预测标签的分布中取到该字与字之间的标签，获得待处理文本的依存图，完成基于依存图解析的一体化中文信息抽取。本发明脱离特定的任务独立的运行并且有很好的性能，同时由于使用字粒度的方式进行建图来表示关系，能够对不同的数据集都采用一致的处理方式，得到统一的模型输入。

3.

发明公开
一种基于语音端到端的依存结构分析方法及装置审中-实审

公开(公告)号：CN119296528A

公开(公告)日：2025-01-10

申请号：CN202411344318.1

申请日：2024-09-25

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 张梅山 , 李欣欣 , 喻曦 , 张民

IPC: G10L15/18 , G10L15/26 , G10L15/06

Abstract: 本发明涉及自然语言处理技术领域，特别是指一种基于语音端到端的依存结构分析方法及装置。方法包括：对语音数据进基于语音特征提取器获取特征向量，将特征向量输入到语音解码器中得到语音嵌入向量表示；基于适配器将语音嵌入向量表示映射到文本空间；将映射后的数据通过双仿射解码器输出语音的依存结构分析结果；将转录文本进行标签对齐获得转录文本的对齐标签；通过对齐标签端到端的训练语音依存结构分析模型。本发明直接从语音入手，实现对语音特征的利用，使用对齐工具映射金标文本的标签信息到转录文本上，充分利用依存结构分析的数据训练语音依存结构分析模型。

Patent Agency Ranking