-
公开(公告)号:CN119577106A
公开(公告)日:2025-03-07
申请号:CN202311066015.3
申请日:2023-08-22
Applicant: 杭州阿里云飞天信息技术有限公司 , 华南理工大学
IPC: G06F16/334 , G06F16/35 , G06F40/211 , G06F40/253 , G06F40/295 , G06F40/30 , G06N3/045 , G06N3/084
Abstract: 本申请提供一种文本信息抽取、命名实体识别、关系抽取的方法及设备。本申请的方法,基于大模型或小规模的信息抽取模型,通过对待处理的文本信息进行分析,获得文本信息的语法语义信息(如句法结构信息、语义关联信息),将文本信息的语法语义信息注入信息抽取模型,使得信息抽取模型较好地学习到语言语义知识,将语法语义信息融入文本信息的文本表征,获得文本信息的增强表征,并根据增强表征进行信息抽取得到信息抽取结果,可以有效减少甚至避免关键信息的缺失,提升信息抽取的精准度。
-
公开(公告)号:CN117173779A
公开(公告)日:2023-12-05
申请号:CN202310990801.6
申请日:2023-08-07
Applicant: 华南理工大学
IPC: G06V40/20 , G06V20/40 , G06V10/44 , G06N3/0455 , G10L15/25
Abstract: 本发明公开了一种基于视频词边界的句子级别唇语识别方法、系统、装置及介质,属于机器视觉与自然语言处理领域。其中方法包括以下步骤:获取视频数据,根据视频数据获取视觉特征序列;其中,视觉特征序列的长度与视频数据的长度一致;将视觉特征序列输入利用视频词边界的句子级别唇语识别模型,输出视频中每一帧对应各个字符的预测概率,实现句子级别唇语的识别。本发明通过在句子级别唇语识别模型中引入视频词边界信息,提高模型对视频中各个词汇对应视频持续时间的掌握程度,从而使模型预测句子的词数更准确,进而提高模型识别出的句子长度的准确性。
-
公开(公告)号:CN116842947A
公开(公告)日:2023-10-03
申请号:CN202310428161.X
申请日:2023-04-19
Applicant: 华南理工大学
IPC: G06F40/295 , G06F40/205 , G06F40/18 , G06F40/186
Abstract: 本发明提出了一种统一的中文信息抽取方法,包括以下步骤:S1、针对三大任务设计了一套prompt模板将三大任务进行统一表征,达到仅使用一个模型就可以完成中文信息抽取三大任务的效果;S2、使用MacBert预训练语言模型获取对应的prompt文本表征;S3、使用K‑GlobalPointer模型获取文本对应的表格表示;S4、解析表格得到相应的信息。本发明通过设计一套prompt模板,将命名实体识别任务、关系抽取任务、事件抽取任务均视为命名实体识别任务,达到仅使用一个模型完成这三大任务的效果。使模型能学习到各个任务之间相互的特征,提升各个方面的性能,还能减少模型参数、降低部署成本。
-
-