一种语义分析方法及装置、终端、存储介质

    公开(公告)号:CN112836516A

    公开(公告)日:2021-05-25

    申请号:CN201911168156.X

    申请日:2019-11-25

    Inventor: 唐海庆 杨希

    Abstract: 本发明实施例公开了一种语义分析方法,该方法包括:对预设树库中的树结构进行标记处理,获得带有长距离投射标记树结构的第一待训练语料;采用句子成分分析法对所述第一待训练语料进行建模,获得成分句法分析模型;所述成分句法分析模型用于获得第二待训练语料;采用依存句法分析法对所述第二待训练语料进行建模,获得依存句法分析模型;基于所述成分句法分析模型和所述依存句法分析模型对输入语句进行分析,获得所述输入语句的语义分析结果。通过该方法,避免了无法实现精准的语义分析的问题,有效提升了语义分析的准确率。本发明实施例还公开了一种语义分析装置、终端及存储介质。

    表单信息识别方法、装置、电子设备、芯片及介质

    公开(公告)号:CN117612191A

    公开(公告)日:2024-02-27

    申请号:CN202311558054.5

    申请日:2023-11-21

    Abstract: 本公开提供一种表单信息识别方法、装置、电子设备、芯片及介质,涉及计算机技术领域,该方法包括:对表单信息进行编码,提取表单信息中的行列特征,表单信息是通过表单进行解析得到的,行列特征包括行特征和列特征;基于行特征和列特征,分别确定行特征之间的行关联信息和列特征之间的列关联信息;基于行关联信息和列关联信息,筛选表单信息,并按照读取方向识别行特征或列特征中的属性特征;根据属性特征,获取筛选后的表单信息对应的识别结果,识别结果包括筛选后的表单信息中多个属性特征和多个属性特征对应的多个属性值之间的映射关系,通过考虑行列之间的关联关系对表单信息进行识别,提高整体表单信息的识别效率和识别准确率。

    面向图片文本的粗粒度情感分析方法及装置

    公开(公告)号:CN116263784A

    公开(公告)日:2023-06-16

    申请号:CN202211392305.2

    申请日:2022-11-08

    Inventor: 陈敬 杨希 闫伟

    Abstract: 本发明公开了一种面向图片文本的粗粒度情感分析方法及装置,方法包括:识别图片得到图片中的文本信息及文本结构化信息;将预设标签信息与文本信息进行融合,分别输入至主任务预设模型和辅任务预设模型得到对应的主任务文本向量和辅任务文本向量;其中,预设标签信息包括情感分类标签以及情绪识别标签;主任务预设模型用于粗粒度情感分析;辅任务预设模型用于细粒度情感分析;对文本结构化信息进行转换得到图片向量,并将图片向量与主任务文本向量拼接,得到主任务图片文本向量;利用辅任务文本向量以及主任务图片文本向量,训练调整主任务预设模型,得到主任务预设模型的粗粒度情感分析的输出结果。

    一种名片信息抽取系统训练方法及装置、存储介质

    公开(公告)号:CN116090463A

    公开(公告)日:2023-05-09

    申请号:CN202111296307.7

    申请日:2021-11-03

    Inventor: 王奥迪 杨希

    Abstract: 本发明实施例公开了一种名片信息抽取系统训练方法及装置、存储介质,该方法包括通过对名片图像进行识别,得到文本信息,之后通过预设BERT模型、预设卷积神经网络进行训练对文本信息进行处理,得到特征向量,再对特征向量进行组合编码,以得到对应的文本片段特征信息,最后利用分类器对文本片段特征信息进行判别,得到文本片段特征信息对应的预测分类标签,通过预设目标函数,使得文本片段特征信息对应的预测分类标签与预设分类标签的损失值达到要求,从而完成对名片信息抽取系统的训练,而通过筛选预测分类标签将得到结构化信息。本发明实施例能够提高系统对名片进行信息抽取时的效果,从而减少在对名片进行信息抽取时抽取到的结构化信息的误差。

    命名实体识别方法、设备、装置和计算机可读存储介质

    公开(公告)号:CN111859963A

    公开(公告)日:2020-10-30

    申请号:CN201910277533.7

    申请日:2019-04-08

    Inventor: 唐海庆 童超 杨希

    Abstract: 本发明实施例公开了一种命名实体识别方法、设备、装置和计算机可读存储介质,该方法包括:将文本中的词语映射为向量;对所述向量进行处理,得到所述文本中词语的上下文表示;确定出与所述上下文表示相关的标签转移关系,根据所确定的标签转移关系,为所述文本中词语确定出标签序列。如此,在本发明实施例中,可以确定出与上下文信息相关的标签转移关系;这种动态地确定标签转移关系的方式,可以根据不同的上下文对标签的跳转进行更细致的建模,有助于优化标签跳转以及路径选择,进而可以提高推断标签序列的准确性和可靠性。

    信息搜索方法、装置、计算机设备及存储介质

    公开(公告)号:CN111859079A

    公开(公告)日:2020-10-30

    申请号:CN201910363713.7

    申请日:2019-04-30

    Inventor: 陈敬 杨希 梁俊

    Abstract: 本发明实施例公开了一种信息搜索方法、装置、计算机设备及存储介质,应用于计算机技术领域,所述信息搜索方法包括:获取第一关键词;查询信息库获得与所述第一关键词满足相似度条件的第一信息;提取所述第一信息中的关键字段;将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;基于所述匹配结果,返回搜索结果。所述信息搜索方法能够在查询到与所述第一关键词满足相似度条件的第一信息的基础上,还会将所述第一关键词与第一信息中的关键字段进行语义匹配,得到最终的匹配结果,使得搜索得到的信息更加准确。

    一种信息抽取方法、装置、设备和计算机存储介质

    公开(公告)号:CN116776877A

    公开(公告)日:2023-09-19

    申请号:CN202211446035.9

    申请日:2022-11-18

    Inventor: 杨希 张丽娟

    Abstract: 本申请实施例公开了一种信息抽取方法、装置、设备和计算机存储介质,该方法包括:获取目标文本,其中,所述目标文本包括目标字段信息;采用扩展文本信息的方式对所述目标文本进行编码处理,得到对应的待识别编码;基于所述目标字段信息,采用预设抽取模型对所述待识别编码中的目标字段信息对应的编码进行抽取,得到抽取结果编码;对所述抽取结果编码进行解码处理,得到所述目标文本中的所述目标字段信息。这样,能够通过对目标文本采用扩展文本信息的方式进行编码处理,得到目标文本进行扩展后的若干待识别编码,并基于预设抽取模型,根据目标字段信息对待识别编码进行抽取,得到待识别编码中的目标字段信息,提高了抽取效率和准确率。

Patent Agency Ranking