-
公开(公告)号:CN112434126B
公开(公告)日:2022-12-13
申请号:CN201910731275.5
申请日:2019-08-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/33 , G06F16/338 , G06F16/9535 , G06F16/9536 , G06Q50/00 , G06F16/951
Abstract: 本发明实施例公开了一种信息处理方法、装置、设备和存储介质,该方法包括:抽取待分析语段中的至少两个候选热词;基于贝叶斯平均法计算各个所述候选热词的第一热度;基于牛顿冷却定律计算各个所述候选热词的第二热度;将同一候选热词的第一热度和第二热度进行加权计算,得到对应候选热词的综合热度;根据各个候选热词的综合热度,对所述待分析语段中的至少两个候选热词进行排序,根据设定的排序次序从所述排序结果中确定所述待分析语段中的热词。本发明实施例通过对网络信息进行分析,准确地计算各词条的热度,以挖掘热词。
-
公开(公告)号:CN112836516A
公开(公告)日:2021-05-25
申请号:CN201911168156.X
申请日:2019-11-25
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/30 , G06F40/211 , G06F16/901 , G06K9/62
Abstract: 本发明实施例公开了一种语义分析方法,该方法包括:对预设树库中的树结构进行标记处理,获得带有长距离投射标记树结构的第一待训练语料;采用句子成分分析法对所述第一待训练语料进行建模,获得成分句法分析模型;所述成分句法分析模型用于获得第二待训练语料;采用依存句法分析法对所述第二待训练语料进行建模,获得依存句法分析模型;基于所述成分句法分析模型和所述依存句法分析模型对输入语句进行分析,获得所述输入语句的语义分析结果。通过该方法,避免了无法实现精准的语义分析的问题,有效提升了语义分析的准确率。本发明实施例还公开了一种语义分析装置、终端及存储介质。
-
公开(公告)号:CN116304120B
公开(公告)日:2025-05-06
申请号:CN202211434753.4
申请日:2022-11-16
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/41 , G06F16/43 , G06F40/30 , G06F40/253 , G06F40/284 , G06F16/73 , G06F16/63 , G06F16/53
Abstract: 本发明公开了一种多媒体检索方法、装置、计算设备和存储介质,其中方法包括:接收检索文本,对检索文本进行语义分析,得到至少一个子属性以及子属性之间的相关关系;将各个子属性和相关关系输入到预训练的语义匹配模型中,得到各个子属性的标签;确定各个子属性的标签与预得到的多媒体子类标签之间的相似度值,根据各个相似度值的大小确定与所述检索文本匹配的多媒体子类。本发明通过分级语义匹配的方式,实现了检索文本语义标签与多媒体标签的多级匹配机制,能够更好的挖掘检索文本语义与多媒体标签之间的关系,具有更高的识别度以及准确率。
-
公开(公告)号:CN117612191A
公开(公告)日:2024-02-27
申请号:CN202311558054.5
申请日:2023-11-21
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06V30/412 , G06V30/19
Abstract: 本公开提供一种表单信息识别方法、装置、电子设备、芯片及介质,涉及计算机技术领域,该方法包括:对表单信息进行编码,提取表单信息中的行列特征,表单信息是通过表单进行解析得到的,行列特征包括行特征和列特征;基于行特征和列特征,分别确定行特征之间的行关联信息和列特征之间的列关联信息;基于行关联信息和列关联信息,筛选表单信息,并按照读取方向识别行特征或列特征中的属性特征;根据属性特征,获取筛选后的表单信息对应的识别结果,识别结果包括筛选后的表单信息中多个属性特征和多个属性特征对应的多个属性值之间的映射关系,通过考虑行列之间的关联关系对表单信息进行识别,提高整体表单信息的识别效率和识别准确率。
-
公开(公告)号:CN116263784A
公开(公告)日:2023-06-16
申请号:CN202211392305.2
申请日:2022-11-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明公开了一种面向图片文本的粗粒度情感分析方法及装置,方法包括:识别图片得到图片中的文本信息及文本结构化信息;将预设标签信息与文本信息进行融合,分别输入至主任务预设模型和辅任务预设模型得到对应的主任务文本向量和辅任务文本向量;其中,预设标签信息包括情感分类标签以及情绪识别标签;主任务预设模型用于粗粒度情感分析;辅任务预设模型用于细粒度情感分析;对文本结构化信息进行转换得到图片向量,并将图片向量与主任务文本向量拼接,得到主任务图片文本向量;利用辅任务文本向量以及主任务图片文本向量,训练调整主任务预设模型,得到主任务预设模型的粗粒度情感分析的输出结果。
-
公开(公告)号:CN116090463A
公开(公告)日:2023-05-09
申请号:CN202111296307.7
申请日:2021-11-03
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/30 , G06V30/19 , G06V30/40 , G06N3/0464 , G06N3/084
Abstract: 本发明实施例公开了一种名片信息抽取系统训练方法及装置、存储介质,该方法包括通过对名片图像进行识别,得到文本信息,之后通过预设BERT模型、预设卷积神经网络进行训练对文本信息进行处理,得到特征向量,再对特征向量进行组合编码,以得到对应的文本片段特征信息,最后利用分类器对文本片段特征信息进行判别,得到文本片段特征信息对应的预测分类标签,通过预设目标函数,使得文本片段特征信息对应的预测分类标签与预设分类标签的损失值达到要求,从而完成对名片信息抽取系统的训练,而通过筛选预测分类标签将得到结构化信息。本发明实施例能够提高系统对名片进行信息抽取时的效果,从而减少在对名片进行信息抽取时抽取到的结构化信息的误差。
-
公开(公告)号:CN111859963A
公开(公告)日:2020-10-30
申请号:CN201910277533.7
申请日:2019-04-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明实施例公开了一种命名实体识别方法、设备、装置和计算机可读存储介质,该方法包括:将文本中的词语映射为向量;对所述向量进行处理,得到所述文本中词语的上下文表示;确定出与所述上下文表示相关的标签转移关系,根据所确定的标签转移关系,为所述文本中词语确定出标签序列。如此,在本发明实施例中,可以确定出与上下文信息相关的标签转移关系;这种动态地确定标签转移关系的方式,可以根据不同的上下文对标签的跳转进行更细致的建模,有助于优化标签跳转以及路径选择,进而可以提高推断标签序列的准确性和可靠性。
-
公开(公告)号:CN111859079A
公开(公告)日:2020-10-30
申请号:CN201910363713.7
申请日:2019-04-30
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/953 , G06F16/9538 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本发明实施例公开了一种信息搜索方法、装置、计算机设备及存储介质,应用于计算机技术领域,所述信息搜索方法包括:获取第一关键词;查询信息库获得与所述第一关键词满足相似度条件的第一信息;提取所述第一信息中的关键字段;将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;基于所述匹配结果,返回搜索结果。所述信息搜索方法能够在查询到与所述第一关键词满足相似度条件的第一信息的基础上,还会将所述第一关键词与第一信息中的关键字段进行语义匹配,得到最终的匹配结果,使得搜索得到的信息更加准确。
-
公开(公告)号:CN116776877A
公开(公告)日:2023-09-19
申请号:CN202211446035.9
申请日:2022-11-18
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/295 , G06F40/284 , G06F40/126
Abstract: 本申请实施例公开了一种信息抽取方法、装置、设备和计算机存储介质,该方法包括:获取目标文本,其中,所述目标文本包括目标字段信息;采用扩展文本信息的方式对所述目标文本进行编码处理,得到对应的待识别编码;基于所述目标字段信息,采用预设抽取模型对所述待识别编码中的目标字段信息对应的编码进行抽取,得到抽取结果编码;对所述抽取结果编码进行解码处理,得到所述目标文本中的所述目标字段信息。这样,能够通过对目标文本采用扩展文本信息的方式进行编码处理,得到目标文本进行扩展后的若干待识别编码,并基于预设抽取模型,根据目标字段信息对待识别编码进行抽取,得到待识别编码中的目标字段信息,提高了抽取效率和准确率。
-
公开(公告)号:CN116304120A
公开(公告)日:2023-06-23
申请号:CN202211434753.4
申请日:2022-11-16
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/41 , G06F16/43 , G06F40/30 , G06F40/253 , G06F40/284 , G06F16/73 , G06F16/63 , G06F16/53
Abstract: 本发明公开了一种多媒体检索方法、装置、计算设备和存储介质,其中方法包括:接收检索文本,对检索文本进行语义分析,得到至少一个子属性以及子属性之间的相关关系;将各个子属性和相关关系输入到预训练的语义匹配模型中,得到各个子属性的标签;确定各个子属性的标签与预得到的多媒体子类标签之间的相似度值,根据各个相似度值的大小确定与所述检索文本匹配的多媒体子类。本发明通过分级语义匹配的方式,实现了检索文本语义标签与多媒体标签的多级匹配机制,能够更好的挖掘检索文本语义与多媒体标签之间的关系,具有更高的识别度以及准确率。
-
-
-
-
-
-
-
-
-