-
公开(公告)号:CN119740041A
公开(公告)日:2025-04-01
申请号:CN202411796526.5
申请日:2024-12-09
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
Inventor: 陈敬
IPC: G06F18/22 , G06F18/25 , G06F18/213 , G06F18/2415 , G06N3/0455 , G06N3/0442 , G06N5/01 , G06N3/048
Abstract: 本发明提供一种专题文本匹配方法、装置及电子设备,涉及计算机技术领域。该方法包括:在内容文本中的文本信息和图片信息之间的相关度大于预设阈值的情况下,获取所述图片信息的位置特征,所述位置特征用于表征所述图片信息与所述文本信息中的各段落信息之间的距离关系;将所述位置特征、所述文本信息和所述图片信息输入至多模态预训练模型,输出所述内容文本对应的第一中间向量;根据所述第一中间向量和专题文本对应的第二中间向量,确定所述内容文本与所述专题文本的相关度。本发明的方案,能够利用内容文本中的图片信息准确地确定专题文本和内容文本之间的相关度。
-
公开(公告)号:CN119621777A
公开(公告)日:2025-03-14
申请号:CN202411706764.2
申请日:2024-11-26
Applicant: 南京大学 , 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司 , 中国移动通信集团江苏有限公司
IPC: G06F16/2455 , G06F16/22
Abstract: 本发明公开了一种自适应的范围查询过滤方法、系统、设备及存储介质。所述方法包括:将输入数据集中的每个键切分为前缀和后缀,并将前缀相同的键划分到同一分区,每个分区包括前缀、后缀个数和按升序排列的后缀数组;构建自适应范围过滤器,构建过程以分区为单位进行编码,前缀插入到布谷鸟过滤器,后缀个数插入到桥结构,后缀数组根据稀疏程度连续紧凑存储,并进行压缩处理;根据查询的范围,将左右边界切分为两个前缀‑后缀对,根据前缀快速定位到相应的分区,在该分区的后缀数组中执行范围查询,返回符合条件的后缀。本发明通过键的切分和特定编码方式实现了一种基于指纹的自适应的范围查询过滤器,能够自适应应对倾斜工作负载,提高查询性能。
-
公开(公告)号:CN111859079B
公开(公告)日:2023-08-15
申请号:CN201910363713.7
申请日:2019-04-30
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/953 , G06F16/9538 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本发明实施例公开了一种信息搜索方法、装置、计算机设备及存储介质,应用于计算机技术领域,所述信息搜索方法包括:获取第一关键词;查询信息库获得与所述第一关键词满足相似度条件的第一信息;提取所述第一信息中的关键字段;将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;基于所述匹配结果,返回搜索结果。所述信息搜索方法能够在查询到与所述第一关键词满足相似度条件的第一信息的基础上,还会将所述第一关键词与第一信息中的关键字段进行语义匹配,得到最终的匹配结果,使得搜索得到的信息更加准确。
-
公开(公告)号:CN113887194A
公开(公告)日:2022-01-04
申请号:CN202010627857.1
申请日:2020-07-01
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/211 , G06F40/58 , G06N3/08
Abstract: 本申请公开了一种翻译方法及装置,所述方法包括:确定第一目标语句的第一解码器状态;所述第一目标语句为源语言语句中待翻译的语句,所述第一解码器状态为利用所述神经机器翻译模型对所述第一目标语句进行翻译得到的解码器状态;从目标区域中获取第一编码器状态;所述第一编码器状态是指源语言语句中已翻译的目标语句集合的编码器状态;所述目标区域用于基于缓存更新机制确定所述目标语句集合,并保存所述目标语句集合的编码器状态;基于所述第一编码器状态以及所述第一解码器状态确定所述第一目标语句的第二解码器状态。本申请利用已翻译语句的编码器状态影响待翻译语句的解码器状态,实现跨句信息的传递,提高目标语言语篇的衔接性和连贯性。
-
公开(公告)号:CN113887194B
公开(公告)日:2024-11-29
申请号:CN202010627857.1
申请日:2020-07-01
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/211 , G06F40/58 , G06N3/08
Abstract: 本申请公开了一种翻译方法及装置,所述方法包括:确定第一目标语句的第一解码器状态;所述第一目标语句为源语言语句中待翻译的语句,所述第一解码器状态为利用所述神经机器翻译模型对所述第一目标语句进行翻译得到的解码器状态;从目标区域中获取第一编码器状态;所述第一编码器状态是指源语言语句中已翻译的目标语句集合的编码器状态;所述目标区域用于基于缓存更新机制确定所述目标语句集合,并保存所述目标语句集合的编码器状态;基于所述第一编码器状态以及所述第一解码器状态确定所述第一目标语句的第二解码器状态。本申请利用已翻译语句的编码器状态影响待翻译语句的解码器状态,实现跨句信息的传递,提高目标语言语篇的衔接性和连贯性。
-
公开(公告)号:CN116263784A
公开(公告)日:2023-06-16
申请号:CN202211392305.2
申请日:2022-11-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明公开了一种面向图片文本的粗粒度情感分析方法及装置,方法包括:识别图片得到图片中的文本信息及文本结构化信息;将预设标签信息与文本信息进行融合,分别输入至主任务预设模型和辅任务预设模型得到对应的主任务文本向量和辅任务文本向量;其中,预设标签信息包括情感分类标签以及情绪识别标签;主任务预设模型用于粗粒度情感分析;辅任务预设模型用于细粒度情感分析;对文本结构化信息进行转换得到图片向量,并将图片向量与主任务文本向量拼接,得到主任务图片文本向量;利用辅任务文本向量以及主任务图片文本向量,训练调整主任务预设模型,得到主任务预设模型的粗粒度情感分析的输出结果。
-
公开(公告)号:CN111859079A
公开(公告)日:2020-10-30
申请号:CN201910363713.7
申请日:2019-04-30
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/953 , G06F16/9538 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本发明实施例公开了一种信息搜索方法、装置、计算机设备及存储介质,应用于计算机技术领域,所述信息搜索方法包括:获取第一关键词;查询信息库获得与所述第一关键词满足相似度条件的第一信息;提取所述第一信息中的关键字段;将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;基于所述匹配结果,返回搜索结果。所述信息搜索方法能够在查询到与所述第一关键词满足相似度条件的第一信息的基础上,还会将所述第一关键词与第一信息中的关键字段进行语义匹配,得到最终的匹配结果,使得搜索得到的信息更加准确。
-
公开(公告)号:CN119025674A
公开(公告)日:2024-11-26
申请号:CN202410994764.0
申请日:2024-07-24
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F18/24 , G06F18/22 , G06N3/0455 , G06N3/08
Abstract: 本申请提供一种文本分类模型的训练方法、文本分类方法及相关设备,所述文本分类模型包括编码器和解码器,所述方法包括:获取训练数据集,所述训练数据集包括训练文本、所述训练文本对应的第一标签和所述第一标签对应的标签扩充信息,所述标签扩充信息为对所述第一标签内容的描述信息;对所述文本分类模型进行训练,得到目标文本分类模型。本申请通过对文本分类模型中的编码器和解码器利用训练文本、训练文本对应的第一标签和第一标签对应的标签扩充信息进行训练,得到目标文本分类模型,从而提高了对文本的分类效率。
-
公开(公告)号:CN115526176A
公开(公告)日:2022-12-27
申请号:CN202110706283.1
申请日:2021-06-24
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
Inventor: 陈敬
IPC: G06F40/30 , G06F40/216 , G06F40/242 , G06F16/34 , G06F16/35 , G06F16/33
Abstract: 本申请实施例提供一种文本识别方法,包括:获取待识别文本;通过文本语义提取模型,提取所述待识别文本中的多个局部文本信息,以及所述多个局部文本信息之间的语义特征,得到文本语义向量;对所述文本语义向量进行识别处理,得到所述待识别文本中的目标文本。本申请实施例同时还提供一种文本识别装置、电子设备、存储介质。
-
公开(公告)号:CN119669224A
公开(公告)日:2025-03-21
申请号:CN202411739480.3
申请日:2024-11-29
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司 , 中国移动通信集团江苏有限公司 , 南京大学
IPC: G06F16/22 , G06F16/2455
Abstract: 本发明公开了一种用于加速Redis查询的可强化型过滤方法、系统、设备及存储介质。将Redis中的Bloom过滤器替换为一种远端存储无关的可强化型Cuckoo过滤器,该可强化型Cuckoo过滤器主要由两部分组成:前端的Cuckoo过滤器和后端的后缀缓存,并在后端的后缀缓存中使用一种基于线性同余的一对一哈希函数计算哈希值,提高了计算的效率。并且将过滤器和远端存储解耦,使其可以直接替换Redis中的Bloom过滤器而不需要重新设计整个系统。本发明可以显著改善在倾斜数据流下误报率和查询效率。
-
-
-
-
-
-
-
-
-