-
公开(公告)号:CN111539199B
公开(公告)日:2023-08-18
申请号:CN202010308062.4
申请日:2020-04-17
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/232 , G06F40/289 , G06F40/30 , G06F40/58 , G10L15/26 , G10L15/04 , G10L15/16 , G10L15/02 , G10L15/22 , G06N3/044 , G06N3/0455 , G06N3/088
Abstract: 本发明实施例涉及人工智能领域,公开了一种文本的纠错方法、装置、终端、及计算机可读存储介质。本发明中,所述文本的纠错方法,包括:获取待纠错句子;将所述待纠错句子转换为句子向量;将所述待纠错句子的句子向量输入到训练好的神经机器翻译模型NMT中,以获取所述神经机器翻译模型NMT输出的纠错后句子的句子向量;将所述纠错后句子的句子向量转换为纠错后句子。本发明实施例能够减少人工维护的工作量,从而减少处理成本。
-
公开(公告)号:CN111209740B
公开(公告)日:2023-08-15
申请号:CN201911419034.3
申请日:2019-12-31
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/232 , G06F40/289 , G06N3/044 , G06N3/0442 , G06N3/08
Abstract: 本发明实施例涉及深度学习领域,公开了文本模型训练方法、文本纠错方法、电子设备及存储介质。本发明中,将语音对话进行文本转换,得到错误文本,对错误文本进行纠错,得到正确文本,根据热词表对错误文本以及正确文本进行分词;之后对分词后的文本样本进行编码得到的文本训练样本,将文本输入样本输入至深度神经网络中进行训练,得到目标文本模型。相对于现有技术基于规则的模型或者基于统计的模型进行文本纠错而言,分词精确度更高,提高了模型训练得到的目标文本模型的纠错准确率。另外,基于建立的目标文本模型进行纠错,在纠错过程中仅需输入错误句子即可得到正确句子,减少了纠错过程中的工作量以及成本。
-
公开(公告)号:CN111209740A
公开(公告)日:2020-05-29
申请号:CN201911419034.3
申请日:2019-12-31
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/232 , G06F40/289 , G06N3/08
Abstract: 本发明实施例涉及深度学习领域,公开了文本模型训练方法、文本纠错方法、电子设备及存储介质。本发明中,将语音对话进行文本转换,得到错误文本,对错误文本进行纠错,得到正确文本,根据热词表对错误文本以及正确文本进行分词;之后对分词后的文本样本进行编码得到的文本训练样本,将文本输入样本输入至深度神经网络中进行训练,得到目标文本模型。相对于现有技术基于规则的模型或者基于统计的模型进行文本纠错而言,分词精确度更高,提高了模型训练得到的目标文本模型的纠错准确率。另外,基于建立的目标文本模型进行纠错,在纠错过程中仅需输入错误句子即可得到正确句子,减少了纠错过程中的工作量以及成本。
-
公开(公告)号:CN111883165B
公开(公告)日:2024-06-18
申请号:CN202010633445.9
申请日:2020-07-02
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G10L21/0272 , G10L21/0308 , G10L25/24
Abstract: 本发明实施例涉及语音处理技术领域,公开了一种说话人语音切分方法。本发明在初始说话人语音包括静音时进行静音切除,得到标准说话人语音,提取所述标准说话人语音的梅尔频率倒谱特征,得到梅尔频率倒谱特征集,从所述梅尔频率倒谱特征集中选取不同维度的梅尔频率倒谱特征,得到梅尔频率倒谱特征子集,对所述梅尔频率倒谱特征子集进行聚类切分,得到不同说话人的语音。本发明还提出一种说话人语音切分装置、电子设备以及计算机可读存储介质。本发明可有效解决语音切分过程中计算量较大、切分准确率低的问题。
-
公开(公告)号:CN111159999B
公开(公告)日:2023-04-18
申请号:CN201911233540.3
申请日:2019-12-05
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/205 , G06F16/35 , G06F16/33 , G06N3/0464 , G06N3/08
Abstract: 本发明实施例涉及计算机技术领域,公开了一种填充词槽的方法、装置、电子设备及存储介质。本发明中填充词槽的方法,获取待解析文本数据;从存储的多个匹配模型中,选取与待解析文本数据的文本类别相匹配的匹配模型,匹配模型包括词槽标签与文本数据之间的对应关系,词槽标签用于标识词槽;根据匹配的匹配模型,确定待解析文本数据的词槽标签;从待解析文本数据中提取与词槽标签对应的文本数据,将提取的文本数据作为词槽的词槽内容。本实施方式,提高了填充词槽的速度以及准确性。
-
公开(公告)号:CN111159999A
公开(公告)日:2020-05-15
申请号:CN201911233540.3
申请日:2019-12-05
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/205 , G06F16/35 , G06F16/33 , G06N3/04 , G06N3/08
Abstract: 本发明实施例涉及计算机技术领域,公开了一种填充词槽的方法、装置、电子设备及存储介质。本发明中填充词槽的方法,获取待解析文本数据;从存储的多个匹配模型中,选取与待解析文本数据的文本类别相匹配的匹配模型,匹配模型包括词槽标签与文本数据之间的对应关系,词槽标签用于标识词槽;根据匹配的匹配模型,确定待解析文本数据的词槽标签;从待解析文本数据中提取与词槽标签对应的文本数据,将提取的文本数据作为词槽的词槽内容。本实施方式,提高了填充词槽的速度以及准确性。
-
公开(公告)号:CN113051925B
公开(公告)日:2024-06-18
申请号:CN201911368365.9
申请日:2019-12-26
Applicant: 中国移动通信集团有限公司
Abstract: 本发明公开了一种时间识别方法、装置、设备及计算机存储介质。该方法包括:获取与预约时间相关的文本信息;利用AC自动机从文本信息中确定至少一个时间关键词;根据时间关键词确定文本信息中的预约时间。根据本发明实施例,能够通过利用AC自动机从口语化文本中提取时间关键词,然后对时间关键词进行分析,识别出口语化文本中所要表达的时间信息,提高了时间关键词的提取效率,且提高了时间识别的准确性。
-
公开(公告)号:CN112003953B
公开(公告)日:2023-04-07
申请号:CN202011055225.9
申请日:2020-09-29
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明涉及大数据领域,公开了一种广告推送方法及服务器。其中,广告推送方法,包括:获取各个客户所持终端的无线宽带连接信息,所述无线宽带连接信息包括无线宽带账户信息、建立连接时刻和断开连接时刻;根据所述无线宽带连接信息计算所述各个客户两两之间的客户亲密度;获取目标客户,所述目标客户为所述各个客户中尚未购买产品的客户,根据所述客户亲密度和所述目标客户获取广告推送对象;向所述广告推送对象发送广告。与现有技术相比,本发明实施方式所提供的广告推送方法及服务器具有提升广告推送转化率的优点。
-
公开(公告)号:CN111539199A
公开(公告)日:2020-08-14
申请号:CN202010308062.4
申请日:2020-04-17
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/232 , G06F40/289 , G06F40/30 , G06F40/58 , G10L15/26 , G10L15/04 , G10L15/16 , G10L15/02 , G10L15/22 , G06N3/04 , G06N3/08
Abstract: 本发明实施例涉及人工智能领域,公开了一种文本的纠错方法、装置、终端、及计算机可读存储介质。本发明中,所述文本的纠错方法,包括:获取待纠错句子;将所述待纠错句子转换为句子向量;将所述待纠错句子的句子向量输入到训练好的神经机器翻译模型NMT中,以获取所述神经机器翻译模型NMT输出的纠错后句子的句子向量;将所述纠错后句子的句子向量转换为纠错后句子。本发明实施例能够减少人工维护的工作量,从而减少处理成本。
-
公开(公告)号:CN116976921A
公开(公告)日:2023-10-31
申请号:CN202211320209.7
申请日:2022-10-26
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q30/0201 , G06Q30/0202 , G06Q30/0601 , G06F18/214 , G06F18/24 , G06F18/25
Abstract: 本公开实施例公开了一种预测用户付费转化行为的方法、装置、处理设备及存储介质。所述方法包括:确定目标用户的用户类型,所述用户类型包括以下之一:非付费用户;单产品用户;融合产品用户;以及全站包产品用户;根据所述用户类型确定用于预测用户产生预定付费转化行为的预测模型,其中,不同用户类型对应的预测模型不同;基于所述目标用户的用户类型确定预定特征信息;将所述预定特征信息输入训练后的所述预测模型,获得用户产生预定付费转化行为的预测结果。
-
-
-
-
-
-
-
-
-