-
公开(公告)号:CN114118022A
公开(公告)日:2022-03-01
申请号:CN202111452650.6
申请日:2021-12-01
Applicant: 科大讯飞股份有限公司
IPC: G06F40/151 , G06F40/194 , G06F40/189 , G06F40/284 , G06F40/30
Abstract: 本发明提供一种文本表示方法、装置、电子设备与存储介质,所述方法包括:确定目标文本;将目标文本输入至跨语种文本表示模型,得到跨语种文本表示模型输出的文本表示,所述文本表示为所述目标文本的编码表示;其中,所述跨语种文本表示模型是以样本文本的文本表示与对应的样本正例的正例表示之间的一致性,以及所述样本文本的文本表示与对应的样本负例的负例表示之间的差异性为目标训练得到的,所述样本正例与所述样本文本的语种不同且语义相同,所述样本负例与所述样本文本的语种不同且语义不同。本发明提供的方法、装置、电子设备与存储介质,实现了不需要花费长时间的训练、仅需要少量的语料数据即可获得跨语种文本表示模型效果显著的提升。
-
公开(公告)号:CN109003149B
公开(公告)日:2021-08-17
申请号:CN201811289181.9
申请日:2018-10-31
Applicant: 科大讯飞股份有限公司
IPC: G06Q30/02
Abstract: 本申请公开了一种弹幕广告投放方法及装置,该方法包括:在播放待投放弹幕广告的目标视频时,首先检测播放平台的弹幕功能是否处于开启状态,其中,目标视频中植入了至少一个广告,接着,如果确定弹幕功能处于开启状态,则可以在目标视频播放到每一植入广告的同时,以弹幕的方式显示该植物广告对应的广告提示。可见,本申请在视频播放到植入广告时,可以以弹幕的方式显示其广告提示,且该广告提示可以是任意风格的能够吸引用户注意的提示,因此,当以弹幕方式显示该广告提示时,提高了用户对视频中植入式广告的关注度,进而提升了植入式广告的传播效果。
-
公开(公告)号:CN107773982B
公开(公告)日:2021-08-13
申请号:CN201710986387.6
申请日:2017-10-20
Applicant: 科大讯飞股份有限公司
IPC: A63F13/424 , A63F13/87 , G06F3/16 , G10L15/26 , G10L15/22
Abstract: 本发明实施例提供一种游戏语音交互方法及装置,属于语音识别领域。该方法包括:获取对语音数据进行语音识别后得到的文本数据,将文本数据拆分为文本元素,并将每一文本元素转化为文本向量;基于每一文本向量,生成特征矩阵,并将特征矩阵输入至指令识别模型,输出语音数据对应的操作指令,操作指令为游戏指令或非游戏指令,游戏指令用于操控游戏玩家对应的游戏角色,非游戏指令用于游戏玩家之间互相沟通。由于游戏玩家通过语音输入的方式,除了实现与其它游戏玩家之间互相沟通之外,还可实现对其对应的游戏角色进行操控,从而在便捷游戏玩家操控的同时,拓展了游戏中语音交互的功能,进而在整体层面上提升了游戏玩家的体验。
-
公开(公告)号:CN113055741A
公开(公告)日:2021-06-29
申请号:CN202011622336.3
申请日:2020-12-31
Applicant: 科大讯飞股份有限公司
IPC: H04N21/44 , H04N21/4728 , H04N21/488 , H04N21/8549
Abstract: 本申请公开了一种视频摘要的生成方法、电子设备及计算机可读存储介质,其中,所述视频摘要的生成方法包括:获取源视频,将所述源视频划分为多个单位视频片段;根据每个所述单位视频片段对应的弹幕信息,从所述多个单位视频片段中筛选出若干个所述单位视频片段作为关键视频片段;根据时间顺序将所有所述关键视频片段进行拼接,生成所述源视频对应的视频摘要。上述方案,能够生成个性化的视频摘要。
-
公开(公告)号:CN112800775A
公开(公告)日:2021-05-14
申请号:CN202110117912.7
申请日:2021-01-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/284
Abstract: 本申请公开了一种语义理解方法、装置、设备及存储介质,本申请对于待理解文本,在其所属场景下的各类型实体词中获取与待理解文本相匹配的实体词,以及获取待理解文本所属语种的语种特征,基于待理解文本与匹配实体词确定融合文本,基于融合文本及语种特征,确定待理解文本的语义理解结果。本申请能够针对不同语种、不同场景下的待理解文本进行语义的理解,并且过程中考虑待理解文本所属语种,能够区分不同语种特性,保障对各种不同语种的待理解文本的语义理解效果。同时,通过引入待理解文本所属语种及场景下的匹配实体词,使得本申请的语义理解方案能够适用于对不同语种、不同场景下待理解文本的语义理解,提升待理解文本的语义理解准确度。
-
公开(公告)号:CN112686051A
公开(公告)日:2021-04-20
申请号:CN202011572659.6
申请日:2020-12-22
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/279
Abstract: 本发明提供一种语义识别模型训练方法、识别方法、电子设备、存储介质。其中,语义识别模型训练方法包括:建立预置数据库,所述预置数据库包括多个预置问题;利用所述预置问题对初始模型进行训练,以得到初始语义模型;将所述初始语义模型与语言模型进行拼接,以得到所述语义识别模型;其中,所述语言模型用于识别文本中字与字之间的语言学关系;所述初始语义模型用于识别所述文本中字或词在所述文本中的语义含义。以此提高模型语义理解能力。
-
公开(公告)号:CN112633007A
公开(公告)日:2021-04-09
申请号:CN202011519649.6
申请日:2020-12-21
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/42 , G06F40/211 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种语义理解模型构建方法及装置、语义理解方法及装置,该语义理解模型构建方法包括:在获取到多语语料之后,先根据该多语语料生成训练样本、该训练样本的实际语种和该训练样本的实际语义信息,并将该训练样本输入多语种理解模型,得到该多语种理解模型输出的该训练样本的预测语种和该训练样本的预测语义信息;再根据该训练样本的预测语种、实际语种、预测语义信息及其实际语义信息,更新该多语种理解模型,并继续执行上述将该训练样本输入多语种理解模型的步骤,直至在达到预设停止条件时,根据该多语种理解模型构建语义理解模型,以使该语义理解模型能够对该至少两个语种下的语句进行语义理解。
-
公开(公告)号:CN112507718A
公开(公告)日:2021-03-16
申请号:CN202011487631.2
申请日:2020-12-16
Applicant: 科大讯飞股份有限公司
IPC: G06F40/295 , G06F16/33
Abstract: 本申请提供了一种跨语种实体标注方法、装置、设备及存储介质,方法包括:获取标注出实体词的源语种文本和对应的目标语种文本,根据源语种文本和目标语种文本获取正样例集、负样例集和候选数据集,正样例集中的每个正样例表征源语种文本中的一个实体词,负样例集中的每个负样例表征源语种文本中的一个非实体词,候选数据集中的每个候选数据表征目标语种文本中的一个候选实体词,通过将候选数据集中的候选数据与正样例集和负样例集中的样例匹配,从候选数据集中的候选数据所表征的候选实体词中确定出实体词,并对确定出的实体词进行标注。本申请可从目标语种文本中标注出实体词,且标注过程不需要人工参与,具有较高的标注效率和标注质量。
-
-
公开(公告)号:CN107665188B
公开(公告)日:2021-01-29
申请号:CN201610602149.6
申请日:2016-07-27
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30
Abstract: 本发明提供了一种语义理解方法及装置,其中方法包括:获取待处理文本数据;对所述文本数据进行知识点标注,以生成多条语义理解候选路径;提取每条语义理解候选路径的路径特征;根据所述路径特征对所述多条语义理解候选路径进行过滤,以得到一条或多条语义理解路径;根据过滤后得到的一条或多条语义理解路径对所述文本数据进行语义理解,以得到所述文本数据的语义理解结果。本发明提出了语义理解“候选路径”的概念,在生成最后的语义理解之前,先通过知识点标注得到众多候选路径,然后提取每条候选路径的路径特征,再根据路径特征对众多候选路径进行过滤,从而大大减少了最后进行语义理解时所面对的路径的数量,进而提高了语义理解的效率。
-
-
-
-
-
-
-
-
-