-
公开(公告)号:CN111475621A
公开(公告)日:2020-07-31
申请号:CN202010260098.X
申请日:2020-04-03
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 翟周伟
IPC: G06F16/33 , G06F40/30 , G06F40/247 , G06F40/216 , G06K9/62 , G06N3/04
Abstract: 本公开提供了一种同义词替换表的挖掘方法,其包括:对平行语料进行同义词改写,获得平行语料对齐样本;其中,平行语料对齐样本包括第一侧语料、第二侧语料、第一侧语料中的词和第二侧语料中的词;将平行语料对齐样本转换成序列标注样本;基于序列标注样本训练模型,获得序列标注对齐模型,再利用序列标注对齐模型改写平行语料;基于序列标注对齐模型生成同义词替换表。该同义词替换表的挖掘方法抛弃了繁琐的自然语言处理规则,而且降低了维护成本,提高了同义词替换表的精度。本公开还提供了一种同义词替换表的挖掘装置、电子设备和计算机可读介质。
-
公开(公告)号:CN109218835B
公开(公告)日:2020-04-14
申请号:CN201811161309.3
申请日:2018-09-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/472 , H04N21/845 , H04N21/81
Abstract: 本发明提供一种精华视频的生成方法、装置、设备及存储介质。该方法包括:获取影视剧的剧情简介中的剧情关键词;根据所述剧情关键词,获取所述剧情关键词对应的第一剧情片段;获取热度满足预设条件的第二剧情片段,所述第二剧情片段不同于所述第一剧情片段;根据所述第一剧情片段和所述第二剧情片段,生成精华视频。本发明能够获得拼接自然、剧情发展合乎逻辑且包括热度较高的剧情片段的精华视频。
-
公开(公告)号:CN111324727B
公开(公告)日:2023-08-01
申请号:CN202010102579.8
申请日:2020-02-19
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F16/335 , G06F16/35 , G06F18/241 , G06F18/214
Abstract: 本申请公开了一种用户意图识别方法、装置、设备和可读存储介质,涉及自然语言处理技术领域。具体实现方案为:获取多轮对话数据和每轮对话数据的满意度,并筛选满意度满足设定满意条件的目标对话数据;对所述目标对话数据中的输入数据标注意图标签;根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型,以通过训练后的所述意图识别模型对新的输入数据进行意图识别。本申请实施例能够自动筛选海量训练样本,进而训练得到高精度意图识别模型,提高意图识别精度。
-
公开(公告)号:CN111475621B
公开(公告)日:2021-06-04
申请号:CN202010260098.X
申请日:2020-04-03
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
Inventor: 翟周伟
IPC: G06F16/33 , G06F40/30 , G06F40/247 , G06F40/216 , G06K9/62 , G06N3/04
Abstract: 本公开提供了一种同义词替换表的挖掘方法,其包括:对平行语料进行同义词改写,获得平行语料对齐样本;其中,平行语料对齐样本包括第一侧语料、第二侧语料、第一侧语料中的词和第二侧语料中的词;将平行语料对齐样本转换成序列标注样本;基于序列标注样本训练模型,获得序列标注对齐模型,再利用序列标注对齐模型改写平行语料;基于序列标注对齐模型生成同义词替换表。该同义词替换表的挖掘方法抛弃了繁琐的自然语言处理规则,而且降低了维护成本,提高了同义词替换表的精度。本公开还提供了一种同义词替换表的挖掘装置、电子设备和计算机可读介质。
-
公开(公告)号:CN108833983A
公开(公告)日:2018-11-16
申请号:CN201810725194.X
申请日:2018-07-04
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/472 , H04N21/482 , H04N21/232 , H04N21/235 , H04N21/431
Abstract: 本申请提供一种播放进度同步方法、装置、设备和存储介质,包括:接收用户发送的请求信息,将请求信息发送给服务器,以使服务器根据请求信息同时检索点播数据和EPG数据,其中,EPG数据包括直播数据和直播回看数据;接收服务器发送的点播数据和EPG数据;在确定接收到点播数据和EPG数据时,同时显示点播数据和EPG数据。从而可以同时对点播数据和EPG数据进行检索,将检索到的点播数据和EPG数据都发送给终端设备进行显示,进而,使得终端设备可以同时获取到的点播数据和EPG数据,使得用户可以同时得到点播数据和EPG数据,便于用户及时观看数据。
-
公开(公告)号:CN111353021B
公开(公告)日:2023-08-18
申请号:CN202010131537.7
申请日:2020-02-28
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F16/9032 , G06F16/9532 , G06F40/295 , G06F40/30
Abstract: 本公开涉及一种意图识别方法和设备、电子设备和介质。所述意图识别方法包括:确定待识别信息中的目标搜索特征;确定所述目标搜索特征的意图分布向量,所述意图分布向量基于搜索引擎日志中的与所述目标搜索特征相应的浏览参数得到;以及根据所述待识别信息的至少一部分和所述意图分布向量,确定所述待识别信息的意图。
-
公开(公告)号:CN111339767A
公开(公告)日:2020-06-26
申请号:CN202010107942.5
申请日:2020-02-21
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 翟周伟
IPC: G06F40/284 , G06F40/216
Abstract: 本公开提供了一种对话源数据处理方法,其包括:步骤101,基于对话源数据获取有效对话源数据;步骤102,利用所述有效对话源数据获取对话样本;步骤103,基于所述对话样本构建切词模型;步骤104,将所述切词模型应用于对话系统,并依据用户行为获得新的所述对话源数据,并将新获得的所述对话源数据返回至步骤101。该对话源数据处理方法获得大规模、高精度的对话样本,并自适应地对对话系统进行提升,从而提高切词的准确率。本公开还提供了一种对话源数据处理装置、电子设备、计算机可读介质。
-
公开(公告)号:CN108924604A
公开(公告)日:2018-11-30
申请号:CN201810962298.2
申请日:2018-08-22
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/25 , H04N21/422 , H04N21/44 , H04N21/845 , G10L15/26
Abstract: 本申请实施例公开了用于播放视频的方法和装置。该方法的一具体实施方式包括:响应于接收到用户输入的语音指令,基于语音指令转换成文字信息识别出情节关键字;确定预设的情节表中是否存在与识别出的情节关键字匹配的视频信息,其中,情节表用于表征情节关键字与视频信息的对应关系;若存在与识别出的情节关键字匹配的视频信息,则跳转到与识别出的情节关键字匹配的视频信息所指示的视频位置播放视频。该实施方式实现了根据剧情点播。
-
公开(公告)号:CN111339767B
公开(公告)日:2023-07-21
申请号:CN202010107942.5
申请日:2020-02-21
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
Inventor: 翟周伟
IPC: G06F40/284 , G06F40/216
Abstract: 本公开提供了一种对话源数据处理方法,其包括:步骤101,基于对话源数据获取有效对话源数据;步骤102,利用所述有效对话源数据获取对话样本;步骤103,基于所述对话样本构建切词模型;步骤104,将所述切词模型应用于对话系统,并依据用户行为获得新的所述对话源数据,并将新获得的所述对话源数据返回至步骤101。该对话源数据处理方法获得大规模、高精度的对话样本,并自适应地对对话系统进行提升,从而提高切词的准确率。本公开还提供了一种对话源数据处理装置、电子设备、计算机可读介质。
-
公开(公告)号:CN110569376B
公开(公告)日:2022-05-31
申请号:CN201910884595.4
申请日:2019-09-18
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F16/438 , G06F16/435 , G06F40/30
Abstract: 本申请公开了一种信息处理方法及装置、电子设备、存储介质,涉及语义分析领域。具体实现方案为:获取到文本数据,所述文本数据表征有用于控制输出设备的控制信息;获取基于所述文本数据中所述控制信息所得到输出结果;提取所述文本数据的语义特征;将所述语义特征输入预设模型,得到所述语义特征在预设语义维度上的参数值,所述预设模型至少设置有表征预设语义维度的参数;基于所述语义特征在预设语义维度上的参数值,确定对所述输出结果的输出策略。这样,利用输出策略来规范输出结果,以确保输出结果合规。
-
-
-
-
-
-
-
-
-