-
公开(公告)号:CN117315094B
公开(公告)日:2025-02-11
申请号:CN202311451979.X
申请日:2023-11-02
Applicant: 北京百度网讯科技有限公司
IPC: G06T11/60 , G06F16/334 , G06F16/583 , G06F40/279
Abstract: 本公开提供了图片生成方法、修饰关系模型生成方法、装置和设备,涉及人工智能技术,尤其涉及计算机视觉、深度学习、自然语言处理等技术领域。具体实现方案为:接收输入的用于生成图片的第一文本;根据预先构建的修饰关系对集合,确定第一文本对应的第二文本,其中,修饰关系对集合中包括从文本中提取的第一修饰关系对;第二文本包括第一文本中的至少部分内容;根据针对第二文本的选择操作,确定第三文本,第二文本包括第三文本;通过将第三文本输入到预先训练的文生图模型,得到输出的与第三文本对应的图片,其中文生图模型用于根据输入的文本生成对应的图片。有助于改善由文本所生成的图片的效果。
-
公开(公告)号:CN118468846A
公开(公告)日:2024-08-09
申请号:CN202410669146.9
申请日:2024-05-27
Applicant: 北京百度网讯科技有限公司
IPC: G06F40/20 , G06F40/279 , G06F16/903 , G06N5/022
Abstract: 本公开提供了一种文本事实性校验方法、装置、设备及介质,涉及人工智能领域,具体涉及自然语言处理和大语言模型领域。具体实现方案为:获取待校验文本;在所述待校验文本中识别出至少一个备选实体;对各所述备选实体进行筛选,得到至少一个事实实体;获取各所述事实实体对应的事实标准知识;根据各所述事实标准知识,检测所述待校验文本的事实错误。本公开实施例可以提高文本错误检测准确性和效率。
-
公开(公告)号:CN116108857B
公开(公告)日:2024-04-05
申请号:CN202310121634.1
申请日:2022-05-30
Applicant: 北京百度网讯科技有限公司
IPC: G06F40/30 , G06F40/284 , G06F16/36
Abstract: 本公开提供了信息抽取方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及知识图谱、自然语言处理、深度学习等技术领域。具体实现方案为:对待处理文本进行切词,得到词文本序列;对词文本序列进行词类标注,得到与词文本序列相对应的词类标签序列,其中,词类标签序列中的词类标签是按照语义信息和词性信息设置的标签;以及基于词类标签序列,从词文本序列中抽取目标词文本,得到目标信息。
-
公开(公告)号:CN114818736B
公开(公告)日:2023-06-09
申请号:CN202210612667.1
申请日:2022-05-31
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种文本处理方法、用于短文本的链指方法、装置、设备、存储介质以及计算机程序产品,涉及知识图谱、深度学习、自然语言处理等人工智能技术领域。具体实现方案为:为歧义词的每个词义项构建文本数据集,其中,歧义词对应多个词义项;对包含歧义词的短文本进行语义解析,得到多个候选消歧词;将每个候选消歧词分别与每个词义项的文本数据集进行匹配;响应于一个候选消歧词仅与一个词义项的文本数据集匹配成功,将该候选消歧作为相匹配的词义项的目标消歧词;将包含目标消歧词的短文本,保存至相匹配的词义项的消歧文本集。获得的消歧文本集精准且简洁。
-
公开(公告)号:CN109885180B
公开(公告)日:2022-12-06
申请号:CN201910130735.9
申请日:2019-02-21
Applicant: 北京百度网讯科技有限公司
IPC: G06F3/023 , G06F40/232 , G06F40/242
Abstract: 本公开提供了一种纠错方法,该方法包括:基于接收到的查询请求,从预设的字典树中确定多个目标候选实体,计算每个目标候选实体为合法实体的第一概率,对每个目标候选实体进行评估,得到评估的结果,其中,一个目标候选实体对应一个评估的结果,基于第一概率和评估的结果确定查询请求对应的真实意图实体。通过本公开实施例提供的技术方案,避免了现有技术中纠错效果不佳的问题,实现了降低纠错成本,提高纠错效率和准确率的技术效果。本公开还提供了一种纠错装置、计算机可读介质。
-
公开(公告)号:CN114861677A
公开(公告)日:2022-08-05
申请号:CN202210611986.0
申请日:2022-05-30
Applicant: 北京百度网讯科技有限公司
IPC: G06F40/30 , G06F40/284 , G06F16/36
Abstract: 本公开提供了信息抽取方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及知识图谱、自然语言处理、深度学习等技术领域。具体实现方案为:对待处理文本进行切词,得到词文本序列;对词文本序列进行词类标注,得到与词文本序列相对应的词类标签序列,其中,词类标签序列中的词类标签是按照语义信息和词性信息设置的标签;以及基于词类标签序列,从词文本序列中抽取目标词文本,得到目标信息。
-
公开(公告)号:CN107944033B
公开(公告)日:2022-02-18
申请号:CN201711329275.X
申请日:2017-12-13
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/9535 , G06F16/9536 , G06F16/36
Abstract: 本申请公开了一种关联话题推荐方法和装置,其中,方法包括:获取与用户当前阅读的文章对应的关联话题推荐请求,其中,请求包括:用户偏好信息、文章类型,以及从文章提取的基础话题集合;根据用户偏好信息和文章类型对基础话题集合进行筛选获取候选话题集合;根据预先建立的话题关联索引信息获取与候选话题集合对应的关联话题集合,并根据预设的排序特征计算关联话题集合中每个关联话题的推荐分数;根据推荐分数和预设阈值对关联话题集合进行筛选获取文章的扩展话题集合,并展示给用户。由此,该方法根据用户当前阅读的信息推荐扩展话题,提供关联话题的拓展浏览,针对用户的兴趣提供个性化的信息服务,提高推送能力的灵活性。
-
公开(公告)号:CN112905884A
公开(公告)日:2021-06-04
申请号:CN202110187089.7
申请日:2021-02-10
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/9535 , G06F16/2457 , G06F16/332 , G06F16/335 , G06F16/35 , G06N3/08
Abstract: 本申请公开了一种生成序列标注模型的方法、设备、介质及程序产品,涉及知识图谱、自然语言处理和深度学习等人工智能技术领域。该方法的一具体实施方式包括:获取第一搜索信息和对应的第一标签;根据第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;响应于第二标签与第一标签不一致,确定第一搜索信息中的第一需求信息不为知识图谱中的信息;基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型。
-
公开(公告)号:CN118586455A
公开(公告)日:2024-09-03
申请号:CN202410628333.2
申请日:2024-05-20
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0475 , G06N3/045 , G06N5/025 , G06N5/04 , G06F18/25 , G06F18/214 , G06F18/21
Abstract: 本公开提供了模型训练以及内容生成方法和装置,涉及大模型、深度学习、自然语言处理以及知识图谱等人工智能领域。其中的AIGC模型训练方法包括:构建第一训练集,其中包括第一训练样本,第一训练样本中包括:任一实体对应的第一训练图片以及第一训练图片的图片描述信息;利用第一训练集对第一内容生成模型的实体认知能力进行训练,得到第二内容生成模型;构建第二训练集,其中包括第二训练样本,第二训练样本中包括:目标提示词中的词语间的修饰关系信息,以及与目标提示词相匹配的第二训练图片;利用第二训练集,对第二内容生成模型的实体细节刻画能力进行训练,得到第三内容生成模型。应用本公开所述方案,可提升内容生成模型的指令遵循能力等。
-
公开(公告)号:CN114969326B
公开(公告)日:2024-08-02
申请号:CN202210439044.9
申请日:2022-04-22
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/35
Abstract: 本公开提供了一种分类模型训练、语义分类方法、装置、设备和介质,涉及人工智能领域,尤其涉及知识图谱、深度学习和自然语义处理等技术。具体实现方案为:获取样本问询模板和样本问询模板中待预测类别的标签类别;其中,样本问询模板基于样本问询语句和待预测类别的数量构建;将样本问询模板输入至预先构建的语义分类模型,得到待预测类别的样本语义类别;根据样本语义类别和待预测类别的标签类别,训练语义分类模型。根据本公开的技术,提高了模型的通用性,能够应对样本不均衡问题。
-
-
-
-
-
-
-
-
-