答案确定方法、装置、计算设备及存储介质

    公开(公告)号:CN114429141A

    公开(公告)日:2022-05-03

    申请号:CN202210334709.X

    申请日:2022-03-31

    Abstract: 本公开实施例提供了一种答案确定方法、装置、计算设备及存储介质。答案确定方法包括:对待回答问题进行改写,得到改写问题,所述改写问题为与所述待回答问题语义相近的问题;根据所述待回答问题和/或所述改写问题,得到多个候选答案;根据所述多个候选答案确定用于回答所述待回答问题的目标答案。因为目标答案是根据多个候选答案确定的答案,所以相比于现有技术方案,本公开实施例提供的答案确定方法确定的目标答案与待回答问题匹配的可能性提高,也就是提高输出答案为正确答案的可能性。

    一种基于知识图谱的智能推荐方法

    公开(公告)号:CN114265982A

    公开(公告)日:2022-04-01

    申请号:CN202111583634.0

    申请日:2021-12-22

    Abstract: 本发明涉及一种基于知识图谱的智能推荐方法,包括:A1、针对指定领域内待推荐信息的目标用户,获取目标用户的类型;A2、若目标用户的类型为活跃用户,则根据目标用户在第一预设时间段内的交互行为数据,基于知识图谱推荐内容方式和基于用户协同过滤推荐方式获取个性化的推荐结果;其中,知识图谱是预先构建的存储有指定领域内知识和实体之间关系的结构化的图谱信息;个性化的推荐结果包括:目标用户的最近邻用户对应的信息项和与目标用户的偏好实体匹配的信息项,本发明的方法可以有效解决现有推荐方法中存在的数据稀疏且关联性弱的问题,同时实现了快速精准推送文本信息,并做到千人千面的个性化推送。

    命名实体识别方法、装置、设备及介质

    公开(公告)号:CN114139541A

    公开(公告)日:2022-03-04

    申请号:CN202111389485.4

    申请日:2021-11-22

    Abstract: 本公开涉及一种命名实体识别方法、装置、设备及介质。其中,命名实体识别方法包括:获取待识别的目标文本;对目标文本进行语义特征编码,得到具有上下文信息的第一编码向量,以及对目标文本进行实体特征编码,得到具有上下文信息的第二编码向量;基于第一编码向量,提取实体片段对应的边界信息;基于第一编码向量、第二编码向量和边界信息,对目标文本进行实体分类,得到目标文本对应的目标实体类别。根据本公开实施例,能够快速地从非结构化文本中提取出实体类别信息,并且提高对非结构化文本进行实体类别分类的准确性。

    内容聚类方法及系统
    44.
    发明公开

    公开(公告)号:CN113515648A

    公开(公告)日:2021-10-19

    申请号:CN202111070507.0

    申请日:2021-09-13

    Abstract: 本公开涉及一种内容聚类方法及系统。该方法包括:获取待聚类的多媒体内容集,待聚类的多媒体内容集包括第一多媒体内容集和第二多媒体内容集,根据第一多媒体内容集中第一多媒体内容的多媒体特征生成第一聚类簇,多媒体特征包括语义特征、实体特征以及词语特征中的至少两种,以第一聚类簇中的簇中心为聚类中心,对第二多媒体内容集中第二多媒体内容进行聚类,得到目标聚类簇。通过上述技术方案,实现了准确且快速的对多媒体内容进行聚类,以满足自然语言处理场景的实际聚类需求。

    一种风险旅客评估方法、装置、终端及计算机可读介质

    公开(公告)号:CN113052413A

    公开(公告)日:2021-06-29

    申请号:CN201911368970.6

    申请日:2019-12-26

    Abstract: 本申请提供了一种风险旅客评估方法,包括:获取多个待评估旅客的信息,每个待评估旅客的信息包括多个出行信息和多个属性信息;根据出行信息计算每个待评估旅客的第一风险值,并将第一风险值超过第一预设阈值的待评估旅客纳入第一候选旅客集合;将出行信息输入梯度提升决策树,输出待评估旅客的第二风险值,并将第二风险值超过第一预设阈值的待评估旅客纳入第二候选旅客集合;根据第一候选旅客集合与第二候选旅客集合得到第三候选旅客集合;根据第三候选旅客集合中的第三候选旅客的身份信息,计算第三风险值,并确定第三风险值超过第二预设阈值的第三候选旅客为风险旅客,采用多方信息和梯度提升决策树对风险旅客进行评估,增加了评估的准确性。

    文本热点提取方法及装置
    47.
    发明授权

    公开(公告)号:CN110134942B

    公开(公告)日:2020-10-23

    申请号:CN201910260924.8

    申请日:2019-04-01

    Abstract: 本发明实施例涉及一种文本热点提取方法及装置,包括:采用正则表达式对输入的至少一个文本数据按照设定规则进行分割处理,得到多个第一短文本数据;采用依存句法分析算法将第二短文本数据生成对应的第四短文本数据;将第三短文本数据和第四文短本数据进行向量化处理,得到对应的多个文本向量;基于相似度算法确定任意两个文本向量之间的相似度;将相似度大于相似度阈值的两个文本向量进行合并处理,句法分析抽取关系词而组成的短句提高了信息抽取的可观性和准确度,让用户可以更好的理解文本内容从而获取核心关键信息点,通过Word2vec将短句向量化进行相似度对比,保留词语之间的语义信息,从而保证了排重工作的准确性,尽可能的避免了热点信息的冗余。

    基于大模型的海量负面信息检测方法、装置、设备及介质

    公开(公告)号:CN119005198A

    公开(公告)日:2024-11-22

    申请号:CN202411030867.1

    申请日:2024-07-30

    Abstract: 本公开涉及一种基于大模型的海量负面信息检测方法、装置、设备及介质。其中,基于大模型的海量负面信息检测方法包括:获取待检测文本,由目标机器学习模型对待检测文本进行分析输出第一结果,在第一结果为待检测文本对应的情感分析结果为非负面时,获取目标指令语句,由目标大语言模型基于目标指令语句对待检测文本进行情感分析,输出第二结果,将第二结果确定为待检测文本的检测结果,目标大语言模型的第一参数量高于目标机器学习模型的第二参数量,由此,能够通过不同参数量的机器学习模型和大语言模型结合的方式对待检测文本进行情感分析,确定待检测文本的检测结果,实现了在对待检测文本快速进行情感分析的基础上提高了情感分析的准确性。

    评论生成模型训练方法和装置、信息生成方法和装置

    公开(公告)号:CN117591948B

    公开(公告)日:2024-09-03

    申请号:CN202410082714.5

    申请日:2024-01-19

    Abstract: 本公开提供了一种评论生成模型训练方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取文本样本集,文本样本集包括:第一文本样本,第一文本样本包括:展示文本以及与展示文本相关的情感立场文本;获取预先构建的评论生成网络,评论生成网络包括:编码器和解码器,编码器分别对展示文本和情感立场文本进行建模,得到评论全局特征向量;解码器用于对评论全局特征向量进行解码,得到评论结果信息;将从文本样本集中选取的第一文本样本输入评论生成网络,得到评论生成网络输出的评论结果信息;基于评论结果信息,得到训练完成的评论生成模型。

    基于预训练模型的通用立场检测方法、装置和存储介质

    公开(公告)号:CN117972420A

    公开(公告)日:2024-05-03

    申请号:CN202410038893.2

    申请日:2024-01-10

    Abstract: 本申请涉及自然语言处理技术领域,尤其涉及一种基于预训练模型的通用立场检测方法、装置和存储介质。包括:获取待检测文本和待检测立场目标;将待检测文本和待检测立场目标输入通用立场检测模型,预测待检测文本对于待检测立场目标的立场类别概率分布;立场类别用于表示待检测文本对于待检测立场目标的立场;通用立场检测模型为根据至少一个文本、至少一个立场目标、每个文本的立场类别和每个文本的立场类型预先训练得到;立场类型用于表示文本的立场类别是否依赖于立场目标;将立场类别概率分布中最大概率数值对应的立场类别,确定为待检测文本对于待检测立场目标的立场类别。本申请实施例用于解决立场检测的检测效果较差的问题。

Patent Agency Ranking