-
公开(公告)号:CN115545738A
公开(公告)日:2022-12-30
申请号:CN202110742728.1
申请日:2021-06-30
IPC: G06Q30/02 , G06Q30/06 , G06F16/2458 , G06N3/04
Abstract: 本申请公开了一种信息推荐方法,可以应用于人工智能领域,本申请基于存在关联关系的物品和操作类型来生成表征目标用户喜好的目标用户特征向量,以及基于存在关联关系的用户和操作类型来生成表征目标物品对用户的吸引力特征的目标物品特征向量,来预测目标用户对目标物品的进行多个操作类型的操作的概率,其中,操作类型的概率可以更准确的刻画出用户针对于物品的操作行为,且基于多个操作类型的操作的概率进行的信息推荐结果可以更加准确。
-
公开(公告)号:CN117009649A
公开(公告)日:2023-11-07
申请号:CN202310802390.3
申请日:2023-06-30
IPC: G06F16/9535 , G06Q10/04 , G06N3/08
Abstract: 一种数据处理方法,可以应用于人工智能领域,方法包括:获取第一训练样本,所述第一训练样本指示所述第一用户对所述第一物品进行了第一行为、且未进行第二行为;根据所述第一属性信息、以及所述第一行为的时间和第一截止时间的时间间隔,通过第一模型,预测所述第一用户会对所述第一物品进行第二行为的概率,根据所述概率对第二模型对应的第一损失进行调整,得到调整后的损失;根据所述调整后的损失,更新所述第二模型。本申请通过第一模型来预测用户在第一行为之后会进行第二行为的概率,并基于该概率来调整标签,也就是调整损失函数,调整后的损失函数可以在理论上和理想损失函数之间不存在偏差,从而提高了训练后的推荐模型的推荐精度。
-
公开(公告)号:CN113626677A
公开(公告)日:2021-11-09
申请号:CN202110745653.2
申请日:2021-06-30
IPC: G06F16/9532 , G06F16/36 , G06F40/295 , G06F40/30
Abstract: 本申请实施例公开了一种检索方法、模型训练方法及相关装置,该方法包括:根据用户输入的查询数据获取关键词信息,根据查询数据的关键词信息通过主题分布模型提取主题分布特征向量;根据多个候选数据中每个候选数据的关键词信息通过特征提取模型获取每个候选数据的特征向量;根据主题分布特征向量与每个候选数据的特征向量计算查询数据和每个候选数据的相关性数值;根据相关性数值呈现多个候选数据中的至少一个。该方法基于主题分布特征向量计算查询数据和每个候选数据的相关性数值,即考虑了主题维度,避免未考虑主题维度而导致相关性数值的准确度较低的情况,从而可以提高检索的准确度。
-
公开(公告)号:CN111489019B
公开(公告)日:2024-05-31
申请号:CN202010242339.8
申请日:2020-03-31
Applicant: 清华大学
Abstract: 本公开涉及一种睡眠质量预测方法及装置,所述方法包括:获取目标用户在睡眠时刻之前的预设时间段内的用户信息,所述用户信息包括用户生理信息、用户活动信息、用户所在环境信息、用户饮食信息以及用户睡眠信息中的至少一种;根据所述目标用户的用户信息,通过预训练的睡眠质量预测模型对所述目标用户的睡眠质量进行预测,得到所述目标用户的睡眠质量预测结果;在所述睡眠质量预测结果不满足预设条件时,发送提示信息。本公开实施例的睡眠质量预测方法能够在睡前预测目标用户的睡眠质量,并在目标用户的睡眠质量不满足预设条件时发送提示信息。
-
公开(公告)号:CN111414539B
公开(公告)日:2023-09-01
申请号:CN202010197501.9
申请日:2020-03-19
Applicant: 清华大学 , 智者四海(北京)技术有限公司
IPC: G06N3/084 , G06F16/9535 , G06F16/435 , G06F16/335 , G06Q30/0601 , G06N3/048
Abstract: 本公开涉及一种基于特征增强的推荐系统神经网络训练方法及装置,所述方法包括:将第一训练集中的多个第一样本,输入第t轮待训练的神经网络中进行处理,得到与多个第一样本对应的预测分值;根据多个第一样本的特征信息及与多个第一样本对应的预测分值,分别确定神经网络对各个属性的关注度;根据关注度阈值及神经网络对各个属性的关注度,分别确定各个属性的增强概率;根据第一增强率及增强概率,从多个第一样本的特征信息中,确定出待更新的特征信息;根据待更新的特征信息及噪声特征值,更新第一训练集中的第一样本,得到更新后的第二训练集;根据第二训练集,对神经网络进行第t轮训练。本公开的实施例可提高神经网络的鲁棒性。
-
公开(公告)号:CN111538830A
公开(公告)日:2020-08-14
申请号:CN202010350649.1
申请日:2020-04-28
Applicant: 清华大学
IPC: G06F16/34 , G06F16/335 , G06F16/338
Abstract: 本公开涉及计算机技术领域,尤其涉及一种法条检索方法、装置、计算机设备及存储介质。所述方法包括:根据待查询案例的案情描述文本,生成待查询的文本摘要;获取候选法条集合;根据待查询的文本摘要和候选法条集合,调用预设检索模型输出得到多个候选法条各自对应的评分;根据多个候选法条各自对应的评分,显示至少两个候选法条。本公开实施例通过基于待查询案例的案情描述文本,计算机设备可以自动生成对应的文本摘要以进行检索,提高了检索的便利性。并且,通过调用预设检索模型得到多个候选法条各自对应的评分,由于评分用于指示候选法条与文本摘要之间的相关性,进而能够快速的确定出与文本摘要相关的法条,提高了检索的准确性。
-
公开(公告)号:CN111538827A
公开(公告)日:2020-08-14
申请号:CN202010350837.4
申请日:2020-04-28
Applicant: 清华大学
IPC: G06F16/335 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种基于内容和图神经网络的判例推荐方法、装置及存储介质,所述方法包括:根据目标用户的日志数据,从判例库中确定出多个候选判例;根据所述目标用户的兴趣特征信息及所述多个候选判例的第一特征信息,分别预测所述目标用户对各个候选判例的评分,其中,所述兴趣特征信息包括目标用户的长期兴趣特征和短期兴趣特征,所述长期兴趣特征及所述第一特征信息是通过图神经网络确定的;根据所述评分及预设的推荐数量,确定向所述目标用户推荐的目标判例。根据本公开实施例的判例推荐方法能够有效提高判例推荐的准确性。
-
公开(公告)号:CN103064984B
公开(公告)日:2016-08-10
申请号:CN201310029963.X
申请日:2013-01-25
Applicant: 清华大学 , 北京搜狗科技发展有限公司
IPC: G06F17/30
Abstract: 本发明提出一种垃圾网页的识别方法及系统。其中,方法包括:获取搜索引擎的查询日志并对查询日志进行预处理获得预处理查询日志;从预处理查询日志的多个查询和结果网页中筛选出查询的用户点击率和结果网页的出现次数大于阈值的查询?结果集合;从查询?结果集合中人工筛选提取出多个垃圾网页生成垃圾网页样例集合;根据查询?结果集合和垃圾网页样例集合计算查询?结果集合中每个结果网页的垃圾得分和每个查询的作弊得分;当结果网页的垃圾得分大于阈值则结果网页为垃圾网页,并将结果网页添加到垃圾网页集合中。根据本发明实施例的方法,通过搜索引擎查询日志发现和识别垃圾网页降低了算法复杂度,具有较好的推广性和适应性。
-
公开(公告)号:CN105630776A
公开(公告)日:2016-06-01
申请号:CN201510998012.2
申请日:2015-12-25
Applicant: 清华大学
IPC: G06F17/28
CPC classification number: G06F17/2827 , G06F17/289
Abstract: 本发明涉及一种双向词语对齐方法及装置,其中,方法包括构建源语言到目标语言的第一词语对齐模型和目标语言到源语言的第二词语对齐模型;利用一致性评估函数,融合两个方向的词语对齐模型,构建初始目标函数;利用一致性评估函数,对两个方向的词语对齐模型进行联合训练,形成优化目标函数;利用优化目标函数及联合训练得到的模型,对平行双语句对进行词语对齐,得到双向词语对齐结果。系统包括词语对齐模型构建模块、目标函数构建模块、联合训练模块、词语对齐分析模块。通过本发明提供方法及装置,由于引入了一致性评估函数,能对两个方向的词语对齐模型进行联合训练,使两个方向的词语对齐模型相互纠错,极大的降低了词语对齐的错误率。
-
公开(公告)号:CN102156746A
公开(公告)日:2011-08-17
申请号:CN201110098378.6
申请日:2011-04-19
Applicant: 清华大学 , 北京搜狗科技发展有限公司
IPC: G06F17/30
Abstract: 本发明提出一种搜索引擎的性能评价方法,包括以下步骤:对用户日志进行预处理,并从所述用户日志中获取待评价的查询集合;针对所述查询集合,在所述用户日志中提取相应的查询分类特征;根据所述查询分类特征,将所述查询集合分类成导航类查询集合和信息事务类查询集合;获取所述分类后的查询集合的用户行为特征;以及根据所述用户行为特征,分别对所述导航类查询集合和信息事务类查询集合进行用户满意判定。本发明的搜索引擎的性能评价方法的模型结构和参数简单,算法复杂度低,数据全面客观,评价真实可靠。
-
-
-
-
-
-
-
-
-