-
公开(公告)号:CN103218457B
公开(公告)日:2016-09-21
申请号:CN201310173156.5
申请日:2013-05-10
Applicant: 清华大学 , 北京搜狗科技发展有限公司
IPC: G06F17/30
Abstract: 本发明提出一种基于社交网络的人物搜索和发现方法及系统。其中,方法包括以下步骤:S1:从社交网络获取用户信息,其中,用户信息包括关注信息;S2:对用户信息进行扩展以获得扩展标签;S3:对关注信息进行预测以获得预测标签;S4:根据用户信息、扩展标签和预测标签生成倒排索引;S5:接收用户通过客户端输入的搜索信息,并根据搜索信息从倒排索引查找与搜索信息对应的用户;以及S6:将搜索到的用户的用户信息反馈至客户端。根据本发明实施例的方法,通过对社交网络中的用户信息进行扩展和预测,并建立倒排索引实现用户搜索信息的查询,方便用户使用。
-
公开(公告)号:CN105843817A
公开(公告)日:2016-08-10
申请号:CN201510020864.4
申请日:2015-01-15
Applicant: 北京三星通信技术研究有限公司 , 清华大学
IPC: G06F17/30
Abstract: 本发明实施例提供了通过终端设备进行搜索的方法、装置与设备。其中,终端设备接收用户输入的查询信息,对查询信息进行搜索,确定当前与查询信息相应的查询子话题,以及确定所述查询子话题的搜索结果;将查询子话题以标签的形式在屏幕上显示,并显示至少一个查询子话题的搜索结果。本发明提出的上述方案,向用户提供了用于细化其查询需求的途径,即用户可通过点击等简单操作,就能够对其查询需求进行更加准确的细化定位。同时,标签形式的查询子话题,也有利于提高用户的输入效率,即用户后续的搜索操作,只需通过点击标签实现搜索命令的输入。此外,当用户选择某个查询子话题时,只显示相应的搜索结果,会简化用户搜索结果的输出,提高了用户的查询体验。
-
公开(公告)号:CN105718564A
公开(公告)日:2016-06-29
申请号:CN201610037932.2
申请日:2016-01-20
Applicant: 清华大学 , 北京搜狗科技发展有限公司
CPC classification number: G06F16/9577 , G06F16/951 , G06F16/955 , G06Q30/0277
Abstract: 本发明公开了一种推广行为的检测方法及装置,其中该方法包括:获取基于众包网站中针对多个第一用户发布的多个推广任务信息,并根据多个推广任务信息获取N个第一推广渠道作为种子推广渠道;获取基于问答平台中的多个答案信息、多个问题信息、以及多个第二用户信息,并确定多个答案信息以及多个问题信息中的包含种子推广渠道和非种子推广渠道的M个第二推广渠道;根据M个第二推广渠道、多个答案信息、以及多个第二用户信息构建用户?渠道的二部图;根据种子推广渠道和用户?渠道的二部图计算二部图中每个用户与每个渠道对应的分数值对多个答案信息进行推广行为检测。该方法能够有效检测推广作弊行为,提升问答社区用户体验,减小了用户的损失。
-
公开(公告)号:CN105512224A
公开(公告)日:2016-04-20
申请号:CN201510857213.0
申请日:2015-11-30
Applicant: 清华大学 , 北京搜狗科技发展有限公司
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明涉及一种基于用户行为模式的搜索满意度自动评估方法,属于信息检索领域,该方法包括:获取用于搜索满意度自动评估的搜索引擎查询日志;对获取的两种搜索引擎查询日志进行预处理;从处理后的搜索引擎查询日志挖掘出用于满意度自动评估的光标位置序列;对满意度评估分类器进行训练;将不包含满意度反馈信息的搜索引擎查询日志输入到该分类器中,分类器的输出即为搜索满意度自动评估结果。本发明方法通过对用户在搜索过程中的交互日志的分析,对比被用户反馈为“满意”和“不满意”的搜索引擎查询日志中所体现出的光标位置序列差异,挖掘出可以高效区分用户不同满意程度的光标位置序列,以达到对搜索满意度进行自动评估的目的。
-
公开(公告)号:CN103593427A
公开(公告)日:2014-02-19
申请号:CN201310551747.1
申请日:2013-11-07
Applicant: 清华大学
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/2785
Abstract: 本发明提出一种新词搜索方法及系统,其中方法包括以下步骤:提供多个语料,并对多个语料分别进行分词以得到多个单词;获取多个单词中第一单词在对应的语料中与第一单词相邻的单词集合;根据单词集合中不同单词的数量得到停用词集合;分别将单词集合中的每个单词与第一单词进行组合以得到组合后的多个候选单词;分别判断组合为每个候选单词中的两个单词组合之后的上下文熵增量;如果上下文熵增量大于第一预设值且对应的候选单词不包含停用词集合中的停用词,则将对应的候选单词作为新词。根据本发明实施例的方法,通过计算上下文熵以获得候选新词,并根据停用词集合对候选新词进行过滤,因此提高新词搜索的准确性,简化搜索过程提高搜索效率。
-
公开(公告)号:CN103544246A
公开(公告)日:2014-01-29
申请号:CN201310470531.2
申请日:2013-10-10
Applicant: 清华大学 , 北京搜狗科技发展有限公司
CPC classification number: G06F17/30737 , G06F17/30707
Abstract: 一种互联网多种情感词典构建方法及系统,其包括:从互联网上获取互联网文本语料;对所获取的文本语料进行数据预处理以得到情感词典的候选词;从所获取的文本语料提取新词以得到情感词典的候选词;利用所得到的情感词典的候选词来构建无向图模型;利用无向图模型及标签传播算法迭代计算无向图中每个节点的多种情感得分以构建情感词典,本发明采用不同种子词可构造不同情绪的情感词典,使情感识别的结果更加丰富。
-
公开(公告)号:CN103218457A
公开(公告)日:2013-07-24
申请号:CN201310173156.5
申请日:2013-05-10
Applicant: 清华大学 , 北京搜狗科技发展有限公司
IPC: G06F17/30
Abstract: 本发明提出一种基于社交网络的人物搜索和发现方法及系统。其中,方法包括以下步骤:S1:从社交网络获取用户信息,其中,用户信息包括关注信息;S2:对用户信息进行扩展以获得扩展标签;S3:对关注信息进行预测以获得预测标签;S4:根据用户信息、扩展标签和预测标签生成倒排索引;S5:接收用户通过客户端输入的搜索信息,并根据搜索信息从倒排索引查找与搜索信息对应的用户;以及S6:将搜索到的用户的用户信息反馈至客户端。根据本发明实施例的方法,通过对社交网络中的用户信息进行扩展和预测,并建立倒排索引实现用户搜索信息的查询,方便用户使用。
-
公开(公告)号:CN101789018B
公开(公告)日:2013-03-13
申请号:CN201010109586.7
申请日:2010-02-09
Applicant: 清华大学 , 北京搜狗科技发展有限公司
IPC: G06F17/30
Abstract: 本发明提出一种基于交互信息的网页点击描述文档进行网页检索的方法,包括以下步骤:提取搜索日志中用户与搜索引擎的交互信息;根据所述交互信息建立初始的点击描述文档;根据查询引导的点击量计算所述初始点击描述文档中的不同词语的权重;根据所述权重及初始的点击描述文档生成网页点击描述文档;以及基于所生成的网页点击描述文档,利用所述搜索引擎进行搜索。本发明实施例通过用户与搜索引擎之间的进行网页搜索的方法,从而能够显著地提升网页信息检索的性能,并且在不需要人工刻意参与的情况下也能够准确客观和快捷及时的进行检索。
-
公开(公告)号:CN101789018A
公开(公告)日:2010-07-28
申请号:CN201010109586.7
申请日:2010-02-09
Applicant: 清华大学 , 北京搜狗科技发展有限公司
IPC: G06F17/30
Abstract: 本发明提出一种基于交互信息的网页点击描述文档构建方法,包括以下步骤:提取搜索日志中用户与搜索引擎的交互信息;根据所述交互信息建立初始的点击描述文档;根据查询引导的点击量计算所述初始点击描述文档中的不同词语的权重;根据所述权重及初始的点击描述文档生成网页点击描述文档。本发明实施例通过用户与搜索引擎之间的交互信息构建网页点击描述文档,从而能够显著地提升网页信息检索的性能,并且在不需要人工刻意参与的情况下也能够准确客观和快捷及时的进行检索。
-
公开(公告)号:CN101630315A
公开(公告)日:2010-01-20
申请号:CN200810116757.1
申请日:2008-07-16
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本发明涉及一种快速检索方法及系统,该方法包括:收集待检索对象列表及文档;在文档中标注出现在待检索对象列表中的待检索对象;抽取文档中已标注的待检索对象前后各若干个字符信息;将由同一待检索对象抽取的字符信息汇集为一个文档,得到该待检索对象对应的描述文档;根据用户的查询词在所有待检索对象对应的描述文档上检索并给出检索结果,该系统包括待检索信息获取单元、待检索对象标注单元、待检索信息抽取单元、待检索信息整理单元和检索单元。本发明在线下将对应对象列表中对象具有支持和描述信息识别并抽取汇集为一个文档,用户检索时直接将该对象对应的所有信息输出,检索速度快,检索精度高。
-
-
-
-
-
-
-
-
-