-
公开(公告)号:CN104750798B
公开(公告)日:2020-09-29
申请号:CN201510123052.2
申请日:2015-03-19
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学
IPC: G06F16/9535 , G06F16/906
Abstract: 本发明公开了一种应用程序的推荐方法和装置,用于描述应用程序之间广泛的相关性,提高向用户推荐应用程序的效果。本发明提供的应用程序的推荐方法包括:根据应用程序的评论信息和描述信息确定应用程序之间是否存在相关性;若所述应用程序之间存在相关性,根据预置的应用程序之间的关系分类特征从面向应用程序的关系分类体系中确定出所述应用程序之间所属的分类关系;根据所述应用程序之间所属的分类关系向用户推荐应用程序。
-
公开(公告)号:CN104750798A
公开(公告)日:2015-07-01
申请号:CN201510123052.2
申请日:2015-03-19
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学
IPC: G06F17/30
Abstract: 本发明公开了一种应用程序的推荐方法和装置,用于描述应用程序之间广泛的相关性,提高向用户推荐应用程序的效果。本发明提供的应用程序的推荐方法包括:根据应用程序的评论信息和描述信息确定应用程序之间是否存在相关性;若所述应用程序之间存在相关性,根据预置的应用程序之间的关系分类特征从面向应用程序的关系分类体系中确定出所述应用程序之间所属的分类关系;根据所述应用程序之间所属的分类关系向用户推荐应用程序。
-
公开(公告)号:CN102004724B
公开(公告)日:2012-06-20
申请号:CN201010602030.1
申请日:2010-12-23
Applicant: 哈尔滨工业大学
IPC: G06F17/27
Abstract: 文档段落分割方法,本发明涉及文档的分割方法。用于文本分割。它解决现有技术引入与文档描述的主题无关的噪声词而增大或缩小描述不同或相同子主题的片段间的相似度,使得片段划分的结果不准确的缺陷。它通过下述步骤实现:一、对文档进行分词的操作及停用词过滤的操作;二、采用词典《知网》对文档的多义词进行消歧;三、对消歧后的词语通过词语之间的相似度构造词汇链;四、对文档构造全文词汇链;五、对文档进行划分,将其划分为多个长度相等的片段,对片段构造词汇链;六、根据片段词汇链和全文词汇链相互覆盖的程度确定片段之间的相似度;七、根据片段之间的相似度构造片段相似图,根据片段相似度图对片段进行分割。
-
公开(公告)号:CN102054029A
公开(公告)日:2011-05-11
申请号:CN201010593747.4
申请日:2010-12-17
Applicant: 哈尔滨工业大学
Abstract: 一种基于社会网络和人名上下文的人物信息消歧处理方法,本发明涉及一种互联网人物信息的消歧处理方法。它解决了现有技术的搜索引擎对某一特定人名的检索结果往往是共享这一人名的不同人物相关网页的混合的问题。用于网络人物信息检索。它包括下述步骤:一、用户输入一个要检索的人名,利用搜索引擎完成检索,利用下载软件把检索到的网页下载到本地计算机;二、对上述网页分别进行正文提取处理、分词处理和词性标注的处理,形成文档;三、利用人物领域信息先对文档进行分类,再利用社会网络和上下文信息对人物领域信息进行聚类处理,最终显示出每个人物领域信息与实体人物之间的对应关系,并且显示出每个实体人物存在的社会网络。
-
公开(公告)号:CN102004724A
公开(公告)日:2011-04-06
申请号:CN201010602030.1
申请日:2010-12-23
Applicant: 哈尔滨工业大学
IPC: G06F17/27
Abstract: 文档段落分割方法,本发明涉及文档的分割方法。用于文本分割。它解决现有技术引入与文档描述的主题无关的噪声词而增大或缩小描述不同或相同子主题的片段间的相似度,使得片段划分的结果不准确的缺陷。它通过下述步骤实现:一、对文档进行分词的操作及停用词过滤的操作;二、采用词典《知网》对文档的多义词进行消歧;三、对消歧后的词语通过词语之间的相似度构造词汇链;四、对文档构造全文词汇链;五、对文档进行划分,将其划分为多个长度相等的片段,对片段构造词汇链;六、根据片段词汇链和全文词汇链相互覆盖的程度确定片段之间的相似度;七、根据片段之间的相似度构造片段相似图,根据片段相似度图对片段进行分割。
-
公开(公告)号:CN102004560A
公开(公告)日:2011-04-06
申请号:CN201010567997.0
申请日:2010-12-01
Applicant: 哈尔滨工业大学
IPC: G06F3/023
Abstract: 语句级汉字输入方法中的用户词识别方法与在线一次性学习方法及机器学习系统,涉及汉字输入的机器学习技术领域。本发明解决了现有机器学习方法中存在的经常需要用户干预才能够获得最终结果的问题。用户词识别方法是采用相对位置成词能力作为评价标准来识别用户词。学习方法仅在输入法输出的最优路径与最终输出路径不一致时才启动,该方法采用基于N元文法的概率计算方法获得概率值后,采用最大后验MAP获得用户调节值CA,该调节值CA和相应的词存入用户语言模型库。机器学习系统是应用上述用户词识别方法和学习方法实现的学习系统。采用本发明技术,能减少用户输入时的干预次数,让用户更轻松地得到需要的输出结果。
-
公开(公告)号:CN119443000B
公开(公告)日:2025-04-18
申请号:CN202411575008.0
申请日:2024-11-06
Applicant: 哈尔滨工业大学
IPC: G06F30/337 , G06F18/214 , G06N3/0455 , G06N3/048 , G06N3/08 , G06F17/16
Abstract: 一种基于大规模语言模型的电子装备变体设计方法,属于电子装备变体设计技术领域。为解决生成符合相应领域、功能要求的CBB模型的问题,本发明包括向通义千问模型提供生成目标电子装备CBB模型的命令;向通义千问模型中提供加入提示词命令;生成电子装备CBB模型,然后向通义千问模型输入文本命令,通义千问模型根据文本命令和电子装备CBB模型生成电子产品架构;得到文本特征作为电子装备变体数据集;采用中文版BERT模型作为电子装备变体设计Bert模型,然后基于Lora方法微调电子装备变体设计Bert模型,得到训练好的中文版BERT模型;根据模型文本特征的相关性,过滤掉无关的电子装备CBB模型。本发明正确性高。
-
公开(公告)号:CN117422526B
公开(公告)日:2024-07-26
申请号:CN202311518835.1
申请日:2023-11-15
Applicant: 哈尔滨工业大学
IPC: G06Q30/0601 , G06F16/9535 , G06N3/0895
Abstract: 本发明公开了一种基于提示的用户跨域冷启动方法,包括:获取用户特有表征、用户通用表征和商品表征;通过用户特有表征和商品表征,获取场景提示向量;根据场景提示向量和用户通用表征,获取目标场景的特有表征,完成基于提示的用户跨域冷启动。本发明通过提出的场景提示生成方法,通过最大化目标场景的提示与目标场景中所有用户与商品之间的互信息的方式,对每个场景的特征进行全面捕捉;本发明中的基于场景提示的目标场景用户表征生成方法,通过考虑不同场景之间的关系以及每个场景的特征,在仅仅知道用户通用表征的情况下,依然可以实现在不同场景中对同一用户进行精准个性化推荐的效果,进而解决用户跨域冷启动问题。
-
公开(公告)号:CN116757195B
公开(公告)日:2024-06-14
申请号:CN202310746692.3
申请日:2023-06-25
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06F40/30 , G06F40/216 , G06N20/00
Abstract: 本发明公开了一种基于提示学习的隐性情感识别方法,包括以下步骤:获取情感文本进行主题识别,基于识别的主题,选择种子词对应的母类别;基于种子词对应的母类别,采用未标记评论的聚类和余弦相似度对所述种子词继续进行类别检测,获得所述种子词对应的子类别;构建提示模板,将所述种子词对应的子类别嵌入到所述提示模板中并进行训练,将训练后的提示模板与预训练语言模型相结合,识别出对应的隐性情感。本发明构建的提示模板相较于手工构建的模板可以更加匹配预训练语言模型,通过让下游任务主动适应大型预训练语言模型的方式提升学习效率。
-
公开(公告)号:CN116738984B
公开(公告)日:2024-03-01
申请号:CN202310748270.X
申请日:2023-06-25
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06F40/117 , G06F40/186 , G06N20/00
Abstract: 本发明公开了一种基于提示学习的自动化数据标注方法,包括:获取有标注数据集和无标注数据集;对所述有标注数据集的实体信息进行提取,获取实体词;基于所述实体词对所述无标注数据集进行筛选,获取筛选后的无标注数据集;构建提示模板组,基于预训练语言模型利用所述提示模板组对所述筛选后的无标注数据集进行测试,获取正向/负向数据;基于所述提示模板组将所述有标注数据集的中性情感数据输入所述预训练语言模型,获取填充完整的提示模板;基于所述填充完整的提示模板和所述正向/负向情感数据,构建完整的扩充数据集,实现基于提示学习的自动化数据标注。
-
-
-
-
-
-
-
-
-