-
公开(公告)号:CN119443000A
公开(公告)日:2025-02-14
申请号:CN202411575008.0
申请日:2024-11-06
Applicant: 哈尔滨工业大学
IPC: G06F30/337 , G06F18/214 , G06N3/0455 , G06N3/048 , G06N3/08 , G06F17/16
Abstract: 一种基于大规模语言模型的电子装备变体设计方法,属于电子装备变体设计技术领域。为解决生成符合相应领域、功能要求的CBB模型的问题,本发明包括向通义千问模型提供生成目标电子装备CBB模型的命令;向通义千问模型中提供加入提示词命令;生成电子装备CBB模型,然后向通义千问模型输入文本命令,通义千问模型根据文本命令和电子装备CBB模型生成电子产品架构;得到文本特征作为电子装备变体数据集;采用中文版BERT模型作为电子装备变体设计Bert模型,然后基于Lora方法微调电子装备变体设计Bert模型,得到训练好的中文版BERT模型;根据模型文本特征的相关性,过滤掉无关的电子装备CBB模型。本发明正确性高。
-
公开(公告)号:CN117422527A
公开(公告)日:2024-01-19
申请号:CN202311526419.6
申请日:2023-11-15
Applicant: 哈尔滨工业大学
IPC: G06Q30/0601 , G06F16/9536 , G06F16/9535
Abstract: 本发明公开了一种基于用户偏好感知的全新商品冷启动方法,包括:获取用户协同特征、商品协同特征和商品内容特征;基于用户协同特征和商品协同特征,建立用户与商品的关系模型;基于商品协同特征和商品内容特征,将同一商品的内容特征与协同特征进行对齐,获取商品层级特征对齐模型;将同一用户购买记录中除目标商品外的所有商品的协同特征进行聚合,获取用户偏好;将用户偏好与商品内容特征进行对齐,获取群组层级特征对齐模型;将用户与商品的关系模型、商品层级特征对齐模型、群组层级特征对齐模型进行联合损失优化,获取联合损失模型,并将原有商品和全新商品分别通过协同特征和内容特征进行推荐。本发明能够更好的解决全新商品冷启动问题。
-
公开(公告)号:CN116757195A
公开(公告)日:2023-09-15
申请号:CN202310746692.3
申请日:2023-06-25
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06F40/30 , G06F40/216 , G06N20/00
Abstract: 本发明公开了一种基于提示学习的隐性情感识别方法,包括以下步骤:获取情感文本进行主题识别,基于识别的主题,选择种子词对应的母类别;基于种子词对应的母类别,采用未标记评论的聚类和余弦相似度对所述种子词继续进行类别检测,获得所述种子词对应的子类别;构建提示模板,将所述种子词对应的子类别嵌入到所述提示模板中并进行训练,将训练后的提示模板与预训练语言模型相结合,识别出对应的隐性情感。本发明构建的提示模板相较于手工构建的模板可以更加匹配预训练语言模型,通过让下游任务主动适应大型预训练语言模型的方式提升学习效率。
-
公开(公告)号:CN116501890A
公开(公告)日:2023-07-28
申请号:CN202310486585.1
申请日:2023-04-28
Applicant: 哈尔滨工业大学
IPC: G06F16/36 , G06N3/0464
Abstract: 本发明提供一种知识图谱嵌入向量确定方法、装置、电子设备及存储介质,涉及知识图谱技术领域,该方法包括:根据图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实体节点的实体嵌入向量和实体节点关系嵌入向量;根据属性节点关系嵌入向量,确定各个属性节点的第一嵌入向量;根据预设关系因子,确定第一实体节点关系嵌入向量;根据第一嵌入向量和第一实体节点关系嵌入向量,确定第二实体节点知识图谱;根据第二实体节点知识图谱中第一实体节点关系嵌入向量,确定各个实体节点的第二嵌入向量;根据第二嵌入向量和第二实体节点关系嵌入向量,确定各个实体节点的目标嵌入向量。
-
公开(公告)号:CN102043910A
公开(公告)日:2011-05-04
申请号:CN201010600321.7
申请日:2010-12-22
Applicant: 哈尔滨工业大学
Abstract: 一种基于Top-n-gram的蛋白质远程同源性检测和折叠识别方法,涉及一种蛋白质远程同源性检测和折叠识别方法。本发明为了解决现有的蛋白质远程同源性检测和折叠识别方法中,二进制谱无法找到最优阈值,无法区分氨基酸出现频率的差别的问题。具体步骤:一、运行PSI-BLAST,输入测试蛋白质序列进行多序列比对,计算氨基酸i的伪计数;二、生成频率谱;三、将频率谱转化为Top-n-gram;四、获得测试蛋白质序列对应的潜在语义表达向量;五、将测试蛋白质序列对应的潜在语义表达向量输入SVM分类器进行分类,得到预测结果。应用于蛋白质同源性检测和折叠识别领域。
-
公开(公告)号:CN101436201A
公开(公告)日:2009-05-20
申请号:CN200810209525.0
申请日:2008-11-26
Applicant: 哈尔滨工业大学
IPC: G06F17/30
Abstract: 本发明提供了一种变粒度文本聚类的特征量化方法,它通过下述步骤实现:1)文档关键词的概念扩展,利用知网,将文档中的关键词集合扩展为另外一个具有更高语义覆盖能力的概念词集合;2)特征表示和相似度计算:词与词之间的相似度可以理解为其公共特征的重合度有多大。文本聚类应用中文档之间(以及文档簇之间)的相似度大小也可以通过考察文档之间公共特征的多少来判定。3)变粒度文本聚类特征量化技术与具体聚类算法进行结合使用,达到变粒度聚类的效果。本发明克服了已有的文档聚类系统由于特征量化不当导致的变粒度聚类时聚类效果较差的弊端。
-
公开(公告)号:CN104750798B
公开(公告)日:2020-09-29
申请号:CN201510123052.2
申请日:2015-03-19
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学
IPC: G06F16/9535 , G06F16/906
Abstract: 本发明公开了一种应用程序的推荐方法和装置,用于描述应用程序之间广泛的相关性,提高向用户推荐应用程序的效果。本发明提供的应用程序的推荐方法包括:根据应用程序的评论信息和描述信息确定应用程序之间是否存在相关性;若所述应用程序之间存在相关性,根据预置的应用程序之间的关系分类特征从面向应用程序的关系分类体系中确定出所述应用程序之间所属的分类关系;根据所述应用程序之间所属的分类关系向用户推荐应用程序。
-
公开(公告)号:CN104750798A
公开(公告)日:2015-07-01
申请号:CN201510123052.2
申请日:2015-03-19
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学
IPC: G06F17/30
Abstract: 本发明公开了一种应用程序的推荐方法和装置,用于描述应用程序之间广泛的相关性,提高向用户推荐应用程序的效果。本发明提供的应用程序的推荐方法包括:根据应用程序的评论信息和描述信息确定应用程序之间是否存在相关性;若所述应用程序之间存在相关性,根据预置的应用程序之间的关系分类特征从面向应用程序的关系分类体系中确定出所述应用程序之间所属的分类关系;根据所述应用程序之间所属的分类关系向用户推荐应用程序。
-
公开(公告)号:CN103544135A
公开(公告)日:2014-01-29
申请号:CN201310507228.5
申请日:2013-10-24
Applicant: 哈尔滨工业大学
Abstract: 一种结合限制数据的特征权值量化方法,它涉及一种结合限制数据的特征权值量化方法,本发明是要解决现有的基于限制数据的特征权值量化方法无法处理限制数据分布不均衡和限制数据存在不一致性的问题。本发明所述一种结合限制数据的特征权值量化方法按以下步骤进行:一、合并“限制数据”和“非限制数据”进行特征权值量化;二、特征权值量化函数中结合参数分布系数;三、特征权值量化函数中结合参数置信度。本发明解决了限制数据分布不均衡和限制数据中存在不一致性的问题。技术要点在于结合限制数据和非限制数据进行特征权值量化,并提出参数分布系数和置信度,本发明可应用于网络技术领域。
-
公开(公告)号:CN102004724B
公开(公告)日:2012-06-20
申请号:CN201010602030.1
申请日:2010-12-23
Applicant: 哈尔滨工业大学
IPC: G06F17/27
Abstract: 文档段落分割方法,本发明涉及文档的分割方法。用于文本分割。它解决现有技术引入与文档描述的主题无关的噪声词而增大或缩小描述不同或相同子主题的片段间的相似度,使得片段划分的结果不准确的缺陷。它通过下述步骤实现:一、对文档进行分词的操作及停用词过滤的操作;二、采用词典《知网》对文档的多义词进行消歧;三、对消歧后的词语通过词语之间的相似度构造词汇链;四、对文档构造全文词汇链;五、对文档进行划分,将其划分为多个长度相等的片段,对片段构造词汇链;六、根据片段词汇链和全文词汇链相互覆盖的程度确定片段之间的相似度;七、根据片段之间的相似度构造片段相似图,根据片段相似度图对片段进行分割。
-
-
-
-
-
-
-
-
-