-
公开(公告)号:CN113377844A
公开(公告)日:2021-09-10
申请号:CN202110748160.4
申请日:2021-06-29
Applicant: 哈尔滨工业大学
IPC: G06F16/2458 , G06F16/242 , G06F16/28 , G06F16/25 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种面向大型关系型数据库的对话式数据模糊检索方法及装置,面向大型关系型数据库的对话式数据模糊检索方法包括:获取查询指令;基于预先训练好的文本多标签分类模型,将所述查询指令分类到对应的目标数据库;基于预先训练好的命名实体识别模型,提取所述查询指令的实体,在所述目标数据库中检索出与所述实体相关的属性数据;基于预先训练好的语义识别模型,对所述查询指令进行语义识别,将语义识别结果与所述实体相关的属性数据对比,获得所述查询指令对应的数据检索结果。本发明可提高检索系统的智能性和检索效率。
-
公开(公告)号:CN102043910B
公开(公告)日:2012-12-12
申请号:CN201010600321.7
申请日:2010-12-22
Applicant: 哈尔滨工业大学
Abstract: 一种基于Top-n-gram的蛋白质远程同源性检测和折叠识别方法,涉及一种蛋白质远程同源性检测和折叠识别方法。本发明为了解决现有的蛋白质远程同源性检测和折叠识别方法中,二进制谱无法找到最优阈值,无法区分氨基酸出现频率的差别的问题。具体步骤:一、运行PSI-BLAST,输入测试蛋白质序列进行多序列比对,计算氨基酸i的伪计数;二、生成频率谱;三、将频率谱转化为Top-n-gram;四、获得测试蛋白质序列对应的潜在语义表达向量;五、将测试蛋白质序列对应的潜在语义表达向量输入SVM分类器进行分类,得到预测结果。应用于蛋白质同源性检测和折叠识别领域。
-
公开(公告)号:CN102012748A
公开(公告)日:2011-04-13
申请号:CN201010566505.6
申请日:2010-11-30
Applicant: 哈尔滨工业大学
IPC: G06F3/023
Abstract: 语句级中英文混合输入方法,本发明涉及信息输入方法,尤其涉及一种中英文混合语句输入方法。它解决了现有的中英文混合输入方法采用手工标示输入的字母串中哪些需要转换成中文哪些是英文单词,无法保证连续的语句输入的问题。它包括下述步骤:用键盘输入字符串;由输入法管理系统对字符串进行中英文切分;所做的中英文切分是基于中文拼音库和英文词库的自动识别;输入法管理系统对切分后的字符串分别进行相应的中文和英文字符转换,并提供混合语句候选和中英文词语候选;所做出的中文和英文字符转换是基于中文词库和中英文统计库的自动识别;从通过插入、删除、选择等编辑命令,最终从候选列表中选定输出内容;输出中英文混合语句。用于文字输入。
-
公开(公告)号:CN100446032C
公开(公告)日:2008-12-24
申请号:CN200610009761.9
申请日:2006-03-02
Applicant: 哈尔滨工业大学
CPC classification number: G06K9/6251
Abstract: 一种基于自组织映射网络的文档聚类方法,本发明涉及一种文档聚类方法。它克服了已有的自组织映射聚类方法难以做到对输入文档数据的自适应以及其固定结构所带来的神经元欠利用、网络映射欠准确以及边缘效应等问题。本发明方法的步骤:找出所有被选文档;将自组织映射网络的输出层初始化为环形结构,并把环形结构至少平分为两半,其中的每个扇形分别作为一个神经元;计算当前输出层的R2聚类准则系数;判断R2聚类准则系数是否大于阈值μ;结果为是,则终止自组织映射网络的训练,把被选文档按照当前自组织映射网络进行分类;结果为否,则在当前输出层中寻找具有最大类内离差平方和的神经元,在其附近插入新的神经元,并对当前输出层的所有神经元进行训练。
-
公开(公告)号:CN1808474A
公开(公告)日:2006-07-26
申请号:CN200610009761.9
申请日:2006-03-02
Applicant: 哈尔滨工业大学
CPC classification number: G06K9/6251
Abstract: 基于自组织映射网络的文档聚类方法,本发明涉及一种文档聚类方法。它克服了已有的自组织映射聚类方法难以做到对输入文档数据的自适应以及其固定结构所带来的神经元欠利用、网络映射欠准确以及边缘效应等问题。本发明方法的步骤:找出所有被选文档;将自组织映射网络的输出层初始化为环形结构,并把环形结构至少平分为两半,其中的每个扇形分别作为一个神经元;计算当前输出层的R2聚类准则系数;判断R2聚类准则系数是否大于阈值μ;结果为是,则终止自组织映射网络的训练,把被选文档按照当前自组织映射网络进行分类;结果为否,则在当前输出层中寻找具有最大类内离差平方和的神经元,在其附近插入新的神经元,并对当前输出层的所有神经元进行训练。
-
-
-
-