-
公开(公告)号:CN104035972A
公开(公告)日:2014-09-10
申请号:CN201410216252.8
申请日:2014-05-21
Applicant: 哈尔滨工业大学深圳研究生院
CPC classification number: G06F17/30864 , H04L51/32
Abstract: 本发明提供了一种基于微博的知识推荐方法及系统,该知识推荐方法包括如下步骤:用户建模、定时批量采集用户关注好友发布的微博、知识条目发现、知识条目扩展、知识推荐。本发明的有益效果是本发明提出一种基于微博的知识推荐方法与系统,从用户关注好友所发布的微博数据中自动发现各类知识条目,对知识条目形成扩展解释,在用户阅读微博时,向用户推荐所发现知识条目中对其有价值或其感兴趣的知识条目及相关扩展解释,提供主动的、个性化的知识服务,既能免去了用户的知识检索过程又能避免有价值信息被淹没。
-
公开(公告)号:CN103853797A
公开(公告)日:2014-06-11
申请号:CN201210523756.5
申请日:2012-12-07
Applicant: 中兴通讯股份有限公司 , 哈尔滨工业大学深圳研究生院
CPC classification number: G06F17/30268
Abstract: 本发明公开了一种基于n元图片索引结构的图片检索方法与系统,涉及图像检索技术领域。本发明公开的方法包括:收到用户的检索操作时,判断用户输入的检索内容的形式为文本形式,则对用户输入的文本进行基于n元图片索引的文本内部向量化处理,利用处理结果在文本标签内的索引下进行图片检索,用户输入的检索内容的形式为图片形式时,对用户输入的图片进行基于n元图片索引结构的图片语义自动标注,提取n元图片,针对提取的n元图片的TF-IDF特征向量在语义标注的文本标签内的索引中进行图片检索,最后将检索到的图片按照相似度排序并输出。本发明还公开了基于n元图片索引结构的图片检索系统。本申请技术方案提高了检索效率和效果。
-
公开(公告)号:CN101995963B
公开(公告)日:2012-07-04
申请号:CN201010551084.X
申请日:2010-11-19
Applicant: 哈尔滨工业大学
IPC: G06F3/023
Abstract: 词汇自适应中文输入方法,本发明涉及一种计算机、手机、或者掌上电子产品等的词汇自适应的中文输入方法。它降低输入法的背景噪音,减少系统开销,实现个性化输入。它用于汉字输入。它包括下述步骤:输入汉语拼音字符串;进行音节切分;根据本地的通用词库中词的状态和已经加载到本地的领域专业词库的状态对音节串进行汉语语句转换;输出汉字字符串;搜索位于服务器端的领域专业词库并判断已输入汉语语句中是否包含位于服务器端的领域词库集中的词汇;如果存在这样的词汇,则将包含该词汇的领域专业词库加载到本地;根据选择确定的汉语语句输入,对位于本地的通用词库和已经加载到本地的领域专业词库中的词进行词汇状态调整。
-
公开(公告)号:CN101334701A
公开(公告)日:2008-12-31
申请号:CN200810144531.2
申请日:2008-07-22
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明涉及信息输入技术,具体涉及一种不经过信息识别、选取过程,将所述信息进行切分或合并成独立信息单元后直接在显示构件上进行原手写体笔迹显示的一种直接写入手写体信息的方法。该方法由操作者通过输入构件写入手写体信息;通过系统对用户写入的所述手写体信息进行捕捉并将该手写体信息进行切分或合并成独立信息单元,然后在显示构件上进行原笔迹显示,通过该方法输入的手写体更便于编辑操作。本发明中所述直接写入手写体信息的方法更适合汉字和特殊字符和公式的输入,大大提高了信息输入的效率,并且保留了书写者的原字体,使常用非正式文档更具有个性化特点。
-
公开(公告)号:CN112036290B
公开(公告)日:2023-11-03
申请号:CN202010878323.6
申请日:2020-08-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V30/413 , G06F40/126 , G06F40/279 , G06F40/30
Abstract: 本发明提供了一种基于类标编码表示的复杂场景文字识别方法及系统,该方法包括:设计五笔类标编码表示模块,根据设计的五笔类标编码表示模块对字符进行编码;输入场景文字图像进行预处理,得到训练场景文字图像;将训练场景文字图像输入到语义分割网络进行像素级别的分类,得到编码后标签的分类结果;利用概率模块学习五笔类标编码的转移矩阵,训练整个模型,得到场景文字识别模型;将测试图像输入至已训练的场景文字识别模型进行分类,得到最终语义分割图;对语义分割图的像素进行投票,选择具有最高票数的预测作为最终字符识别结果。本发明的技术方案对复杂场景的字符图像具有较高识别准确率,降低了参数和计算的复杂度。
-
公开(公告)号:CN116152832A
公开(公告)日:2023-05-23
申请号:CN202211097009.X
申请日:2022-09-08
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V30/412 , G06V30/148
Abstract: 本发明公开了一种面向领域的图片表格还原方法、系统,对输入图片进行表格检测输出表格区域;并进行文本块切分和识别,得到文本块对应的位置坐标和文本内容;对每个文本块原始图片处理生成掩码图片,将所有文本块原始图片的掩码图片进行拼接,生成表格区域的掩码图片,并输入图片语义分割模型,输出表格行列图片语义分割结果;对分割的列文本合并,并输入文本语义分割模型,得到文本语义单元集合,根据领域知识数据库得到矫正后的文本语义单元集合;根据文本语义单元集合、图片语义分割结果、对应的文本位置和文本内容,基于表格结构还原方法,输出表格的语义结构。本发明能够减少人工识别表格带来的时间损耗,深入利用表格图片信息,提升表格还原效果。
-
公开(公告)号:CN107679154A
公开(公告)日:2018-02-09
申请号:CN201710888726.7
申请日:2017-09-27
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明提供了一种基于时间轴的历史题解题方法、系统及介质,该历史题解题方法包括:时间轴知识库构建步骤、历史词条时间字典构建步骤、问题时间属性分析步骤、相关词条筛选步骤、基于时间轴的文档片段筛选步骤、候选答案生成步骤。本发明的有益效果是:本发明通过构建的时间轴知识库和历史词条时间字典,自动地发现历史简答题题目中的时间信息,并将问题分类为时间限定类问题和非时间限定类问题。对于时间限定类问题,在生成候选答案的过程中加入基于时间轴的时间判断方法,生成和问题中时间相符合的候选答案。避免因为时间信息的遗漏而导致候选答案和问题的时间节点不符。
-
公开(公告)号:CN104035972B
公开(公告)日:2017-06-06
申请号:CN201410216252.8
申请日:2014-05-21
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明提供了一种基于微博的知识推荐方法及系统,该知识推荐方法包括如下步骤:用户建模、定时批量采集用户关注好友发布的微博、知识条目发现、知识条目扩展、知识推荐。本发明的有益效果是本发明提出一种基于微博的知识推荐方法与系统,从用户关注好友所发布的微博数据中自动发现各类知识条目,对知识条目形成扩展解释,在用户阅读微博时,向用户推荐所发现知识条目中对其有价值或其感兴趣的知识条目及相关扩展解释,提供主动的、个性化的知识服务,既能免去了用户的知识检索过程又能避免有价值信息被淹没。
-
公开(公告)号:CN103823824B
公开(公告)日:2017-04-05
申请号:CN201310314269.2
申请日:2013-11-12
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
Abstract: 本发明公开了一种借助互联网自动构建文本分类语料库的方法及系统,该方法包括如下步骤:用户提供所需的文本类别体系,网站结构与内容的采集整理,用户输入类别与网站结构的匹配,语料库去噪,输出语料库。本发明的技术效果是:利用互联网上各类网站上存在的类别标注信息,无需专业的人员手工标注,自适应不同用户的分类体系需求。它改变了传统的语料库构建系统需要大量的具有一定专业知识的人员加入标注的方式,采用对互联网上的丰富信息进行自动的抽取和挖掘的方式,可快速的构建出大容量的精准的文本分类语料库。
-
公开(公告)号:CN102012748B
公开(公告)日:2012-06-27
申请号:CN201010566505.6
申请日:2010-11-30
Applicant: 哈尔滨工业大学
IPC: G06F3/023
Abstract: 语句级中英文混合输入方法,本发明涉及信息输入方法,尤其涉及一种中英文混合语句输入方法。它解决了现有的中英文混合输入方法采用手工标示输入的字母串中哪些需要转换成中文哪些是英文单词,无法保证连续的语句输入的问题。它包括下述步骤:用键盘输入字符串;由输入法管理系统对字符串进行中英文切分;所做的中英文切分是基于中文拼音库和英文词库的自动识别;输入法管理系统对切分后的字符串分别进行相应的中文和英文字符转换,并提供混合语句候选和中英文词语候选;所做出的中文和英文字符转换是基于中文词库和中英文统计库的自动识别;从通过插入、删除、选择等编辑命令,最终从候选列表中选定输出内容;输出中英文混合语句。用于文字输入。
-
-
-
-
-
-
-
-
-