-
公开(公告)号:CN101452444B
公开(公告)日:2010-12-08
申请号:CN200810009074.6
申请日:2008-01-26
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明涉及信息编辑处理技术,具体涉及一种对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息根据编辑指令进行快速编辑排版的方法。通过将手写体信息进行切分或合并处理成独立信息单元,并将处理后的手写体信息进行编码,建立支持编辑操作的索引,并通过执行编辑指令实现在编辑后对受编辑影响的信息单元进行自动排版。本发明有效的解决了对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息进行编辑完成后,不能实现再排版,影响文档整体性的技术问题;系统对编辑过程中输入的编辑符识别准确、高效、识别错误率低。
-
公开(公告)号:CN101261635B
公开(公告)日:2010-09-01
申请号:CN200810066892.X
申请日:2008-04-29
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
Abstract: 本发明涉及一种被动式网络信息自动高效采集系统及方法,所述网络信息自动高效采集系统包括:运行于信息需求端的信息采集工作部;运行于信息提供端的信息收集发送工作部;所述信息采集工作部与所述信息收集发送工作部为通信连接关系。所述网络信息自动高效采集方法包括步骤:将所述信息采集工作部与所述信息收集发送工作部建立有效的联系;所述信息采集工作部根据所述信息收集发送工作部的通知或定期获取所述信息收集发送工作部内存储的所述信息提供端信息。将本发明技术应用于搜索引擎中后,能及时、快速、高效的获取互联网上的文本信息和音频、视频特征信息等网站相关内容,并可显著降低系统开销以及网络带宽占用量。
-
公开(公告)号:CN100578432C
公开(公告)日:2010-01-06
申请号:CN200810144531.2
申请日:2008-07-22
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明涉及信息输入技术,具体涉及一种不经过信息识别、选取过程,将所述信息进行切分或合并成独立信息单元后直接在显示构件上进行原手写体笔迹显示的一种直接写入手写体信息的方法。该方法由操作者通过输入构件写入手写体信息;通过系统对用户写入的所述手写体信息进行捕捉并将该手写体信息进行切分或合并成独立信息单元,然后在显示构件上进行原笔迹显示,通过该方法输入的手写体更便于编辑操作。本发明中所述直接写入手写体信息的方法更适合汉字和特殊字符和公式的输入,大大提高了信息输入的效率,并且保留了书写者的原字体,使常用非正式文档更具有个性化特点。
-
公开(公告)号:CN101261635A
公开(公告)日:2008-09-10
申请号:CN200810066892.X
申请日:2008-04-29
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
Abstract: 本发明涉及一种被动式网络信息自动高效采集系统及方法,所述网络信息自动高效采集系统包括:运行于信息需求端的信息采集工作部;运行于信息提供端的信息收集发送工作部;所述信息采集工作部与所述信息收集发送工作部为通信连接关系。所述网络信息自动高效采集方法包括步骤:将所述信息采集工作部与所述信息收集发送工作部建立有效的联系;所述信息采集工作部根据所述信息收集发送工作部的通知或定期获取所述信息收集发送工作部内存储的所述信息提供端信息。将本发明技术应用于搜索引擎中后,能及时、快速、高效的获取互联网上的文本信息和音频、视频特征信息等网站相关内容,并可显著降低系统开销以及网络带宽占用量。
-
公开(公告)号:CN112036137B
公开(公告)日:2025-02-18
申请号:CN202010879503.6
申请日:2020-08-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F40/171 , G06T3/04 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种基于深度学习的多风格书法数字墨水仿真方法和系统,该方法包括:对输入图像进行预处理,得到经过预处理的输入图像;初始化风格特征向量;提取输入图像特征,并将其与风格特征向量初步融合;使用特征融合网络进一步融合输入图像特征和风格特征向量;使用解码器解码,生成具有输入图像笔画结构和指定书法风格的图像;根据真实图像与生成图像计算损失函数,并通过反向传播训练网络。采用本发明的技术方案,不需要繁琐的步骤,实现了端到端的书法数字墨水仿真;而且可轻易支持多种风格的仿真,并且仿真效果更加真实、自然;不仅可以用于书法数字墨水仿真,也可以用于变换纸张书写图像或计算机字体图像的风格,用途更加广泛。
-
公开(公告)号:CN109800411B
公开(公告)日:2023-07-18
申请号:CN201811476992.X
申请日:2018-12-03
Applicant: 哈尔滨工业大学(深圳)
IPC: G06N5/025 , G06F16/35 , G06F40/211 , G06F40/216 , G06F40/253 , G06F40/268 , G06F40/284 , G06F40/30 , G06N3/0442 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/048
Abstract: 本申请涉及一种临床医疗实体及其属性抽取方法。该方法包括:3个模块:(1)预处理;(2)句子的信息全面性表示;(3)临床医疗实体及其属性抽取的联合学习。其中联合学习方法主要包括两种方式:(1)串行联合方式;(2)并行联合方式。串行联合方式又分为3个子模块:(1)临床医疗实体‑属性识别;(2)临床医疗实体‑属性关系抽取;(3)联合学习;并行联合方式是采用序列标注的方法进行临床医疗实体及其属性联合抽取。该方法对临床医疗辅助决策、临床医疗研究等具有重要意义。
-
公开(公告)号:CN107977361B
公开(公告)日:2021-05-18
申请号:CN201711278996.2
申请日:2017-12-06
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F40/295 , G06F40/30 , G06F40/242 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于深度语义信息表示的中文临床医疗实体识别方法,包括两部分内容:1)中文临床医疗实体的表示方法;2)中文临床医疗实体的识别方法。表示方法包括以下两种:单标签表示和多标签表示。识别方法融入基于医疗领域偏旁部首信息的汉字表示方法,基于CNN获取医疗文本的局部语义信息,基于双向LSTM获取医疗文本的全局语义,并基于Attention机制对句子中不同词的语义信息进行选择。本发明继承了深度学习的优势,具有较少人工特征干预及更高的准确率和召回率等优点。
-
公开(公告)号:CN112100426A
公开(公告)日:2020-12-18
申请号:CN202011004577.1
申请日:2020-09-22
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/58 , G06F16/583 , G06K9/00
Abstract: 本发明所提供的基于视觉和文本特征的通用表格信息检索的方法与系统,该方法包括输入格式标准化、表格内容索引、基本内容单元的向量化表示、查询的向量化表示、融合视觉特征的表格信息检索、内容单元合并、答案筛选并返回。基于本发明所述通用表格信息检索方法与系统可以用于以电子文档、网页、PDF和图片等多种格式出现的表格,本发明在现有基于文本特征的表格问答系统的基础上,联合表格的视觉特征,如表格的框线、基本内容单元的坐标、文本的字体、颜色和缩进等,自动根据所提问题对存在丰富视觉信息的非规范化表格进行信息检索,极大提升了对文档的检索能力,且提高了检索结果的精确度。
-
公开(公告)号:CN107679154B
公开(公告)日:2020-04-21
申请号:CN201710888726.7
申请日:2017-09-27
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F16/332 , G06F16/33 , G06F16/31 , G06F16/35 , G06N5/02
Abstract: 本发明提供了一种基于时间轴的历史题解题方法、系统及介质,该历史题解题方法包括:时间轴知识库构建步骤、历史词条时间字典构建步骤、问题时间属性分析步骤、相关词条筛选步骤、基于时间轴的文档片段筛选步骤、候选答案生成步骤。本发明的有益效果是:本发明通过构建的时间轴知识库和历史词条时间字典,自动地发现历史简答题题目中的时间信息,并将问题分类为时间限定类问题和非时间限定类问题。对于时间限定类问题,在生成候选答案的过程中加入基于时间轴的时间判断方法,生成和问题中时间相符合的候选答案。避免因为时间信息的遗漏而导致候选答案和问题的时间节点不符。
-
公开(公告)号:CN109800411A
公开(公告)日:2019-05-24
申请号:CN201811476992.X
申请日:2018-12-03
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本申请涉及一种临床医疗实体及其属性抽取方法。该方法包括:3个模块:(1)预处理;(2)句子的信息全面性表示;(3)临床医疗实体及其属性抽取的联合学习。其中联合学习方法主要包括两种方式:(1)串行联合方式;(2)并行联合方式。串行联合方式又分为3个子模块:(1)临床医疗“实体/属性”识别;(2)临床医疗“实体-属性”关系抽取;(3)联合学习;并行联合方式是采用序列标注的方法进行临床医疗实体及其属性联合抽取。该方法对临床医疗辅助决策、临床医疗研究等具有重要意义。
-
-
-
-
-
-
-
-
-