一种基于微博的知识推荐方法与系统

    公开(公告)号:CN104035972A

    公开(公告)日:2014-09-10

    申请号:CN201410216252.8

    申请日:2014-05-21

    CPC classification number: G06F17/30864 H04L51/32

    Abstract: 本发明提供了一种基于微博的知识推荐方法及系统,该知识推荐方法包括如下步骤:用户建模、定时批量采集用户关注好友发布的微博、知识条目发现、知识条目扩展、知识推荐。本发明的有益效果是本发明提出一种基于微博的知识推荐方法与系统,从用户关注好友所发布的微博数据中自动发现各类知识条目,对知识条目形成扩展解释,在用户阅读微博时,向用户推荐所发现知识条目中对其有价值或其感兴趣的知识条目及相关扩展解释,提供主动的、个性化的知识服务,既能免去了用户的知识检索过程又能避免有价值信息被淹没。

    一种基于n元图片索引结构的图片检索方法与系统

    公开(公告)号:CN103853797A

    公开(公告)日:2014-06-11

    申请号:CN201210523756.5

    申请日:2012-12-07

    CPC classification number: G06F17/30268

    Abstract: 本发明公开了一种基于n元图片索引结构的图片检索方法与系统,涉及图像检索技术领域。本发明公开的方法包括:收到用户的检索操作时,判断用户输入的检索内容的形式为文本形式,则对用户输入的文本进行基于n元图片索引的文本内部向量化处理,利用处理结果在文本标签内的索引下进行图片检索,用户输入的检索内容的形式为图片形式时,对用户输入的图片进行基于n元图片索引结构的图片语义自动标注,提取n元图片,针对提取的n元图片的TF-IDF特征向量在语义标注的文本标签内的索引中进行图片检索,最后将检索到的图片按照相似度排序并输出。本发明还公开了基于n元图片索引结构的图片检索系统。本申请技术方案提高了检索效率和效果。

    一种直接写入手写体信息的方法

    公开(公告)号:CN101334701A

    公开(公告)日:2008-12-31

    申请号:CN200810144531.2

    申请日:2008-07-22

    Abstract: 本发明涉及信息输入技术,具体涉及一种不经过信息识别、选取过程,将所述信息进行切分或合并成独立信息单元后直接在显示构件上进行原手写体笔迹显示的一种直接写入手写体信息的方法。该方法由操作者通过输入构件写入手写体信息;通过系统对用户写入的所述手写体信息进行捕捉并将该手写体信息进行切分或合并成独立信息单元,然后在显示构件上进行原笔迹显示,通过该方法输入的手写体更便于编辑操作。本发明中所述直接写入手写体信息的方法更适合汉字和特殊字符和公式的输入,大大提高了信息输入的效率,并且保留了书写者的原字体,使常用非正式文档更具有个性化特点。

    一种基于类标编码表示的复杂场景文字识别方法及系统

    公开(公告)号:CN112036290B

    公开(公告)日:2023-11-03

    申请号:CN202010878323.6

    申请日:2020-08-27

    Abstract: 本发明提供了一种基于类标编码表示的复杂场景文字识别方法及系统,该方法包括:设计五笔类标编码表示模块,根据设计的五笔类标编码表示模块对字符进行编码;输入场景文字图像进行预处理,得到训练场景文字图像;将训练场景文字图像输入到语义分割网络进行像素级别的分类,得到编码后标签的分类结果;利用概率模块学习五笔类标编码的转移矩阵,训练整个模型,得到场景文字识别模型;将测试图像输入至已训练的场景文字识别模型进行分类,得到最终语义分割图;对语义分割图的像素进行投票,选择具有最高票数的预测作为最终字符识别结果。本发明的技术方案对复杂场景的字符图像具有较高识别准确率,降低了参数和计算的复杂度。

    一种面向领域的图片表格还原方法、系统

    公开(公告)号:CN116152832A

    公开(公告)日:2023-05-23

    申请号:CN202211097009.X

    申请日:2022-09-08

    Abstract: 本发明公开了一种面向领域的图片表格还原方法、系统,对输入图片进行表格检测输出表格区域;并进行文本块切分和识别,得到文本块对应的位置坐标和文本内容;对每个文本块原始图片处理生成掩码图片,将所有文本块原始图片的掩码图片进行拼接,生成表格区域的掩码图片,并输入图片语义分割模型,输出表格行列图片语义分割结果;对分割的列文本合并,并输入文本语义分割模型,得到文本语义单元集合,根据领域知识数据库得到矫正后的文本语义单元集合;根据文本语义单元集合、图片语义分割结果、对应的文本位置和文本内容,基于表格结构还原方法,输出表格的语义结构。本发明能够减少人工识别表格带来的时间损耗,深入利用表格图片信息,提升表格还原效果。

    一种基于时间轴的历史题解题方法、系统及介质

    公开(公告)号:CN107679154A

    公开(公告)日:2018-02-09

    申请号:CN201710888726.7

    申请日:2017-09-27

    Abstract: 本发明提供了一种基于时间轴的历史题解题方法、系统及介质,该历史题解题方法包括:时间轴知识库构建步骤、历史词条时间字典构建步骤、问题时间属性分析步骤、相关词条筛选步骤、基于时间轴的文档片段筛选步骤、候选答案生成步骤。本发明的有益效果是:本发明通过构建的时间轴知识库和历史词条时间字典,自动地发现历史简答题题目中的时间信息,并将问题分类为时间限定类问题和非时间限定类问题。对于时间限定类问题,在生成候选答案的过程中加入基于时间轴的时间判断方法,生成和问题中时间相符合的候选答案。避免因为时间信息的遗漏而导致候选答案和问题的时间节点不符。

    一种基于微博的知识推荐方法与系统

    公开(公告)号:CN104035972B

    公开(公告)日:2017-06-06

    申请号:CN201410216252.8

    申请日:2014-05-21

    Abstract: 本发明提供了一种基于微博的知识推荐方法及系统,该知识推荐方法包括如下步骤:用户建模、定时批量采集用户关注好友发布的微博、知识条目发现、知识条目扩展、知识推荐。本发明的有益效果是本发明提出一种基于微博的知识推荐方法与系统,从用户关注好友所发布的微博数据中自动发现各类知识条目,对知识条目形成扩展解释,在用户阅读微博时,向用户推荐所发现知识条目中对其有价值或其感兴趣的知识条目及相关扩展解释,提供主动的、个性化的知识服务,既能免去了用户的知识检索过程又能避免有价值信息被淹没。

    一种借助互联网自动构建文本分类语料库的方法及系统

    公开(公告)号:CN103823824B

    公开(公告)日:2017-04-05

    申请号:CN201310314269.2

    申请日:2013-11-12

    Abstract: 本发明公开了一种借助互联网自动构建文本分类语料库的方法及系统,该方法包括如下步骤:用户提供所需的文本类别体系,网站结构与内容的采集整理,用户输入类别与网站结构的匹配,语料库去噪,输出语料库。本发明的技术效果是:利用互联网上各类网站上存在的类别标注信息,无需专业的人员手工标注,自适应不同用户的分类体系需求。它改变了传统的语料库构建系统需要大量的具有一定专业知识的人员加入标注的方式,采用对互联网上的丰富信息进行自动的抽取和挖掘的方式,可快速的构建出大容量的精准的文本分类语料库。

    手写体信息快速编辑排版方法

    公开(公告)号:CN101452444B

    公开(公告)日:2010-12-08

    申请号:CN200810009074.6

    申请日:2008-01-26

    Abstract: 本发明涉及信息编辑处理技术,具体涉及一种对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息根据编辑指令进行快速编辑排版的方法。通过将手写体信息进行切分或合并处理成独立信息单元,并将处理后的手写体信息进行编码,建立支持编辑操作的索引,并通过执行编辑指令实现在编辑后对受编辑影响的信息单元进行自动排版。本发明有效的解决了对联机输入状态下手写写入信息和在脱机状态下获取的已有手写文档的扫描信息进行编辑完成后,不能实现再排版,影响文档整体性的技术问题;系统对编辑过程中输入的编辑符识别准确、高效、识别错误率低。

    一种被动式网络信息自动高效采集系统及方法

    公开(公告)号:CN101261635B

    公开(公告)日:2010-09-01

    申请号:CN200810066892.X

    申请日:2008-04-29

    Abstract: 本发明涉及一种被动式网络信息自动高效采集系统及方法,所述网络信息自动高效采集系统包括:运行于信息需求端的信息采集工作部;运行于信息提供端的信息收集发送工作部;所述信息采集工作部与所述信息收集发送工作部为通信连接关系。所述网络信息自动高效采集方法包括步骤:将所述信息采集工作部与所述信息收集发送工作部建立有效的联系;所述信息采集工作部根据所述信息收集发送工作部的通知或定期获取所述信息收集发送工作部内存储的所述信息提供端信息。将本发明技术应用于搜索引擎中后,能及时、快速、高效的获取互联网上的文本信息和音频、视频特征信息等网站相关内容,并可显著降低系统开销以及网络带宽占用量。

Patent Agency Ranking