-
公开(公告)号:CN119272087A
公开(公告)日:2025-01-07
申请号:CN202411263584.1
申请日:2024-09-10
Applicant: 中国科学院软件研究所
Abstract: 本发明公开一种基于深度学习的空间数据索引智能选择方法及系统,属于空间大数据技术领域。所述方法包括:生成包含不同空间分布的合成空间数据集,所述合成空间数据集具有的特征还包括:数据倾斜特征和/或数据重叠特征;计算所述合成空间数据集的特征降维表示;在所述合成空间数据集上进行不同空间索引组合的空间查询,并根据空间索引组合所对应的性能表现得到标记数据;使用空间数据集的降维特征表示和标记数据进行有监督的机器学习训练,得到空间索引智能选择模型;基于所述空间索引智能选择模型获取空间数据的最优空间数据索引。本发明不仅可以提升空间大数据处理框架的空间查询效率,还可以应用于Apache Sedona这一空间大数据处理框架的典型代表中。
-
公开(公告)号:CN115408517A
公开(公告)日:2022-11-29
申请号:CN202210863424.5
申请日:2022-07-21
Applicant: 中国科学院软件研究所
Abstract: 本发明提供了一种基于知识注入的双注意力网络的多模态讽刺意图识别方法,该方法包括:获取待识别数据内容,所述待识别数据内容包括若干 对;对文本中的词和图片中的对象进行编码,得到原始表示;基于待识别数据内容的隐性上下文信息对原始表示进行扩展,得到上下文感知表示;获取原始表示与上下文感知表示的注意力计算结果;根据注意力计算结果,计算原始跨模态对比表示和上下文感知跨模态对比表示;基于所述原始跨模态对比表示和所述上下文感知跨模态对比表示,计算讽刺意图识别结果。本发明有助于提高讽刺识别的整体性能,方便模型的实际应用,并对预测结果提供可解释性。
-
公开(公告)号:CN113763953A
公开(公告)日:2021-12-07
申请号:CN202111043123.X
申请日:2021-09-07
Applicant: 中国科学院软件研究所
IPC: G10L15/22 , G10L15/26 , G06F40/232 , G06F3/16 , G06F3/023 , G06F3/0354
Abstract: 本发明公开了一种基于连续语音与轨迹纠错的多通道输入方法及终端设备。本方法为:1)终端设备将采集的语音信号发送给语音识别模块;2)语音识别模块将所述语音信号转化为文本识别结果,并对该文本识别结果中的每个字、词生成一对应的候选字、词列表;然后在终端设备的文本输出区域显示出该文本识别结果;3)当用户判定该文本识别结果中出现错误字或错误词时,在所述错误字或所述错误词的首字上绘制对应正确目标字的特征笔划轨迹;4)根据错误字、词及其对应的所述特征笔划轨迹,从对应候选字、词列表中过滤出目标输入字或错误词替换对应的错误字或错误词,得到最终的输出。本发明可以在保持输入自然性的同时提高输入的效率。
-
公开(公告)号:CN112926567A
公开(公告)日:2021-06-08
申请号:CN202110225996.6
申请日:2021-03-01
Applicant: 中国科学院软件研究所 , 鸿合科技股份有限公司
Abstract: 本发明公开了一种基于用户反馈信息的在线手写公式识别方法及装置,在现有的识别方法中引入删除操作、补笔操作和/或结构性移动操作等用户参与。借助人机混合智能的思想,在“字符分割—字符识别—结构分析”识别方法的不同阶段融合了用户反馈信息,并设计了适用于用户书写和错误纠正的交互技术。本发明设计出适用于草图识别的交互手段,避免了以图像处理为主的公式识别方法会遇到的各种问题,为用户修改存在笔误或歧义的笔划,公式的结构错误等提供基本保障,提高了公式识别率的效果,满足了用户的需求。
-
公开(公告)号:CN112633243A
公开(公告)日:2021-04-09
申请号:CN202011640177.X
申请日:2020-12-31
Applicant: 安徽鸿程光电有限公司 , 中国科学院软件研究所
IPC: G06K9/00 , G06K9/34 , G06F40/253
Abstract: 本申请公开了一种信息识别方法、装置、设备及计算机存储介质。该信息识别方法包括:在连续的信息输入过程中,获取当前输入笔画;获取所述当前输入笔画与所述信息输入过程中各个历史输入笔画之间的相关性特征;根据所述历史输入笔画、所述当前输入笔画和所述相关性特征,生成可允许分割集合;识别所述可允许分割集合的每个第一子集,得到至少一个所述第一子集对应的第一字符及其识别概率;根据所述第一字符及其识别概率以及所述历史输入笔画的历史识别信息,确定所述信息输入过程中所有笔画的识别结果。本申请能够有效利用了已有的历史识别信息进行信息识别,减少了识别输入信息的时间,提高了识别效率。
-
公开(公告)号:CN107122443B
公开(公告)日:2019-09-17
申请号:CN201710269870.2
申请日:2017-04-24
Applicant: 中国科学院软件研究所
IPC: G06F16/33
Abstract: 本发明涉及一种基于Spark SQL的分布式全文检索系统及方法,包括SQL翻译层、数据源管理层、并行计算层、分布式存储层,在SQL翻译层中提出了基于SQL的全文检索文法以及全文检索SQL语句在SQL翻译层各模块间的翻译过程;在数据源管理模块设计了全文检索过程的并行化方法;检索优化模块中,设计了两种索引存储模型和相应的查询时原表数据还原策略,其中基于索引指定列存储模型设计了一种用于在查询时还原原表数据、复杂度为O(n)的分区对齐连接算法。在两种存储模型下,索引构建时间缩短为传统数据库的0.6%/0.5%,查询时间缩短为传统数据库的1%/10%,索引存储量减少为传统数据库的55.0%。增强了Spark SQL数据分析功能,能够满足传统业务迁移和现有业务对海量数据进行全文检索的需求。
-
公开(公告)号:CN104866096B
公开(公告)日:2018-01-05
申请号:CN201510254390.X
申请日:2015-05-18
Applicant: 中国科学院软件研究所
IPC: G06F3/01 , G06F3/0484 , G06F3/0487
Abstract: 本发明公开了一种利用上臂伸展信息进行命令选择的方法。本方法为:1)在控制器上创建一Stretching组件及其菜单;2)控制器通过显示屏幕上的深度摄像机实时采集该用户手心的三维空间位置,然后计算手心位置到该用户身体平面的投影距离,得到该用户的手臂伸展长度并将其发送给Stretching组件;3)该组件将该用户的手臂伸展长度转换为屏幕上光标在所述菜单上的显示位置;4)用户通过改变手臂伸展长度控制光标移动,当光标移动到所述菜单上的一待选菜单项时,保持手势悬停时间大于设定时间,则该菜单项被选中。本发明不使用佩戴式传感器,基于深度摄像机,使用上臂伸展信息来进行菜单命令选择的方法,不影响手指精细动作。
-
公开(公告)号:CN107273677A
公开(公告)日:2017-10-20
申请号:CN201710425674.X
申请日:2017-06-08
Applicant: 中国科学院软件研究所
CPC classification number: G06K9/6289
Abstract: 本发明公开了一种多通道神经功能定量评价系统,利用智能感知、多通道融合、自然交互等关键技术,使用深度摄像机、手持终端、手写终端、麦克风、数据转发器、移动工作站等设备搭建完成一套人体运动姿态数据采集系统,将感知、运动、认知的医学检测方法与多通道数据融合分析技术相结合,建立涵盖笔势分析、步态分析、语音分析、上肢功能分析等神经系统疾病异常行为早期检测的多通道神经功能定量评价系统,克服了传统的神经系统疾病检测工具方式难以获取较全面的、定量化的生理参数的问题,并消除了传统采集方式具有的干扰性对感知数据的真实性和后续诊断的准确性的影响。
-
公开(公告)号:CN105069560A
公开(公告)日:2015-11-18
申请号:CN201510457976.6
申请日:2015-07-30
Applicant: 中国科学院软件研究所
Abstract: 本发明涉及一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法,通过知识匹配和语义推理方法来实现对履历信息提取,得出履历中所隐含的工作时间、工作地点、工作单位、工作职位等信息;并可在此基础上对提取结果按照一定规则进行特征标识,支持基于领域特征进行履历的语义搜索。本发明提高了信息提取的正确率,实现对履历的自动化特征标识。
-
公开(公告)号:CN103761111A
公开(公告)日:2014-04-30
申请号:CN201410056681.3
申请日:2014-02-19
Applicant: 中国科学院软件研究所
Abstract: 一种基于BPEL语言构建数据密集型工作流引擎的方法及其系统,包括建立基于规则的模型转换框架;建立部署执行层面的转换框架;根据Hadoop工作流模型生成BPEL流程模型,部署到BPEL引擎执行。本发明支持采用BPEL语言定义复杂的Hadoop工作流;方便企业将Hadoop工作流集成入企业内部系统或者将企业内部服务集成入Hadoop工作流,可以满足企业在业务流程中处理海量数据的需求。
-
-
-
-
-
-
-
-
-