一种结合业务规则的在线学习停滞预测系统

    公开(公告)号:CN109784578A

    公开(公告)日:2019-05-21

    申请号:CN201910082918.8

    申请日:2019-01-24

    Abstract: 本发明涉及一种结合业务规则的在线学习停滞预测系统,包括:数据加载模块、数据标记模块、特征工程模块、模型训练模块和结果预测模块;数据加载模块:从数据库中读取学生数据;从规则库中读取学习停滞判定规则;数据标记模块:依据学习停滞判定规则标记学生数据,符合学习停滞判定规则的,标记为停滞生;否则,标记为非停滞生;特征工程模块:对学生数据进行特征工程处理,包括特征选择、特征处理和特征归一化;模型训练模块:选择机器学习模型对特征工程处理后的学生数据进行训练,然后根据模型评价指标,选择性能最优的机器学习模型作为学习停滞预测模型;结果预测模块:将待预测学生数据输入到学习停滞预测模型中进行计算,得到预测结果。

    一种面向遥感即时计算的细粒度并行调度方法及系统

    公开(公告)号:CN116894759A

    公开(公告)日:2023-10-17

    申请号:CN202310866366.6

    申请日:2023-07-14

    Abstract: 本发明公开一种面向遥感即时计算的细粒度并行调度方法及系统,属于遥感与计算技术领域。本发明充分挖掘并利用遥感影像数据的特点进行计算优化,提出的择优调度策略能根据遥感算子的执行代价动态智能地选择计算节点的最优执行方式,在节点串行执行和并行执行之间取得一个很好的平衡,适用于绝大多数的计算案例,普适性强,拥有优越的计算性能;本发明实现了在影像级和波段级数据间更细粒度的并行执行,该细粒度的并行对于参与影像数量较大的计算案例能显著提高执行效率。

    一种基于深度度量学习的一人多案关联识别方法及系统

    公开(公告)号:CN112925877A

    公开(公告)日:2021-06-08

    申请号:CN201911241577.0

    申请日:2019-12-06

    Abstract: 本发明涉及一种基于深度度量学习的一人多案关联识别方法及系统。该方法获取待进行一人多案关联识别的起诉状,利用预先训练完成的案件要素识别模型得到案件要素信息;将案件要素信息输入预先训练完成的案件相似度量模型,利用深度学习和度量学习技术计算案件要素信息与候选案件集合中的案件的文本语义相似度,进而判断是否存在一人多案的情况,并按人建立案件关联。该系统包括案件要素识别模块、案件相似度量模块、案件关联识别模块。本发明利用深度度量学习与法律业务规则相结合的方法,实现法院立案‑审判‑执行全流程阶段的一人多案的关联识别,为跨区域跨层级的司法资源统筹提供技术支持,为法院公正、高效地审理和执行案件提供保障。

    迁移场景的配置文件修改方法、系统、设备和存储介质

    公开(公告)号:CN119690497A

    公开(公告)日:2025-03-25

    申请号:CN202411628202.0

    申请日:2024-11-14

    Abstract: 本发明提供一种迁移场景的配置文件修改方法、系统、设备和存储介质,属于数据处理技术领域,方法包括:基于待迁移软件的配置文件,从预先构建的配置参考文件库中确定进行差异比对的参考文件;将配置文件和参考文件同时显示在显示页面上,并执行格式统一处理;突出显示文件之间的差异内容;接收用户基于差异内容对配置文件做出的修改输入;基于修改输入得到可将待迁移软件成功迁移的规范配置文件。本发明通过将多个成功迁移软件的规范配置文件预先集中在配置参考文件库,无需访问各个在线软件仓库,即可快速获取到待迁移软件配置文件的参考文件;并且通过在配置参考文件库内直接获取配置参考文件,能够节省在线下载软件包后提取配置文件的时间,提高批量软件迁移的速度和效率。

    一种基于迁移学习的疾病领域间病人相似性度量迁移系统

    公开(公告)号:CN106934235B

    公开(公告)日:2019-06-11

    申请号:CN201710136858.4

    申请日:2017-03-09

    Abstract: 本发明一种基于迁移学习的疾病领域间病人相似性度量迁移系统,属于计算机人工智能软件技术领域。本发明系统通过构建数据预处理子模块、相似性度量评价子模块、相似性度量学习子模块、相似性度量迁移子模块四个子模块,完成疾病领域内病人相似性的度量和疾病领域间病人相似性的迁移。本发明目的在于克服在监督信息获取困难和特定疾病领域病人样本数量稀少的情况下传统度量学习无法有效工作的问题。此系统可以为当前精准医疗场景提供服务支持。

    一种基于Spark SQL的分布式全文检索系统及方法

    公开(公告)号:CN107122443A

    公开(公告)日:2017-09-01

    申请号:CN201710269870.2

    申请日:2017-04-24

    Abstract: 本发明涉及一种基于Spark SQL的分布式全文检索系统及方法,包括SQL翻译层、数据源管理层、并行计算层、分布式存储层,在SQL翻译层中提出了基于SQL的全文检索文法以及全文检索SQL语句在SQL翻译层各模块间的翻译过程;在数据源管理模块设计了全文检索过程的并行化方法;检索优化模块中,设计了两种索引存储模型和相应的查询时原表数据还原策略,其中基于索引指定列存储模型设计了一种用于在查询时还原原表数据、复杂度为O(n)的分区对齐连接算法。在两种存储模型下,索引构建时间缩短为传统数据库的0.6%/0.5%,查询时间缩短为传统数据库的1%/10%,索引存储量减少为传统数据库的55.0%。增强了Spark SQL数据分析功能,能够满足传统业务迁移和现有业务对海量数据进行全文检索的需求。

    一种基于深度学习的空间数据索引智能选择方法及系统

    公开(公告)号:CN119272087A

    公开(公告)日:2025-01-07

    申请号:CN202411263584.1

    申请日:2024-09-10

    Abstract: 本发明公开一种基于深度学习的空间数据索引智能选择方法及系统,属于空间大数据技术领域。所述方法包括:生成包含不同空间分布的合成空间数据集,所述合成空间数据集具有的特征还包括:数据倾斜特征和/或数据重叠特征;计算所述合成空间数据集的特征降维表示;在所述合成空间数据集上进行不同空间索引组合的空间查询,并根据空间索引组合所对应的性能表现得到标记数据;使用空间数据集的降维特征表示和标记数据进行有监督的机器学习训练,得到空间索引智能选择模型;基于所述空间索引智能选择模型获取空间数据的最优空间数据索引。本发明不仅可以提升空间大数据处理框架的空间查询效率,还可以应用于Apache Sedona这一空间大数据处理框架的典型代表中。

    一种基于Spark SQL的分布式全文检索系统及方法

    公开(公告)号:CN107122443B

    公开(公告)日:2019-09-17

    申请号:CN201710269870.2

    申请日:2017-04-24

    Abstract: 本发明涉及一种基于Spark SQL的分布式全文检索系统及方法,包括SQL翻译层、数据源管理层、并行计算层、分布式存储层,在SQL翻译层中提出了基于SQL的全文检索文法以及全文检索SQL语句在SQL翻译层各模块间的翻译过程;在数据源管理模块设计了全文检索过程的并行化方法;检索优化模块中,设计了两种索引存储模型和相应的查询时原表数据还原策略,其中基于索引指定列存储模型设计了一种用于在查询时还原原表数据、复杂度为O(n)的分区对齐连接算法。在两种存储模型下,索引构建时间缩短为传统数据库的0.6%/0.5%,查询时间缩短为传统数据库的1%/10%,索引存储量减少为传统数据库的55.0%。增强了Spark SQL数据分析功能,能够满足传统业务迁移和现有业务对海量数据进行全文检索的需求。

    软件包构建错误分析方法、装置、设备及介质

    公开(公告)号:CN119847807A

    公开(公告)日:2025-04-18

    申请号:CN202510325161.6

    申请日:2025-03-19

    Abstract: 本发明提供一种软件包构建错误分析方法、装置、设备及介质,涉及人工智能技术领域,其中方法包括:获取目标软件包向RISC‑V架构迁移的日志数据;基于各日志行之间的向量距离,对日志数据进行分块,并从得到的多个日志块中确定包含错误信息的多个错误日志块;基于知识库以及大语言模型,确定各错误日志块的错误原因。通过思维链引导大语言模型先进行初步分类,然后引导大语言模型,对各错误类别的错误日志块进行深度分析,实现了错误原因的自动确定过程,提升了错误原因确定的效率。基于初步分类再进一步分析实现错误原因的确定过程,可以将注意力集中在特定的错误类别上,可以更快地定位到错误原因,提升效率。

Patent Agency Ranking