-
公开(公告)号:CN109934251A
公开(公告)日:2019-06-25
申请号:CN201811615581.4
申请日:2018-12-27
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 北京天融信网络安全技术有限公司
IPC: G06K9/62
Abstract: 本发明涉及一种用于小语种文本识别的方法,包括以下步骤:S1.构建来源于不同语种的训练文本集;S2.对训练文本集中的文本进行基于字节的N-gramrank特征的提取;S3.对训练文本集中的文本进行基于互信息的度量特征的提取,即计算文本中的所有信息字节在单个语种中的信息度量;S4.对训练文本集中的文本进行基于转移概率的概率特征的提取,即计算文本中所有相邻字节能在单个语种中表达完整信息的概率;S5.利用步骤S2~S4提取的特征训练分类器;S6.对待识别的文本按照步骤S2~S4进行特征的提取,然后将提取的特征输入分类器中进行识别,分类器输出语种识别结果。
-
公开(公告)号:CN111639703B
公开(公告)日:2023-11-14
申请号:CN202010471807.9
申请日:2020-05-29
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F18/23213 , H04W64/00 , H04W16/18
Abstract: 本发明涉及通信技术领域,更具体地,涉及一种基于离散点集最小包围圆计算基站位置的方法,包括以下步骤:S1,采集基站终端位置数据,建立数据采集点集合P;S2,对数据采集点集合P中异常的数据进行清洗;S3,计算数据采集点集合P的最小包围圆,将最小包围圆的圆心作为待处理基站的最终位置;S4,判断是否为非全向基站,若否,直接进入步骤S5,若是,对临近小区的基站进行K‑means聚类计算,获得临近小区非全向基站的最终基站位置;S5,对多次计算获得历史基站位置进行K‑means聚类调优,本发明通过综合K‑means聚类算法和最小包围圆算法两种算法的优点,在最大减少信息依赖的情况下,较准确计算获得基站的位置数据,最终构建出一份已有基站的较准确位置信息清单。
-
公开(公告)号:CN111639703A
公开(公告)日:2020-09-08
申请号:CN202010471807.9
申请日:2020-05-29
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及通信技术领域,更具体地,涉及一种基于离散点集最小包围圆计算基站位置的方法,包括以下步骤:S1,采集基站终端位置数据,建立数据采集点集合P;S2,对数据采集点集合P中异常的数据进行清洗;S3,计算数据采集点集合P的最小包围圆,将最小包围圆的圆心作为待处理基站的最终位置;S4,判断是否为非全向基站,若否,直接进入步骤S5,若是,对临近小区的基站进行K-means聚类计算,获得临近小区非全向基站的最终基站位置;S5,对多次计算获得历史基站位置进行K-means聚类调优,本发明通过综合K-means聚类算法和最小包围圆算法两种算法的优点,在最大减少信息依赖的情况下,较准确计算获得基站的位置数据,最终构建出一份已有基站的较准确位置信息清单。
-
公开(公告)号:CN119647592A
公开(公告)日:2025-03-18
申请号:CN202411708934.0
申请日:2024-11-27
Applicant: 国家计算机网络与信息安全管理中心广东分中心
IPC: G06N5/04 , G06F18/21 , G06F18/241 , G06F18/2431 , G06F18/25
Abstract: 本申请涉及计算机技术应用领域,具体涉及一种结构化预测任务中大模型幻觉的消除方法、设备及介质。本申请方案根据任务属性类别配置模型集合并行处理机制,将多路大模型结果合并到判别筛选引擎进行量化评估,通过调整引擎参数和预设阈值控制输出的期望,从而让任务的执行结果更符合实际需求。利用大模型幻觉本身具有的随机性,在出现幻觉的任务结果中,形成对大模型幻觉的自动化纠错能力,降低幻觉现象对预测任务的不良影响。进一步地,提供基于信息熵的可信度量计算及结果筛选优化方案,利用信息熵可以更好地筛选出与目标问题相关的特征,提升任务执行的效率,并消除了部分模型可能产生幻觉现象的影响,提升了任务执行结果的准确率。
-
公开(公告)号:CN109934251B
公开(公告)日:2021-08-06
申请号:CN201811615581.4
申请日:2018-12-27
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 北京天融信网络安全技术有限公司
IPC: G06K9/62
Abstract: 本发明涉及一种用于小语种文本识别的方法,包括以下步骤:S1.构建来源于不同语种的训练文本集;S2.对训练文本集中的文本进行基于字节的N‑gramrank特征的提取;S3.对训练文本集中的文本进行基于互信息的度量特征的提取,即计算文本中的所有信息字节在单个语种中的信息度量;S4.对训练文本集中的文本进行基于转移概率的概率特征的提取,即计算文本中所有相邻字节能在单个语种中表达完整信息的概率;S5.利用步骤S2~S4提取的特征训练分类器;S6.对待识别的文本按照步骤S2~S4进行特征的提取,然后将提取的特征输入分类器中进行识别,分类器输出语种识别结果。
-
-
-
-