-
公开(公告)号:CN113704477B
公开(公告)日:2022-10-18
申请号:CN202111030020.X
申请日:2021-09-03
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
IPC: G06F16/35 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种文本识别中识别网络与语言模型的联合优化方法,包括:采集文本数据,将文本数据划分为训练集和测试集,并设置文本行标签;构建识别网络,将文本数据输入识别网络,获得第一概率分布;构建语言模型,将概率分布输入语言模型,通过建模语义,获得第二概率分布;将训练集和文本行标签输入由识别网络和语言模型串联组成的网络进行训练,获得目标网络;将测试集和文本行标签输入目标网络,获得识别结果。本发明利用识别网络和语言模型的联合优化,大大提升了识别的精度,并且适用于不同机制的识别网络。该方案在各个公开的数据集上达到了较高的准确率,具有极高的实用性和应用价值。
-
公开(公告)号:CN113705713A
公开(公告)日:2021-11-26
申请号:CN202111029998.4
申请日:2021-09-03
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本发明公开了一种基于全局和局部注意力机制的文本识别方法,具体包括如下步骤:使用合成数据以及公开的真实文本行作为训练数据,使用真实场景下采集的文本行作为测试数据;对所有训练和测试样本进行数据预处理;采用有监督的方法训练识别模型,每个文本行都有对应的文本信息;采用卷积层和自注意力层等结构设计识别网络;将训练数据和标签输入到识别网络中进行训练;输入测试数据到训练完成的网络中,得到识别结果。本发明利用全局和局部注意力网络实现文本行识别,能够识别各种场景下复杂多样的联机和脱机文本,并在各个公开的数据集上达到了较高的准确率,具有极高的实用性和应用价值。
-
公开(公告)号:CN113705713B
公开(公告)日:2023-08-22
申请号:CN202111029998.4
申请日:2021-09-03
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本发明公开了一种基于全局和局部注意力机制的文本识别方法,具体包括如下步骤:使用合成数据以及公开的真实文本行作为训练数据,使用真实场景下采集的文本行作为测试数据;对所有训练和测试样本进行数据预处理;采用有监督的方法训练识别模型,每个文本行都有对应的文本信息;采用卷积层和自注意力层等结构设计识别网络;将训练数据和标签输入到识别网络中进行训练;输入测试数据到训练完成的网络中,得到识别结果。本发明利用全局和局部注意力网络实现文本行识别,能够识别各种场景下复杂多样的联机和脱机文本,并在各个公开的数据集上达到了较高的准确率,具有极高的实用性和应用价值。
-
公开(公告)号:CN113704477A
公开(公告)日:2021-11-26
申请号:CN202111030020.X
申请日:2021-09-03
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
IPC: G06F16/35 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种文本识别中识别网络与语言模型的联合优化方法,包括:采集文本数据,将文本数据划分为训练集和测试集,并设置文本行标签;构建识别网络,将文本数据输入识别网络,获得第一概率分布;构建语言模型,将概率分布输入语言模型,通过建模语义,获得第二概率分布;将训练集和文本行标签输入由识别网络和语言模型串联组成的网络进行训练,获得目标网络;将测试集和文本行标签输入目标网络,获得识别结果。本发明利用识别网络和语言模型的联合优化,大大提升了识别的精度,并且适用于不同机制的识别网络。该方案在各个公开的数据集上达到了较高的准确率,具有极高的实用性和应用价值。
-
公开(公告)号:CN113723330B
公开(公告)日:2023-11-07
申请号:CN202111039933.8
申请日:2021-09-06
Applicant: 华南理工大学
IPC: G06V30/412 , G06V30/413 , G06V30/19 , G06V10/82 , G06N3/0464 , G06V10/80 , G06T5/30 , G06F40/30 , G06V10/764
Abstract: 本发明公开了一种图表文档信息理解的方法及系统,包括:采集初始图表文档,对所述初始图表文档进行分类,获得第一图表文档;对所述第一图表文档进行文本检测和识别,获得第二图表文档;对所述第二图表文档进行文本属性分类,获得目标图表文档;基于所述目标图表文档实现对图表文档信息的理解。本发明提出的图表文档信息理解的方法及系统,可以有效对图表文档进行分类,文本检测和识别,以及文本属性分类,对于机器自动化提取、分析、理解图表文档内容信息有重大的作用和意义。
-
公开(公告)号:CN107343265B
公开(公告)日:2023-07-18
申请号:CN201710699977.0
申请日:2017-08-16
Applicant: 华南理工大学
IPC: H04W4/02 , H04W4/33 , G01S5/16 , H04B10/116
Abstract: 本发明公开了一种基于最大似然估计的可见光定位系统及方法,所述系统包括三个发射端、信道和接收端,所述每个发射端包括正弦波发生模块、OFDM发射端模块、数‑模转换模块、LED驱动器和一盏LED灯具;所述信道为室内光信道,每盏LED灯具发射的光信号通过信道传输到接收端的PIN光电检测器;所述接收端包括PIN光电检测器、放大滤波电路、OFDM接收端模块、模‑数转换模块和最大似然估计模块;所述正弦波发生模块、OFDM发射端模块、数‑模转换模块、LED驱动器和LED灯具依次连接;所述PIN光电检测器、放大滤波电路、OFDM接收端模块、模‑数转换模块和最大似然估计模块依次连接。本发明能够更加精确地测量发射端和接收端的距离,达到了精确定位的效果。
-
公开(公告)号:CN113723330A
公开(公告)日:2021-11-30
申请号:CN202111039933.8
申请日:2021-09-06
Applicant: 华南理工大学
Abstract: 本发明公开了一种图表文档信息理解的方法及系统,包括:采集初始图表文档,对所述初始图表文档进行分类,获得第一图表文档;对所述第一图表文档进行文本检测和识别,获得第二图表文档;对所述第二图表文档进行文本属性分类,获得目标图表文档;基于所述目标图表文档实现对图表文档信息的理解。本发明提出的图表文档信息理解的方法及系统,可以有效对图表文档进行分类,文本检测和识别,以及文本属性分类,对于机器自动化提取、分析、理解图表文档内容信息有重大的作用和意义。
-
公开(公告)号:CN108462534A
公开(公告)日:2018-08-28
申请号:CN201810184129.0
申请日:2018-03-07
Applicant: 华南理工大学
IPC: H04B10/116 , H04B10/524 , H04B10/40 , H04B10/516 , H04N5/225 , H04L1/00 , H05B33/08 , G06T7/70
Abstract: 本发明公开了一种用于可见光通信的信号反转视觉追踪方法及其系统,由LED阵列、分级编码器、纠错编码器组成的发射机和由高速相机、图像处理单元、分级解码器、纠错解码器组成的接收机。其中,分级编码器用二维快速Haar小波逆变换有限化输入信号;LED阵列改变脉冲宽度调节亮度作为发射信号;高速相机同步接收发射信号;图像处理单元用于LED阵列识别、追踪、位置估计和亮度提取,用M序列来检测识别、用信号反转方法追踪;分级解码器用二维快速Haar小波变换归一化亮度。本发明分别用LED和高速相机作为发射机和接收机,运用信号反转视觉追踪方法,在运动状态下准确追踪LED,解决了运动模糊,提高了可见光数据传输率。
-
公开(公告)号:CN107613459A
公开(公告)日:2018-01-19
申请号:CN201710803114.3
申请日:2017-09-08
Applicant: 华南理工大学
IPC: H04W4/02 , H04W64/00 , H04B10/116 , G06N3/00 , G01S5/16
Abstract: 本发明公开了一种基于粒子群优化的高精度可见光定位方法及系统,所述方法包括:1、初始化各个粒子的属性,作为可见光定位的初始位置;2、对粒子的全局最佳位置进行模拟退火领域搜索,并对其进行更新;3、对粒子的速度和位置进行更新;4、根据可见光传输信道过程中的数学模型得到的目标函数计算每个粒子的适应度;5、分别将每个粒子与其经过的最佳位置的适应度进行比较,更新其历史最佳位置,将每个粒子与群体经过的最佳位置的适应度进行比较,更新其全局最佳位置;6、重复步骤2-5,直至满足迭代停止的条件,输出粒子的全局最佳位置,即为所求的可见光通信的最佳定位位置。所述方法提高了可见光定位的精度,实现了真正意义上的三维定位。
-
公开(公告)号:CN107589402A
公开(公告)日:2018-01-16
申请号:CN201710768058.4
申请日:2017-08-31
Applicant: 华南理工大学
Abstract: 本发明公开了一种双载波混沌优化的可见光定位方法与系统,涉及可见光定位领域,所述方法根据接收端接收的LED灯具的ID信息确定LED灯的位置,根据光强的衰减因子获取接收端与各LED灯具之间的距离,利用混沌优化算法确定定位点的三维坐标;二次载波过程引入动态调整因子,利用混沌变量产生随机扰动,并随着搜索减小随机扰动的幅度,确定定位点的精确位置。本发明所述的方法定位过程简单,并通过二次载波过程减少了定位过程中的计算量,提高了定位的准确度。
-
-
-
-
-
-
-
-
-