-
公开(公告)号:CN112528980B
公开(公告)日:2022-02-15
申请号:CN202011484096.5
申请日:2020-12-16
Applicant: 北京华宇信息技术有限公司
IPC: G06V30/26 , G06V30/12 , G06V30/41 , G06F40/216 , G06F40/232 , G06F40/30 , G06N20/00
Abstract: 本申请公开了一种OCR识别结果纠正方法及其终端、系统。其中所述方法,包括:获取OCR识别结果;确定识别结果中的出错结果;纠正出错结果,生成最终的识别结果。通过对出错结果的纠正,可以实现对OCR识别结果的纠正。
-
公开(公告)号:CN116912857A
公开(公告)日:2023-10-20
申请号:CN202310829177.1
申请日:2023-07-07
Applicant: 北京华宇信息技术有限公司
IPC: G06V30/226 , G06V30/412 , G06V30/148 , G06V30/19 , G06N3/0464 , G06N3/084
Abstract: 本申请提供一种手写体和印刷体文本分离方法及装置,用以解决手写体文本和印刷体文本相近的情况下文本框左右粘连,造成文本区域分离错误的技术问题。具体的,一种手写体和印刷体文本分离方案,通过使用卷积神经网络预测不同的字体类型特征图,根据不同的字体类型特征图对字体类型进行预测,提高了预测准确率和泛用性。通过在标签文本区域框两端,生成以标签文本区域框的高度为直径的高斯图,根据高斯图生成边界框,通过实际文本区域框中存在两个以上边界区域框,认定实际文本区域框要分离,进而确定手写体和印刷体文本框的边界,降低了由于不同文本区域框左右粘连导致文本区域框分离错误的概率,提高了手写体文本和印刷体文本分离的准确度。
-
公开(公告)号:CN116996730A
公开(公告)日:2023-11-03
申请号:CN202310827817.5
申请日:2023-07-06
Applicant: 北京华宇信息技术有限公司
IPC: H04N21/431 , H04N21/2187 , G10L21/013 , H04N21/4402 , H04N21/44 , H04N21/439
Abstract: 本申请提供一种庭审直播中隐私保护方法及装置,用于隐私保护效率低的技术问题。其中,一种隐私保护方案包括:采集人物声纹特征、轮廓特征,并建立关联关系;存储人物声纹特征至声纹库、轮廓特征至图像库,预训练得到声纹识别模型、图像识别模型;获取并解码庭审记录视频流,生成音频数据,并输入至声纹识别模型进行识别,得到庭审音频数据后变调,得到变调音频数据;解码庭审记录视频,生成画面数据,并输入至图像识别模型进行识别,得到庭审画面数据后模糊,得到模糊画面数据;封装变调音频数据、模糊画面数据,生成隐私保护后的庭审直播视频流。通过对隐私信息对应的音频进行变调处理、画面进行模糊处理,提高保护效率,降低隐私泄漏的风险。
-
公开(公告)号:CN116996705A
公开(公告)日:2023-11-03
申请号:CN202310840470.8
申请日:2023-07-10
Applicant: 北京华宇信息技术有限公司
IPC: H04N21/234 , H04N21/433 , H04N21/643 , H04N7/18 , G06Q50/18
Abstract: 本申请公开了一种庭审多方视频拼接系统及方法,用以解决庭审主机部署成本较高的技术问题。其中,一种庭审多方视频拼接方案,包括:部署于庭审环境的若干网络摄像机,用于记录不同视角的庭审现场,生成庭审记录视频;部署于遥端的服务器,用于获取来自若干网络摄像机的庭审记录视频,并根据若干网络摄像机的庭审记录视频,生成庭审多方拼接视频;客户端,用于获取来自服务器的庭审多方拼接视频,作为归档资料进行存储。通过部署于庭审环境的若干网络摄像机采集不同角度的庭审记录视频,并以网络通信技术传输至服务器进行拼接,之后将拼接视频发送至客户端归档,降低了庭审主机部署工作量和部署成本。
-
公开(公告)号:CN110826619A
公开(公告)日:2020-02-21
申请号:CN201911058977.8
申请日:2019-11-01
Applicant: 北京华宇信息技术有限公司
Abstract: 本公开实施例中提供了一种电子卷宗的文件分类方法、装置及电子设备,属于图像处理技术领域,该方法包括:接收待分类的电子卷宗的全部材料页对应的图像;对每个材料页的图像进行预处理,得到每个材料页对应图像的版面类型,其中,所述版面类型包括首页、中间页和尾页;对所述电子卷宗的全部首页图像进行文字识别;依据所述电子卷宗对应的全部首页图像的文字识别结果进行预设规则的文件类别匹配,得到每个首页图像对应文件的文件类别。通过本公开的处理方案,提高了电子卷宗的文件分类的效率和计算资源的利用率。
-
公开(公告)号:CN110766008A
公开(公告)日:2020-02-07
申请号:CN201911034756.7
申请日:2019-10-29
Applicant: 北京华宇信息技术有限公司
Abstract: 本发明提供一种面向任意方向和形状的文本检测方法,包括人工合成数据训练阶段、弱监督训练阶段和测试阶段,针对有字符标注框的原始数据图像采用人工合成数据训练阶段进行训练,针对只有词级标注框没有字符标注框的原始数据图像,采用弱监督训练阶段进行训练。本发明可以更好的检测目标较大的文本。同时,在后置处理时对检测到的相邻较近的文本框进行连接操作,有效的减少了文本检测的间断问题。
-
公开(公告)号:CN113204963B
公开(公告)日:2025-03-28
申请号:CN202110493402.X
申请日:2021-05-07
Applicant: 北京华宇信息技术有限公司
IPC: G06F40/289 , G06F16/31 , G06F3/023
Abstract: 本申请提供一种输入法多元词发现方法及装置,用于解决输入法发现多元词效率低的技术问题。其中,一种输入法多元词发现方法,包括以下步骤:获取语料数据;通过分词模型,对所述语料数据进行分词,生成若干分词单元;以WFP数据结构存储分词单元;通过读取WFP数据结构,比较分词单元与分词单元的关联性,确定分词单元组合;添加所述分词单元组合至词库。相对于现有技术,所述输入法多元词发现方法能实现多元词关系的发现,并且提高了发现多元词的准确率、效率。
-
公开(公告)号:CN113360004A
公开(公告)日:2021-09-07
申请号:CN202110743668.5
申请日:2021-07-01
Applicant: 北京华宇信息技术有限公司
IPC: G06F3/023
Abstract: 本申请公开了一种输入法候选词推荐方法及装置,用以解决输入法推荐候选词准确性低的技术问题。其中,一种输入法候选词推荐方法,根据当前输入位置前的词组、当前字符,计算对应当前字符的若干候选词的出现概率,并以预设推荐策略排列对应当前字符的若干候选词,实现对输入法中候选词的动态调整。从而使得推荐候选词与上下文的关联程度更高,提高了输入的准确性。
-
公开(公告)号:CN113204963A
公开(公告)日:2021-08-03
申请号:CN202110493402.X
申请日:2021-05-07
Applicant: 北京华宇信息技术有限公司
IPC: G06F40/289 , G06F16/31 , G06F3/023
Abstract: 本申请提供一种输入法多元词发现方法及装置,用于解决输入法发现多元词效率低的技术问题。其中,一种输入法多元词发现方法,包括以下步骤:获取语料数据;通过分词模型,对所述语料数据进行分词,生成若干分词单元;以WFP数据结构存储分词单元;通过读取WFP数据结构,比较分词单元与分词单元的关联性,确定分词单元组合;添加所述分词单元组合至词库。相对于现有技术,所述输入法多元词发现方法能实现多元词关系的发现,并且提高了发现多元词的准确率、效率。
-
公开(公告)号:CN117998148A
公开(公告)日:2024-05-07
申请号:CN202311695525.7
申请日:2023-12-11
Applicant: 北京华宇信息技术有限公司
IPC: H04N21/472 , H04N21/235 , H04N21/8547 , H04N21/858
Abstract: 本申请实施例提供一种视频回放方法、电子设备及存储介质,在本申请实施例中,在视频回放阶段,服务器以单个时间戳为粒度,按序将需要回放的各个时间戳的视频内容和批注信息分别封装为相同类型的流媒体格式的媒体流数据,并将各个时间戳的携带视频内容的媒体流数据和携带批注信息的媒体流数据传输给用户的终端设备,用户的终端设备可以按照相同类型的流媒体格式的解析方法进行解析,获取所需回放的时间戳的视频内容和批注信息,并显示所需回放的时间戳的视频内容和批注信息以实现视频回放。由此,极大地提高了带批注信息的视频文件的视频回放效率,另外,在播放界面的播放进度条上显示批注信息能够直观地使得用户获知批注信息,提高了用户体验。
-
-
-
-
-
-
-
-
-