双语语句对齐方法及装置

    公开(公告)号:CN101488126A

    公开(公告)日:2009-07-22

    申请号:CN200810242112.2

    申请日:2008-12-31

    发明人: 张玉志

    IPC分类号: G06F17/28

    摘要: 本发明公开一种双语语句对齐方法,包括以下步骤:分句步骤;分词步骤;对齐步骤;其特征在于,所述对齐步骤具体包括有:区域划分步骤,分别将待对齐的第一语种、第二语种按照预设的区域划分规则划分为多个包含所述第一语种语句、第二语种语句的比较区域;匹配步骤,计算每对对应的第一语种与第二语种比较区域内的每对语句的相互匹配率,并根据所述相互匹配率确定相互匹配的第一语种语句和第二语种语句组合;执行步骤,将所述相互匹配率最大的第一语种语句和第二语种语句组合执行对齐操作。本发明还公开了相应的双语语句对齐装置。本发明可大大提高对齐的效率、加快语料库的建设速度。

    一种基于多感知数据的交互式文本识别方法和系统

    公开(公告)号:CN111881825B

    公开(公告)日:2023-10-17

    申请号:CN202010737768.2

    申请日:2020-07-28

    摘要: 本发明提供一种基于多感知数据的交互式文本识别方法和系统,所述基于多感知数据的交互式文本识别方法包括:步骤S1,对待识别图像进行拍照识别;步骤S2,将后台识别好的结果发送至前端进行显示,并通过前端对识别结果进行确认和纠错;步骤S3,结合历史数据统计对下一步操作的效果进行成本预测估算;步骤S4,根据成本预测估算结果选择下一步操作,并对当前结果进行二次确认。本发明引入了音频信息和触觉信息以增强场景适应性,提升了识别正确率,在此基础上,还通过对下一步操作的效果进行成本预测估算,以便实现智能排序和推送操作选择,确保达到以与用户相适的操作以获得更高的识别率,并有效地提升了产品的人性化设计程度和适应性能。

    一种针对药名光学字符识别文本的纠错方法及系统

    公开(公告)号:CN116844176A

    公开(公告)日:2023-10-03

    申请号:CN202310864285.2

    申请日:2023-07-14

    摘要: 本发明提供一种针对药名光学字符识别文本的纠错方法及系统,包括:步骤S1,根据收集的原始药名数据建立和生成正确的药名库;步骤S2,通过光学字符识别获取光学字符识别药名,将光学字符识别药名与收集药名进行对比和差异处理,生成初步映射的第一错误分词数据库;步骤S3,以分词为单位对错误分词进行过滤和扩展,生成最终的错误分词数据库;步骤S4,对光学字符识别错误的药名进行纠错和替换。本发明操作简单、使用方便且运行耗时少,能够在OCR识别情况较为复杂或是错误严重时,也可以给出正确的结果,并有效地实现纠错。本发明不仅规避了匹配时实时计算耗时长的弊端,还针对光学字符识别药名提出了更加稳定、可靠且精准的技术方案。

    版面还原方法
    4.
    发明公开

    公开(公告)号:CN101308491A

    公开(公告)日:2008-11-19

    申请号:CN200810068131.8

    申请日:2008-06-27

    发明人: 张玉志

    IPC分类号: G06F17/25

    摘要: 本发明公开一种版面还原方法,包括有以下步骤:图像文件生成步骤,获得待处理文件的源稿,并将所述源稿生成源版面图像文件;背景文件设置步骤,将所述源版面图像文件作为背景文件导入待处理文件版面;还原处理步骤,移动待处理文件中的对象,使所述对象完全覆盖背景文件中对应的源对象。本发明实现了非常精确的版面还原,并且大大提高了排版速度和排版效率,节省了人力和时间成本。

    一种基于多感知数据的交互式文本识别方法和系统

    公开(公告)号:CN111881825A

    公开(公告)日:2020-11-03

    申请号:CN202010737768.2

    申请日:2020-07-28

    摘要: 本发明提供一种基于多感知数据的交互式文本识别方法和系统,所述基于多感知数据的交互式文本识别方法包括:步骤S1,对待识别图像进行拍照识别;步骤S2,将后台识别好的结果发送至前端进行显示,并通过前端对识别结果进行确认和纠错;步骤S3,结合历史数据统计对下一步操作的效果进行成本预测估算;步骤S4,根据成本预测估算结果选择下一步操作,并对当前结果进行二次确认。本发明引入了音频信息和触觉信息以增强场景适应性,提升了识别正确率,在此基础上,还通过对下一步操作的效果进行成本预测估算,以便实现智能排序和推送操作选择,确保达到以与用户相适的操作以获得更高的识别率,并有效地提升了产品的人性化设计程度和适应性能。

    具有控烟功能的智能烟盒及基于所述烟盒的控烟方法

    公开(公告)号:CN102934840B

    公开(公告)日:2014-11-19

    申请号:CN201210476984.1

    申请日:2012-11-22

    发明人: 万享 张玉志

    IPC分类号: A24F15/08 A24F15/18 G05B19/04

    摘要: 本发明实施例公开了一种具有控烟功能的智能烟盒及基于所述烟盒的控烟方法,所述烟盒包括盒体和枢设于所述盒体上的盒盖,还包括:设于烟盒外壁上的输入单元;设于烟盒上的、用于将盒体和盒盖锁紧或松开的锁扣机构;设于烟盒内并电连接于所述锁扣机构及所述输入单元的、接收且依输入单元的输入信号控制锁扣机构在预定时间段内松开预定次数的控制器;及电连接并为所述控制器提供电力的电源。本发明实施例通过采用所述烟盒设置输入单元、锁扣机构、电源及设于烟盒内并电连接于所述锁扣机构及所述输入单元的、接收且依输入单元的输入信号控制锁扣机构在预定时间段内松开预定次数的控制器的技术手段,从而达到了安全而有效地进行戒烟的效果。

    基于情绪控制的智能拍录装置及方法

    公开(公告)号:CN104010132A

    公开(公告)日:2014-08-27

    申请号:CN201410211184.6

    申请日:2014-05-19

    发明人: 万享 张玉志

    IPC分类号: H04N5/232 A61B5/16

    摘要: 本发明公开了一种基于情绪控制的智能拍录装置及方法,该装置包括:情绪感知模块、通信模块和拍录模块;情绪感知模块,用于感知和采集被测对象的情绪信息,且处理分析情绪信息以产生情绪紧张值,进而根据情绪紧张值以产生控制拍录模块拍录的开启控制信号;通信模块,与情绪感知模块相连,用于将开启控制信号发送至拍录模块;以及拍录模块,与通信模块相连,用于根据开启控制信号进行拍录。本发明的基于情绪控制的智能拍录装置及方法,能够自动识别用户的情绪,并根据所识别的情绪进行自动拍录。

    一种通过文本分析自动生成题库知识点的方法

    公开(公告)号:CN106570109B

    公开(公告)日:2020-07-24

    申请号:CN201610937043.1

    申请日:2016-11-01

    发明人: 罗登 万享

    摘要: 本发明提供一种通过文本分析自动生成题库知识点的方法,包括以下步骤:步骤S1,通过所有对文本样本进行分词、统计和过滤,选取特征词,组成特征词表;步骤S2,分别对题干和题目解析进行分词,经过特征词表过滤分别得到题干和题目解析的特征词,得到知识点分类;步骤S3,融合所述题干和题目解析这两种数据源中的分类结果,进而输出最终的知识点分类结果。本发明通过卡方检验分类和频繁项集分类实现所述特征词在知识点类别中的分类,并结合题目的题干和题目解析等信息来生成知识点分类的结果,能够非常有效地提高知识点分类生成的准确性;尤其针对知识点数目较多的情况,本发明依然能够提高其正确率。

    手机拍照文本图像质量评估方法

    公开(公告)号:CN104978578B

    公开(公告)日:2018-07-27

    申请号:CN201510188852.2

    申请日:2015-04-21

    IPC分类号: G06K9/20 G06K9/36 G06T7/00

    摘要: 本发明涉及种手机拍照文本图像质量评估方法,包括:OCR采样识别步骤,对手机拍照文件进行采样,随机抽取份图像分块,每份图像分块即作为个采样区域进行OCR识别,获得采样区域内每个识别字符的置信度;计算置信度步骤,根据OCR采样识别获得的每个识别字符的置信度计算出该手机拍照文件的置信度;以及图像质量评价步骤,根据手机拍照文件的置信度从预存的图像质量‑置信度查询表获得图像质量数值并附加上图像质量好坏的判定结果后并在手机界面上显示出来。本发明通过分析采样区域和图像的置信度,以置信度为依据快速确定和判断图像质量高低好坏,并能更加直观、形象地反映出图像质量好坏,有助于用户快速了解拍照文本的图像质量。

    双语语句对齐方法及装置
    10.
    发明授权

    公开(公告)号:CN101488126B

    公开(公告)日:2011-05-11

    申请号:CN200810242112.2

    申请日:2008-12-31

    发明人: 张玉志

    IPC分类号: G06F17/28

    摘要: 本发明公开一种用于建设机器翻译语料库的双语语句对齐方法,包括以下步骤:分句步骤;分词步骤;对齐步骤;所述对齐步骤具体包括有:区域划分步骤,分别将待对齐的第一语种、第二语种按照预设的区域划分规则划分为多个包含所述第一语种语句、第二语种语句的比较区域;匹配步骤,计算每对对应的第一语种与第二语种比较区域内的每对语句的相互匹配率,并根据所述相互匹配率确定相互匹配的第一语种语句和第二语种语句组合;执行步骤,将所述相互匹配率最大的第一语种语句和第二语种语句组合执行对齐操作。本发明还公开了相应的用于建设机器翻译语料库的双语语句对齐装置。本发明可大大提高对齐的效率、加快语料库的建设速度。