-
公开(公告)号:CN104572634B
公开(公告)日:2017-08-11
申请号:CN201410830446.7
申请日:2014-12-25
申请人: 中国科学院合肥物质科学研究院
摘要: 本发明涉及一种交互式抽取可比语料与双语词典的方法及其装置,解决了领域种子双语词典规模不足条件下难以识别可比语料和可比度不同条件下难以提取互译词汇的缺陷。本发明包括:对文档进行词性还原、分词、去停用词,得到预处理后的文档集合以及词汇集合;分别构建源语言文档‑目标语言文档、源语言词汇‑目标语言词汇、双语词汇对‑双语文档对的关系;迭代增强计算双语文档对和双语词汇对的权重;选择权重最大的双语文档对构建可比语料,选择权重最大的双语词汇对构建双语词典。通过不同语言文档相似性促进不同语言词汇相似性的判断,不同语言词汇的相似性增强不同语言文档的相似性,二者交互式迭代增强实现同步抽取可比语料和双语词典。
-
公开(公告)号:CN104572634A
公开(公告)日:2015-04-29
申请号:CN201410830446.7
申请日:2014-12-25
申请人: 中国科学院合肥物质科学研究院
摘要: 本发明涉及一种交互式抽取可比语料与双语词典的方法及其装置,解决了领域种子双语词典规模不足条件下难以识别可比语料和可比度不同条件下难以提取互译词汇的缺陷。本发明包括:对文档进行词性还原、分词、去停用词,得到预处理后的文档集合以及词汇集合;分别构建源语言文档-目标语言文档、源语言词汇-目标语言词汇、双语词汇对-双语文档对的关系;迭代增强计算双语文档对和双语词汇对的权重;选择权重最大的双语文档对构建可比语料,选择权重最大的双语词汇对构建双语词典。通过不同语言文档相似性促进不同语言词汇相似性的判断,不同语言词汇的相似性增强不同语言文档的相似性,二者交互式迭代增强实现同步抽取可比语料和双语词典。
-
公开(公告)号:CN103473280A
公开(公告)日:2013-12-25
申请号:CN201310382010.1
申请日:2013-08-28
申请人: 中国科学院合肥物质科学研究院
摘要: 本发明涉及网络可比语料的挖掘方法,包括:利用网络爬虫获取源语言网页,经预处理后形成源语言文档;分析源语言文档的跨语言主题的概率,产生对应的目标语言查询词;将目标语言查询词提交搜索引擎,选取前N的文档构成目标语言候选相似文档集;计算源语言文档和目标语言候选相似文档的相似度,筛选出相似度较高的文档构建可比语料库。本发明还公开了一种实施网络可比语料的挖掘方法的装置。本发明避免词汇翻译产生歧义或消耗大量时间;源语言文档源自于网络爬虫获取的特定网站内容,目标语言文档来自于整个互联网,有效提高对源语言文档的利用率;源语言和目标语言相似文档匹配通过主题分布的相似性实现,提高了语料库建设的准确度。
-
公开(公告)号:CN102890037A
公开(公告)日:2013-01-23
申请号:CN201210391921.6
申请日:2012-10-16
申请人: 中国科学院合肥物质科学研究院
IPC分类号: G01N5/02
摘要: 本发明涉及一种石英晶体微天平乙基对氧磷流动检测装置,包括放置于流动检测池中的特异性QCM传感器和参比QCM传感器,二者的输出端依次通过振荡电路、整形电路与差频电路的输入端相连,差频电路的输出端通过测频与通信电路与上位机通讯。本发明的灵敏度高、自动化程度高、结构简单、便于操作;参比QCM传感器的引入消除了液体粘度、密度等因素对检测结果的影响,提高了抗干扰能力;利用特异性QCM传感器对乙基对氧磷具有特异性吸附能力,不易受其它类似物质的干扰,从而提升了选择性。
-
公开(公告)号:CN103894622B
公开(公告)日:2016-05-11
申请号:CN201410099763.6
申请日:2014-03-18
申请人: 中国科学院合肥物质科学研究院
发明人: 李淼 , 翁士状 , 曾新华 , 李华龙 , 张建 , 郑守国 , 盛文溢 , 郑晓菊 , 董瀚琳 , 王绍琪 , 罗伟 , 朱泽德 , 吴娜 , 卞程飞 , 陈晟 , 董俊 , 高会议 , 万莉 , 胡泽林
摘要: 本发明公开了一种快速可控光纤芯端银纳米颗粒的原位合成方法及装置。本发明可通过激发光源强度与辐照时间的调制,实现对纳米颗粒粒子大小与分布的可控。本发明采用的直接在光纤芯端上合成银纳米颗粒的方法还可被拓展到多芯光纤上来制备银纳米颗粒阵列,并与多种拉曼探针标记技术结合,实现对多种待分析物的同时检测或某一特定分析物的多通道检测。本发明的合成方法操作简单,制备过程快速、可控、综合成本低,且合成的光纤银纳米颗粒与光纤拉曼增强光谱可完美结合,在化学分析与生物检测中具有非常好的应用价值。
-
公开(公告)号:CN103894622A
公开(公告)日:2014-07-02
申请号:CN201410099763.6
申请日:2014-03-18
申请人: 中国科学院合肥物质科学研究院
发明人: 李淼 , 翁士状 , 曾新华 , 李华龙 , 张建 , 郑守国 , 盛文溢 , 郑晓菊 , 董瀚琳 , 王绍琪 , 罗伟 , 朱泽德 , 吴娜 , 卞程飞 , 陈晟 , 董俊 , 高会议 , 万莉 , 胡泽林
摘要: 本发明公开了一种快速可控光纤芯端银纳米颗粒的原位合成方法及装置。本发明可通过激发光源强度与辐照时间的调制,实现对纳米颗粒粒子大小与分布的可控。本发明采用的直接在光纤芯端上合成银纳米颗粒的方法还可被拓展到多芯光纤上来制备银纳米颗粒阵列,并与多种拉曼探针标记技术结合,实现对多种待分析物的同时检测或某一特定分析物的多通道检测。本发明的合成方法操作简单,制备过程快速、可控、综合成本低,且合成的光纤银纳米颗粒与光纤拉曼增强光谱可完美结合,在化学分析与生物检测中具有非常好的应用价值。
-
公开(公告)号:CN103473280B
公开(公告)日:2017-02-08
申请号:CN201310382010.1
申请日:2013-08-28
申请人: 中国科学院合肥物质科学研究院
摘要: 本发明涉及网络可比语料的挖掘方法,包括:利用网络爬虫获取源语言网页,经预处理后形成源语言文档;分析源语言文档的跨语言主题的概率,产生对应的目标语言查询词;将目标语言查询词提交搜索引擎,选取前N的文档构成目标语言候选相似文档集;计算源语言文档和目标语言候选相似文档的相似度,筛选出相似度较高的文档构建可比语料库。本发明避免词汇翻译产生歧义或消耗大量时间;源语言文档源自于网络爬虫获取的特定网站内容,目标语言文档来自于整个互联网,有效提高对源语言文档的利用率;源语言和目标语言相似文档匹配通过主题分布的相似性实现,提高了语料库建设的准确度。
-
-
-
-
-
-