-
公开(公告)号:CN114780667A
公开(公告)日:2022-07-22
申请号:CN202210356507.5
申请日:2022-04-06
Applicant: 上海交通大学
IPC: G06F16/31 , G06F16/35 , G06F16/951 , G06F16/955 , G06F40/211 , G06F40/263 , G06F40/289 , G06F40/30 , G06F40/58 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种语料库构建与过滤方法及系统,包括:步骤1:对获取的初始平行语料进行文档分句对齐处理,得到双语平行语料;步骤2:根据双语平行语料的文本对齐度,进行过滤处理,得到语料库。与现有技术相比,本发明实现了多种互联网多语种语料库的自动采集的方案,并能够基于此完成语料库的自动对齐。此外,还设计了高性能低资源语种的过滤方法,进一步提高了生成语料库的质量,为相关自然语言处理下游任务提供数据保障和支持。
-
公开(公告)号:CN109120584A
公开(公告)日:2019-01-01
申请号:CN201810631022.6
申请日:2018-06-19
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于统一可扩展固定接口和WinPE的终端安全防范方法及系统,包括执行远程数据访问,访问远程服务器上的数据;执行身份认证,与远程服务器进行身份认证;执行内核文件防护,对核心文件执行完整性检查与恢复;执行恶意代码检测;执行第三方安全软件检测。在UEFI和WinPE环境中开发安全防护模块,从计算机加电开始对用户操作系统进行安全防护工作,直至用户成功进入操作系统。防范过程在操作系统加载前进行,对依赖操作系统的恶意代码尚未运行之前进行查杀,恶意代码不能对该防范系统形成威胁,做到了先发制人的目的,可以实现真正的恶意代码防范。
-
公开(公告)号:CN107305768A
公开(公告)日:2017-10-31
申请号:CN201610248440.8
申请日:2016-04-20
Applicant: 上海交通大学
Abstract: 本发明提供了一种语音交互中的易错字校准方法,包括:识别语境步骤、基于限制语义的自动纠错步骤、基于语义反馈的人工纠错步骤。本发明通过与用户语音交互,感知、识别话题语境,从而在受限语义范围内,利用命名实体识别技术,对含有特定意义的实体实现自动纠错功能,并支持通过人工反馈获得附加语义进而纠错,实现比现有语音识别软件更高的输入效率以及更方便的错字修正方式。
-
公开(公告)号:CN102024114B
公开(公告)日:2012-11-28
申请号:CN201110008478.5
申请日:2011-01-14
Applicant: 上海交通大学
IPC: G06F21/00
Abstract: 一种互联网信息安全技术领域的基于统一可扩展固定接口(UEFI)的恶意代码防范方法,通过采用UEFI提供的编程接口实现网络连接模块,维护远程服务器上的基于特征码的恶意代码检查的恶意代码特征库以及用于数据恢复的程序备份;然后在本地硬盘创建一个存储空间,存储作为完整性检查信息的核心文件的摘要集合和清理系统的垃圾信息及顽固数据的配置信息;最后执行恶意代码防范。本发明利用UEFI的优点,先于操作系统的加载进行相关操作,在UEFI环境中进行恶意代码检测和清除,能够有效对付当前流行的内核级恶意代码。
-
公开(公告)号:CN113382072B
公开(公告)日:2023-01-06
申请号:CN202110644871.7
申请日:2021-06-09
Applicant: 上海交通大学
IPC: H04L67/10 , G06F16/951 , G06F16/953
Abstract: 本发明提供了一种基于对等网络的联合搜索系统,涉及对等网络中的信息搜素和信息共享技术领域,该方法包括多个节点,且各节点之间通过双向连接或单向连接的方式彼此联系,多个节点分别组成了第一层网络和第二层网络。本发明能够确保网络中各节点的公平性,网络的均衡性,以及网络的相对稳定性,同时可以确保性能较差的或频繁加入和退出网络的设备可以正常加入并使用网络,不会给网络带来负面影响。
-
公开(公告)号:CN113220825A
公开(公告)日:2021-08-06
申请号:CN202110308776.X
申请日:2021-03-23
Applicant: 上海交通大学
IPC: G06F16/33 , G06F16/35 , G06F40/242 , G06F40/30 , G06N3/08
Abstract: 本发明提供了一种面向个人推文的话题情感倾向性预测模型的建模方法及系统,包括:步骤M1:根据情感词典将推文中的情感词去除,得到去除情感词的推文;步骤M2:在推文语料库中利用去除情感词的推文和情感标签输入BERT模型对BERT模型进行训练,得到训练后的BERT模型;步骤M3:利用训练后的BERT模型对去除情感词的推文以及话题词进行特征提取得到隐层向量;步骤M4:将话题词对应的隐层向量通过注意力机制进行整合,拼接到去除情感词的推文每个字符向量后面,得到新的词向量;步骤M5:新的词向量通过CNN分类器对情感类别进行概率分布预测;本发明提高对潜在话题情感预测的准确率。
-
公开(公告)号:CN109901814A
公开(公告)日:2019-06-18
申请号:CN201910114677.0
申请日:2019-02-14
Applicant: 上海交通大学
Abstract: 本发明提供了一种具有共享指数的自定义浮点数,把基于32-bit浮点数的神经网络模型压缩到8-bit,大幅度压缩了模型的大小的同时降低运算操作复杂度。在自定义的浮点数运算中,采用的是整数乘法和加法运算。与32-bit浮点数乘法相比,自定义浮点数的乘法运算节省了17倍的能量消耗,30倍芯片面积;加法运算节省28倍能量消耗,116倍芯片面积。在全连接层的网络参数中,传输到片外存储器的数据所需的内存带宽减少了4倍。自定义浮点数有助于在片上缓冲器中保持4倍以上的参数。在硬件实现中,结合8-bit的自定义浮点数与乘法器封装结构,实现在运算单元CU上运算增快整个神经网络的运行速度和吞吐量。
-
公开(公告)号:CN109086865A
公开(公告)日:2018-12-25
申请号:CN201810594531.6
申请日:2018-06-11
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于切分循环神经网络的序列模型建立方法,本发明的SRNN通过对RNN整体结构改进,使其可以并行训练,SRNN的速度相较传统RNN有了较大的提升。本发明的SRNN可以获取序列的高层次信息,例如当层数为3时,最底层的RNN可以获得词汇层次的信息,中间层的RNN可以获得句子层次的信息,最顶层的RNN可以获得段落层次的信息,并且,SRNN将每个RNN都限制在最小子序列的长度,有效地提高了保留序列中重要信息的能力。
-
公开(公告)号:CN108804919A
公开(公告)日:2018-11-13
申请号:CN201810415056.1
申请日:2018-05-03
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于深度学习的恶意代码同源判定方法,包括:利用IDA工具,对于待判定的恶意代码进行反汇编,通过正则表达式匹配得到其中核心二进制内容,同时去除无用信息;接收二进制内容作为输入,利用恶意代码可视化算法,将二进制内容映射为恶意代码图像;利用恶意代码图像与标签值组成的样本集,对深度学习模型卷积神经网络进行训练,得到成熟的判定模型。接收待判定的恶意代码作为输入,完成同源判定。本发明通过恶意代码可视化算法,将同源判定任务转化为图像分类任务,结合深度学习判定模型,实现了一个可用的恶意代码同源判定方法。实现比现有系统更高判定准确率的同源判定技术。
-
公开(公告)号:CN102013103B
公开(公告)日:2013-04-03
申请号:CN201010571128.5
申请日:2010-12-03
Applicant: 上海交通大学
Abstract: 一种图像处理和模式识别技术领域的方法,特别是一种实时动态嘴唇跟踪方法。包括:通过数码摄像机拍摄并获取包含嘴唇区域在内的图像序列;通过基于模糊聚类和卡尔曼预测的连续图像嘴唇分割方法,将图像中所有像素点分为嘴唇像素点或非嘴唇像素点,并输出所有像素点属于嘴唇像素点的概率;通过14点动态形状模型和卡尔曼预测,在步骤二提供的嘴唇概率分布图的基础上,获取嘴唇图像序列中每一帧中的嘴唇轮廓,本发明能够自动跟踪图像序列中嘴唇的运动,具有较高的处理速度(保证实时性)和识别准确率。
-
-
-
-
-
-
-
-
-