-
公开(公告)号:CN113065347B
公开(公告)日:2022-06-28
申请号:CN202110454069.1
申请日:2021-04-26
Applicant: 上海交通大学
IPC: G06F40/279 , G06F40/30 , G06F40/14 , G06F40/126 , G06F40/253 , G06Q50/18 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于多任务学习的刑事案件判决预测方法及系统,包括:获取案情文本原始数据,并对案情文本原始数据进行预处理,得到预处理后的案情文本;将预处理后的案情文本进行分词,得到预处理后的分词案情文本;预处理后的分词案情文本进行one‑hot编码,得到词编码,然后再进行word2vec的编码,得到全文的词向量;基于预处理后的分词案情文本构建语法树,并将语法树中预设要求词对关系的词对抽取出来,对抽取出的词对进行one‑hot编码及word2vec的编码,得到词对的词向量;构建案件预测模型并对案件预测模型进行训练,得到训练后的案件预测模型;将全文的词向量和词对的词向量输入训练后的案件预测模型,得到相关法条、罪行以及刑期的预测结果。
-
公开(公告)号:CN114117068A
公开(公告)日:2022-03-01
申请号:CN202111398235.7
申请日:2021-11-19
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于多特征模型的公益诉讼案件的线索抽取方法及系统,包括:步骤S1:对公益诉讼案源文本进行预处理;步骤S2:将经过预处理的公益诉讼案源文本作为所述线索要素抽取模块的输入对象;步骤S3:对输入的公益诉讼案源文本使用所述线索要素抽取模块进行处理,输出案件线索要素标注序列;步骤S4:将案件线索要素标注序列进行转换与整合,形成公益诉讼案源文本对应的案件线索要素集合,完成线索要素的抽取;步骤S5:将抽取得到的线索要素进行组织整合,得到整个公益诉讼案源文本对应的线索。本发明能够提高公益诉讼案源文本的线索要素抽取效率;解决现有技术所存在的公益诉讼案件线索发现效率低下、线索来源较单一的问题。
-
公开(公告)号:CN112818678A
公开(公告)日:2021-05-18
申请号:CN202110205890.X
申请日:2021-02-24
Applicant: 上海交通大学
IPC: G06F40/279 , G06F40/30 , G06F16/901 , G06N3/08
Abstract: 本发明提供了一种基于依赖关系图的关系推理方法及系统,利用词义特征对给定句对进行词语划分和词语特征构造;通过依赖提取器获得从词语划分后的文本中提取出词语之间的依赖关系树;将依赖关系作为词语特征更新的依据,结合深度学习网络,对给定句对中词语特征进行学习和更新;将的给定句对获得的多个更新后的词语特征作为局部特征,进行特征的融合获得全局特征;将全局特征作为句义特征,进行两句间的交互,输入到输出层中获得输出,将输出与真实标签进行比较,进行学习模型的损失函数的计算;根据学习模型的损失函数计算结果,对学习模型进行修正,确定学习模型对应的目标参数。有效提升句法依赖树在自然语言推理上的表现。
-
公开(公告)号:CN104102745B
公开(公告)日:2017-12-29
申请号:CN201410374243.1
申请日:2014-07-31
Applicant: 上海交通大学
IPC: G06F17/30
Abstract: 本发明提供一种基于局部最小边的复杂网络社区挖掘方法,包括以下步骤:获取复杂网络的邻接矩阵A;计算相似度矩阵R;对复杂网络图G进行社团划分C;查找一组局部最小边;检测各局部最小边两端点的局部拓扑结构,确定能够使得当前社团结构更加符合社团定义的局部最小边并去掉这些边;检测网络中是否出现新的连通子图,如果没有就重新计算各边权值,如果有新的连通子图出现,则判断划分是否合理;如果划分不合理则输出结果,如果划分合理则重新计算各边权值并进行下一次迭代过程。本发明具有精度高、速度快、通用性强等特点。
-
-
公开(公告)号:CN101661513A
公开(公告)日:2010-03-03
申请号:CN200910308542.4
申请日:2009-10-21
Applicant: 上海交通大学
IPC: G06F17/30
Abstract: 本发明提供了网络信息处理技术领域的一种网络热点和舆情的检测方法,通过搜集指定时间范围内的网络论坛、博客系统的正文信息文档和评论信息文档,并进行分词、概念映射、概念消歧,再提取出能够表达正文信息文档内容的本征特征,利用这些本征特征进行聚类,形成若干个包含不等数量的信息文档的信息文档集,根据各信息文档集中信息文档的数目可以知道指定时间范围内网络上讨论的热点事件,再对热点事件信息文档集进行褒贬倾向分析,从而获知网民对该热点事件的舆情观点。本发明消除了以往舆情系统以词为单位、不够灵活的不足,同时增强了对评论文本进行舆情分析的能力。
-
公开(公告)号:CN101286895A
公开(公告)日:2008-10-15
申请号:CN200810037826.X
申请日:2008-05-22
Applicant: 上海交通大学
Abstract: 一种计算机网络技术领域的可动态配置的分布式网络数据监控系统及方法,本发明中,数据采集代理模块依照用户设定的配置文件对所属网络数据平台的数据进行采集,并对采到的数据进行预处理,预处理包括数据包过滤和数据包拆包操作,数据包过滤是指协议过滤操作,依据用户定义的协议过滤机制抛弃无效的数据包,数据包拆包操作是根据用户的展示内容提取数据包中的有用信息,并将用户所需的数据,以XML文件上报给数据中心模块;数据中心模块负责处理数据采集代理模块上报的XML形式的数据文件,并通过查询XML文件以及配置更新XML文件对数据采集代理进行动态管理。本发明简化系统设计,提高系统处理数据的能力以及系统的易用性和健壮性。
-
公开(公告)号:CN1556611A
公开(公告)日:2004-12-22
申请号:CN200310109836.7
申请日:2003-12-30
Applicant: 上海交通大学
Abstract: 一种基于安全应用服务器的网络信息安全综合管理方法。属于信息安全领域。方法如下:客户端浏览器选择应用服务器安全管理应用服务器、安全方法应用服务器、安全审计应用服务器之一;建立正常连接后,客户端浏览器发出指令,应用服务器根据请求调用已建立好连接的管理对象服务器,然后管理对象服务器通过三个协议映射中间件对受管安全资源进行信息提取;当中间件收到数据采集请求时向安全资源采集数据,将采集到的数据根据协议映射中间件定义的模式进行转换后提交给管理对象服务器,管理对象服务器将数据统一存放在管理对象信息库中,再告诉应用服务器;应用服务器通过管理对象服务器调出管理数据加以分析处理,最终返还给客户端浏览器。
-
公开(公告)号:CN118709217A
公开(公告)日:2024-09-27
申请号:CN202410745902.1
申请日:2024-06-11
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于Frida框架的移动应用隐私泄露检测方法及系统,包括步骤S1:分别设定隐私信息与Android权限、Android API的映射关系;步骤S2:设定Android API挂钩规则与HTTP、HTTPS数据包挂钩规则;步骤S3:部署Frida框架,根据个人信息收集要求,对不同种类移动应用设定相应的个人信息使用范围;步骤S4:根据映射关系、挂钩规则以及不同种类移动应用的个人信息使用范围,判断被检测应用是否存在隐私泄露问题。本发明采取多种方式检测隐私泄露,实现了Android API监控、数据包拦截、第三方库判断、隐私信息正则匹配等功能,提高了隐私泄露检测的准确性与全面性。
-
公开(公告)号:CN114118081B
公开(公告)日:2024-07-26
申请号:CN202111350050.9
申请日:2021-11-15
Applicant: 上海交通大学
IPC: G06F40/289 , G06F40/211 , G06F16/35 , G06N5/04 , G06N3/045 , G06N3/082
Abstract: 本发明提供了一种基于句法对齐的自然语言推理方法及系统,包括给定多个句对,对词语进行划分得到一个个token,进行编码获得词向量特征;通过依赖分析器对句子的依赖关系进行解析,获得词语间的依赖关系,将token对应到词语中;搭建依赖关系捕捉模块,捕捉句内句法特征的加强表示;构造注意力机制网络,更新句子的结构化特征;将结构化特征作为分类依据,获得预测结果;通过模型的损失函数计算获得偏差,并对模型进行修正。本发明通过采用基于句法对齐的自然语言推理方法,基于图网络编码了词语之间的不同依赖关系,相较于传统方法,可以区分关系的重要性。使得输入模型的词语经过句法上下文特征的加强后,能够包含更多语义信息。
-
-
-
-
-
-
-
-
-