-
公开(公告)号:CN117668793A
公开(公告)日:2024-03-08
申请号:CN202311653018.7
申请日:2023-12-04
Applicant: 北京大学长沙计算与数字经济研究院 , 北京大学
IPC: G06F21/31 , G06F18/213 , G06N3/0499 , G06N3/084 , G06F18/241 , G06F16/35
Abstract: 本申请涉及一种作者身份识别模型的训练方法、装置和计算机设备。包括:对获取的样本文章数据进行情感分析,得到文章情感特征,并根据文章情感特征,识别样本文章数据的初始作者数据,如此,便可根据文章情感特征与情感特征标签之间的差异,对情感分析模型进行第一训练,得到训练好的情感分析模型,并根据初始作者数据与样本作者数据之间的差异,对认证分析模型进行第二训练,得到训练好的认证分析模型。本申请可高效又准确地分析大量文章数据,并自动验证文章作者的身份。
-
公开(公告)号:CN119377258A
公开(公告)日:2025-01-28
申请号:CN202411409774.X
申请日:2024-10-10
Applicant: 北京大学长沙计算与数字经济研究院
IPC: G06F16/2453 , G06F16/27 , G06F16/22
Abstract: 本申请涉及一种数据收集与检索分布式系统、方法和计算机设备。包括:前端应用,用于通过多协程并发执行数据库对初始数据的收集;ES集群,用于根据不同集群节点的运行情况进行索引恢复,并通过倒排索引对目标数据进行检索;后端应用,基于微服务框架进行服务注册与发现,为前端应用提供与初始数据或目标数据关联的信息调用;消息中间件,用于对数据收集和数据检索的过程进行动态调节。本申请能够实现快速检索并确保分布式条件下的数据一致性。
-
公开(公告)号:CN117494672B
公开(公告)日:2024-07-23
申请号:CN202311506829.4
申请日:2023-11-13
Applicant: 北京大学长沙计算与数字经济研究院 , 北京大学
IPC: G06F40/166 , G06F40/186 , G06F40/205 , G06F40/211 , G06F40/289 , G06F40/30
Abstract: 本发明涉及文本处理技术领域,公开了行业文档的生成方法、装置及计算机可读存储介质,该方法包括:响应于用户的第一指示,获取相应的规范文档及文档生成需求;基于规范文档及文档生成需求,生成第一行业文档;响应于用户的第二指示,基于预设的行业数据库及规范文档提取评价规则;基于评价规则对第一行业文档进行分析评测,并生成优化方案;响应于用户的确认指示,基于优化方案生成第二行业文档。本发明在通过规范文档及文档生成需求生成第一行业文档之后,可以根据用户的第二指示对第一行业文档进行优化,从而得到第二行业文档,能够提高数据、资料的查找效率的同时,提高行业文档的完整性。
-
公开(公告)号:CN117494672A
公开(公告)日:2024-02-02
申请号:CN202311506829.4
申请日:2023-11-13
Applicant: 北京大学长沙计算与数字经济研究院 , 北京大学
IPC: G06F40/166 , G06F40/186 , G06F40/205 , G06F40/211 , G06F40/289 , G06F40/30
Abstract: 本发明涉及文本处理技术领域,公开了行业文档的生成方法、装置及计算机可读存储介质,该方法包括:响应于用户的第一指示,获取相应的规范文档及文档生成需求;基于规范文档及文档生成需求,生成第一行业文档;响应于用户的第二指示,基于预设的行业数据库及规范文档提取评价规则;基于评价规则对第一行业文档进行分析评测,并生成优化方案;响应于用户的确认指示,基于优化方案生成第二行业文档。本发明在通过规范文档及文档生成需求生成第一行业文档之后,可以根据用户的第二指示对第一行业文档进行优化,从而得到第二行业文档,能够提高数据、资料的查找效率的同时,提高行业文档的完整性。
-
-
-