-
公开(公告)号:CN113468887A
公开(公告)日:2021-10-01
申请号:CN202110685661.2
申请日:2021-06-21
Applicant: 上海交通大学
IPC: G06F40/295 , G06F40/30 , G06N3/04
Abstract: 本发明提供了一种基于边界与片段分类的学者信息关系抽取方法,所述方法包括如下步骤:步骤S1:获取不同教师的个人信息和文本内容;步骤S2:将文本中实体词进行同类实体词替换扩增训练数据;步骤S3:使用预训练模型对文本进行嵌入并提取语义特征;步骤S4:主体词边界识别和实体片段分类;步骤S5:客体词边界以及对应关系边界识别和实体片段分类;步骤S6:根据识别和分类结果进行用户画像。利用概率图思想、结合半指针‑半标注方式,解决关系抽取中一个主体词对应多个客体词,一个客体词对应多个主体词,两个相同实体之间关系不同的问题。利用边界增强实体片段分类的方式能够降低尾指针预测错误带来的影响,提高实体关系抽取准确率。
-
公开(公告)号:CN112733543A
公开(公告)日:2021-04-30
申请号:CN202110105747.3
申请日:2021-01-26
Applicant: 上海交通大学
IPC: G06F40/295
Abstract: 本发明提供了一种基于文本编辑生成模型的机构命名实体归一化方法和系统,包括:步骤S1:对所有的学术机构信息数据进行筛选;步骤S2:对已筛选的数据利用正则表达式去除数据中存在的噪音;步骤S3:将处理好的数据按照类别和预设比例分为训练集、微调数据集和测试集;步骤S4:将微调数据集输入预训练好的bert模型,对bert模型进行微调,利用微调好的bert模型进行训练集机构名的表征,并训练出文本编辑生成模型来实现机构名称的归一化;步骤S5:将测试集输入训练好的文本编辑生成模型,测试模型效果并进行微调。通过本发明可以对每一个学术机构的论文发表数进行统计,可以更科学更直观的对某个学术机构的学术能力进行判别。
-
公开(公告)号:CN111949771A
公开(公告)日:2020-11-17
申请号:CN202010864916.7
申请日:2020-08-25
Applicant: 上海交通大学
IPC: G06F16/33 , G06F16/335 , G06F40/295
Abstract: 本发明提供了一种基于互强化框架和排序学习的学术文献未来影响力动态排序方法及系统,包括:步骤A:基于学术实体和实体间关系抽取论文的元信息;步骤B:引入基于超图延伸定义的同构有向超图和异构二部超图,构造一个异构学术超网;步骤C:基于一种互强化排名框架HSHMRR,在异构学术超网上给不同类型的学术实体实现评分;步骤D:在互强化排名框架的基础上,结合排序学习方法MART,从历史时段中学习潜在的动态特性,并将所学知识应用到目标时段,形成评价结果;本发明采用了一种通用而有效的方法,它能够自适应地学习不同学术文献数据集的潜在动态性质,并将所学知识应用于排名。
-
公开(公告)号:CN106250438B
公开(公告)日:2020-07-14
申请号:CN201610595617.1
申请日:2016-07-26
Applicant: 上海交通大学
IPC: G06F16/35 , G06F16/9535 , G06F16/9536 , G06K9/62
Abstract: 本发明提供了一种基于随机游走模型的零引用文章推荐方法及系统,包括:步骤1:构建学术网络模型,通过随机游走法获得每篇论文的第一作者、会议或期刊、机构、发表时间所对应的特征值;步骤2:建立排序模型,并选取经步骤1处理后的论文数据构建训练集;步骤3:通过弱分类器对训练集进行排序;步骤4:判断弱分类器的排序结果是否与训练集的真实排序结果相匹配,得到最优排序模型;步骤5:通过排序模型推荐用户所需零引用文献。本发明使用了全新的论文排序思想,从而使得新发表的论文可以得到更加有效地推荐,便于用户获得最相关的新论文。
-
公开(公告)号:CN111309917A
公开(公告)日:2020-06-19
申请号:CN202010167905.3
申请日:2020-03-11
Applicant: 上海交通大学
IPC: G06F16/35 , G06F16/332
Abstract: 本发明提供了一种基于会议期刊星系图的超大规模学术网络可视化方法及系统,包括:步骤M1:从数据库中获取论文相关数据,并将数据存储在文件中;步骤M2:根据论文的相关数据,对论文按照会议或期刊聚类,并生成包含相应聚类的节点和连边参数的图文件;步骤M3:使用自动化布局工具对相应聚类的节点和连边参数的图文件快速布局,得到聚类内部布局,并生成包含节点位置信息的图文件;步骤M4:根据聚类之间的引用关系,等效聚类之间力的大小,并使用力引导算法生成聚类间星系结构;步骤M5:根据聚类间星系结构对聚类进行融合,得到可视化结果。本发明以图的方式展示大量论文之间的引用关系,使得原本抽象的论文引用关系变得清晰可见。
-
公开(公告)号:CN106441302B
公开(公告)日:2020-06-12
申请号:CN201610848830.9
申请日:2016-09-23
Applicant: 上海交通大学
Abstract: 本发明提供了一种大型开放式区域内的室内定位方法,包括步骤:第一步,根据部署在定位区域内的多个蓝牙节点,采用三角定位法确定用户的初始位置;第二步,根据用户手机惯性传感器的输出值确定用户的近似位移距离与位移方向;第三步,由于惯性传感器的测量误差,采用改进型粒子滤波算法,在用户新位置的可能范围内采样产生粒子;第四步:基于粒子的两个属性(步长和转角)的分布以及手机采集到的磁场强度,联合确定粒子的权重,采用加权平均算法确定用户的新位置。本发明基于手机内置传感器,通过改进型粒子滤波算法和关键位置部署的蓝牙节点,实现了用户在大型开放式区域内的精确定位。
-
公开(公告)号:CN110222273A
公开(公告)日:2019-09-10
申请号:CN201910399864.8
申请日:2019-05-14
Applicant: 上海交通大学
IPC: G06F16/9536 , G06F16/9537 , G06Q50/00
Abstract: 本发明提供一种基于地理社区的社交网络中商业点推广方法和系统,基于用户在社交网络中所发布的历史位置信息大数据,挖掘用户密集分布的地理社区和用户与地理社区的归属关系;基于用户社交关系、地理社区中用户的地理分布和所推广商业点的位置,建立推广商业点的信息在地理社区中的传播模型;运用贪心算法,选取能够带来最大期望推广效益的多个地理社区,并将该多个地理社区中的用户的密集分布位置作为商业点推广信息的初始投放位置。利用实际生活中广泛存在的地理社区,确定地理社区中用户稳定的位置分布,从而为商业点确定目标用户的位置分布;基于地理社区中用户的密集分布位置,为商业点推广广告的定向投放提供可带来最大期望收益的投放位置。
-
公开(公告)号:CN106250438A
公开(公告)日:2016-12-21
申请号:CN201610595617.1
申请日:2016-07-26
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于随机游走模型的零引用文章推荐方法及系统,包括:步骤1:构建学术网络模型,通过随机游走法获得每篇论文的第一作者、会议或期刊、机构、发表时间所对应的特征值;步骤2:建立排序模型,并选取经步骤1处理后的论文数据构建训练集;步骤3:通过弱分类器对训练集进行排序;步骤4:判断弱分类器的排序结果是否与训练集的真实排序结果相匹配,得到最优排序模型;步骤5:通过排序模型推荐用户所需零引用文献。本发明使用了全新的论文排序思想,从而使得新发表的论文可以得到更加有效地推荐,便于用户获得最相关的新论文。
-
公开(公告)号:CN105787068A
公开(公告)日:2016-07-20
申请号:CN201610116043.5
申请日:2016-03-01
Applicant: 上海交通大学
Abstract: 本发明提供的一种基于引用网络及用户熟练度分析的学术推荐方法及系统,包括如下步骤:步骤1,采用模型进行分析,得到第一候选集;步骤2,采用论文引用网络进行分析,得到第二候选集;步骤3,采用用户熟悉度分析,得到第三候选集;步骤4,对第一候选集、第二候选集和第三候选集进行过滤排序,得到推荐候选集;步骤5,展示推荐候选集。与现有技术相比,本发明的有益效果如下:在传统推荐系统的基础之上,结合对引用网络及领域熟练度的分析,增强了学术推荐的个性化,打造了一套更加适合研究人员的推荐系统。
-
公开(公告)号:CN105631018A
公开(公告)日:2016-06-01
申请号:CN201511016955.7
申请日:2015-12-29
Applicant: 上海交通大学
IPC: G06F17/30
CPC classification number: G06F17/30687
Abstract: 本发明提供了一种基于主题模型的文章特征抽取方法,包括:基于原始语料库构建文章的引用关系网络,构建主题模型的生成模型和参数联合表达式,根据所述生成模型构建主题模型的推断过程,对新语料库采样文章,根据采样文章的采样结果提取文章参数。本发明使用了文章引用网络以扩展传统的主题模型,从而提取出更加精确的文章特征。
-
-
-
-
-
-
-
-
-