一种基于大语言模型构建自然人价值体系的文本处理方法

    公开(公告)号:CN117829157A

    公开(公告)日:2024-04-05

    申请号:CN202311755098.7

    申请日:2023-12-18

    Abstract: 本发明公布了一种基于大语言模型构建自然人价值体系的文本处理方法,属于人类价值建模和大型语言模型技术领域,采用大语言模型对自然人价值相关文本材料进行基于语义的自然语言处理与分析,训练得到基于价值理解的大语言模型,并对规模化自然人语料进行价值的识别与分析,对价值体系进行适应性重构;通过为不同价值维度对应的指标赋值形成表征向量,将自然人价值观嵌入到具有可解释性的有限维度量空间中,转化为可量化、可计算的具体数值,从而实现对自然人价值观的建模;并检验所生成价值体系的可靠性、有效性和完备性。

    一种医学疾病诊断记录中实体消歧的方法

    公开(公告)号:CN106951684B

    公开(公告)日:2020-10-09

    申请号:CN201710112316.3

    申请日:2017-02-28

    Applicant: 北京大学

    Abstract: 本发明公布了一种疾病诊断记录中实体名称消歧的方法,基于异构伴病网络和图模型,对医学疾病诊断记录中多个待消歧的实体名称进行消歧。利用待消歧实体名称和候选实体名称之间的相似度作为局部信息,并将同一条记录中其它待消歧实体对当前待消歧实体的贡献作为全局信息,能提升医学实体名称消歧的准确率;根据疾病诊断记录和标注数据建立异构伴病网络,更直观可信的反映疾病与疾病、疾病与手术之间关系,准确、高效的将实体名称进行标准名称映射,解决诊断信息下医学疾病实体名称存在的歧义问题,满足实际应用需求。

    一种多主题消息传播中结构洞节点的挖掘方法

    公开(公告)号:CN106570188B

    公开(公告)日:2019-11-01

    申请号:CN201611001739.X

    申请日:2016-11-14

    Applicant: 北京大学

    Abstract: 本发明公布了一种多主题消息传播中结构洞节点的挖掘方法,以网络中传递的消息作为输入数据,包括:先令各节点的结构洞分数为零;生成综合网络拓扑结构和各主题下的子图;对各主题下的子图分别进行社区划分;通过多主题打分方法对各个节点进行多主题结构洞打分,得到各个节点的结构洞分数;输出结构洞分数最高的k个节点,作为结构洞节点。本发明提供方法能够准确高效的挖掘出有价值的结构洞节点,解决多主题下的结构洞挖掘问题;在保持较高的时间效率基础上,显著提升了结构洞节点挖掘结果的准确率;且综合考虑多主题下节点对消息传播的影响。

    一种社交网络拓扑结构的推断方法

    公开(公告)号:CN106022937B

    公开(公告)日:2019-04-02

    申请号:CN201610365770.5

    申请日:2016-05-27

    Applicant: 北京大学

    Inventor: 宋国杰 窦芃 赵彤

    Abstract: 本发明公布了一种社交网络拓扑结构的推断方法,针对存在缺失的级联数据,通过估计在网络中添加不同边所带来似然值的边际增益的大小,得到逐步添加边的顺序,每次添加似然值最大的边,直至所有边添加完成,由此补全所述社交网络拓扑结构;包括:初始化待推断网络G、进行循环迭代计算边际收益和取边际收益最大的边添加到Gi‑1中得到新的网络,完成迭代即得到推断出的网络拓扑结构。本发明方法适用性广,尤其可以应用于级联数据缺失情形;本发明技术方案在保持较高的时间效率基础上,显著提升了网络推断结果的准确率,可以成为真实世界中推断隐藏网络结构的有效手段。

    一种基于网络流的大范围高速路网动态配流方法

    公开(公告)号:CN105761492B

    公开(公告)日:2018-07-13

    申请号:CN201610288947.6

    申请日:2016-05-04

    Applicant: 北京大学

    Abstract: 一种基于网络流的大范围高速路网动态配流方法。本发明公布了一种基于网络流的事件条件下大范围高速路网动态配流方法,首先加载路网和事故路段信息,计算瘫痪路网,生成新的路网结构;再根据新的路网结构、路段实时流量和路段组成成分等信息更新实时OD矩阵;然后根据实时OD矩阵迹路段实时流量计算所有收费站限流情况;最后根据实时OD矩阵及路段实时流量计算每个OD对流量的分配方式,由此获得从每个路网节点流向各个路段的最优流量和路网内各路段分配后的最优实时流量。本发明具有可覆盖路网面积大、运算成本低和结果实时性强等优势,在真实路网规模下可高效生成配流方案,解决事件条件下交通流组织问题,满足实际应用需求。

    一种医学疾病诊断记录中实体消歧的方法

    公开(公告)号:CN106951684A

    公开(公告)日:2017-07-14

    申请号:CN201710112316.3

    申请日:2017-02-28

    Applicant: 北京大学

    Abstract: 本发明公布了一种疾病诊断记录中实体名称消歧的方法,基于异构伴病网络和图模型,对医学疾病诊断记录中多个待消歧的实体名称进行消歧。利用待消歧实体名称和候选实体名称之间的相似度作为局部信息,并将同一条记录中其它待消歧实体对当前待消歧实体的贡献作为全局信息,能提升医学实体名称消歧的准确率;根据疾病诊断记录和标注数据建立异构伴病网络,更直观可信的反映疾病与疾病、疾病与手术之间关系,准确、高效的将实体名称进行标准名称映射,解决诊断信息下医学疾病实体名称存在的歧义问题,满足实际应用需求。

    一种基于位置的移动社会网络用户关系的识别方法

    公开(公告)号:CN106372072A

    公开(公告)日:2017-02-01

    申请号:CN201510427877.3

    申请日:2015-07-20

    Applicant: 北京大学

    Inventor: 宋国杰 刘丹萌

    Abstract: 本发明公布了一种基于位置的移动社会网络用户关系识别方法,基于用户数据构建移动社会网络,通过对用户行为进行特征提取建立因子图模型,再进行模型参数学习和多元关系并行推断,得到用户关系;包括对用户数据进行预处理,获得抽样数据;利用抽样数据提取用户行为特征,包括交互行为特征和空间行为特征;得到用户关系的交互因子、空间因子和团因子;建立因子图模型;针对因子图模型进行参数学习训练;利用训练好的因子图模型通过多元关系并行推断方法进行关系识别,得到用户多元关系。本发明考虑空间位置交互特征、用户周边环境以及家庭和同事关系之间的相互作用,可提高关系识别的准确率。

    一种面向移动社会网络的用户出行预测方法

    公开(公告)号:CN106339769A

    公开(公告)日:2017-01-18

    申请号:CN201510397547.4

    申请日:2015-07-08

    Applicant: 北京大学

    Inventor: 宋国杰 王韵

    Abstract: 本发明公布了一种面向移动社会网络的用户出行预测方法,通过计算用户出行的时空熵来确定用户在不同时空场景下出行的不确定性,再根据时空熵建立预测模型对用户出行行为进行预测,包括步骤:进行数据预处理;计算得到用户出行的时空熵;根据设定的时空熵阈值和计算得到的时空熵,建立预测模型进行预测;采用个人预测模型时进行支持度计算;若存在社交关系则建立基于社交关系的出行预测模型;若不存在社交关系则采用动态贝叶斯网络模型。本发明技术方案能够区分用户在不同时空位置的可预测性,且考虑不同社会关系对用户出行的影响;从而使得预测准确性高,预测效果更佳。

    一种社交网络拓扑结构的推断方法

    公开(公告)号:CN106022937A

    公开(公告)日:2016-10-12

    申请号:CN201610365770.5

    申请日:2016-05-27

    Applicant: 北京大学

    Inventor: 宋国杰 窦芃 赵彤

    CPC classification number: G06Q50/01 H04L41/12

    Abstract: 本发明公布了一种社交网络拓扑结构的推断方法,针对存在缺失的级联数据,通过估计在网络中添加不同边所带来似然值的边际增益的大小,得到逐步添加边的顺序,每次添加似然值最大的边,直至所有边添加完成,由此补全所述社交网络拓扑结构;包括:初始化待推断网络G、进行循环迭代计算边际收益和取边际收益最大的边添加到Gi‑1中得到新的网络,完成迭代即得到推断出的网络拓扑结构。本发明方法适用性广,尤其可以应用于级联数据缺失情形;本发明技术方案在保持较高的时间效率基础上,显著提升了网络推断结果的准确率,可以成为真实世界中推断隐藏网络结构的有效手段。

Patent Agency Ranking