基于资源整合与信息传播特征的社区发现及演化方法

    公开(公告)号:CN103106616A

    公开(公告)日:2013-05-15

    申请号:CN201310062057.X

    申请日:2013-02-27

    Abstract: 本发明涉及社会信息化传播网络中用户行为的数据挖掘,本发明具体公开了一种基于资源整合与信息传播特征的社区发现及演化方法,从而更加精确地定义用户社区,并发现有意义的社区演化模式。本发明针对现有社区发现与演化方法中网络资源整合度低和信息传播因素考虑较少等特点,提出了基于资源整合的社区发现方法,利用共享潜在特征的协同矩阵分解方法将用户行为和用户交互行为有机地结合到一起;并以信息传播理论为指导,纳入用户的好友影响为信息传播特征,基于一阶马尔科夫假设,采用机器学习方法完成社区演化模式的挖掘。实验表明这一方案能有效地提高用户社区的挖掘与演化质量。

    一种基于情景信息的个性化资源信息的推荐方法

    公开(公告)号:CN101751448A

    公开(公告)日:2010-06-23

    申请号:CN200910089587.7

    申请日:2009-07-22

    Abstract: 本发明公开一种基于情景信息的个性化资源信息的推荐方法,该方法:对协作式标注系统网页进行预处理,根据特定用户抽取其所有的标注行为的信息,包括标注的资源信息、使用的标签信息,以及标注的时间信息,将用户所有的标注行为的信息存储于数据库;根据数据库中用户对资源使用的标签信息以及标注资源的时间信息,生成表达用户喜好的评分数据;基于生成的用户喜好的评分数据计算用户之间的相似度,以确定具有相似兴趣的用户近邻;根据用户近邻的喜好信息向该用户推荐其未标注过的资源,完成协同过滤个性化资源的推荐。实验表明通过集成情景信息可以为用户提供更好的个性化推荐服务。

    一种基于知识库的医院信息搜索引擎及系统

    公开(公告)号:CN101441636A

    公开(公告)日:2009-05-27

    申请号:CN200710177798.7

    申请日:2007-11-21

    Abstract: 本发明基于知识库的医疗搜索引擎及系统,抓取中文医疗健康目录构建原始医疗网页库;对原始医疗网页库中的网页进行相关信息抽取,提取对医院、科室、医生的评论信息,构建医疗评论信息库;使用词频统计和调查问卷,对抽取的相关信息进行医疗评论属性字段提取,提取观点短语,观点短语倾向性分析,给出评论评论信息是正面或是反面的分析结果,确定医院、科室、医生的排名;根据医疗知识库对搜索结果进行排序,将高度结构化和高度相关的信息提供给用户。本发明针对通用搜索引擎结果信息是非结构化、相关度和准确度低等缺点,构建医疗知识库,为用户提供高度结构化的医疗信息,提高用户查询医疗信息相关度和准确率,能有效提高搜索结果的准确率和召回率。

    媒体转引类型的识别方法、装置、电子设备及存储介质

    公开(公告)号:CN114818733A

    公开(公告)日:2022-07-29

    申请号:CN202210555613.6

    申请日:2022-05-20

    Abstract: 本发明公开了一种媒体转引类型的识别方法、装置、电子设备及存储介质,属于自然语言处理领域。其中,该方法包括:将源媒体发布的源信息和转引媒体发布的转引信息输入预训练语言模型,分别得到源信息和转引信息的篇章表示向量以及句子表示向量;对源信息和转引信息的各句子表示向量进行双向交互式语义信息学习,得到双向的交互语义篇章表示向量;将基于预训练语言模型得到篇章表示向量和交互语义篇章表示向量进行融合,得到增强语义表示向量;根据所述增强语义表示向量进行媒体转引类型识别,得到媒体转引类型。通过本发明,实现了多层级、细粒度地增强篇章的语义表征能力,有效提升媒体转引类型的识别性能。

Patent Agency Ranking