一种训练用于预测社交网络用户转发消息的模型的方法

    公开(公告)号:CN107566249B

    公开(公告)日:2020-12-29

    申请号:CN201710727462.7

    申请日:2017-08-23

    Abstract: 一种训练用于预测社交网络用户转发消息的模型的方法,包括:1)获得所述社交网络中的历史数据,所述历史数据包括不同用户对同一条消息进行发布、转发的次序;2)根据所述历史数据,求解使得损失函数取值最小时各名用户的影响力和易感性;其中,所述影响力用于描述该名用户发布的消息被转发的概率,所述易感性用于描述该名用户受到发布消息的源发用户的影响而对所述消息进行转发的概率,所述损失函数是发布消息的源发用户的影响力、除所述源发用户之外的其他用户的易感性的函数;以及其中,所述用户的影响力和易感性作为所述用于预测社交网络用户转发消息的模型的参数。

    一种特定分布式数据存储文件结构去冗余构造方法及系统

    公开(公告)号:CN105718561A

    公开(公告)日:2016-06-29

    申请号:CN201610037778.9

    申请日:2016-01-20

    Inventor: 查礼 谷靖宇

    CPC classification number: G06F16/174 G06F16/13 G06F16/182

    Abstract: 本发明提出一种特定分布式数据存储文件结构去冗余构造方法及系统,涉及分布式系统技术领域,采用该方法构造的数据存储文件不会影响分布式顺序表的访问方式,本方法侧重存储文件构造中数据转换过程的优化,包括数据拆分步骤、数据合并步骤、数据拼接步骤,具体步骤为:创建底层存储文件格式,将底层存储文件以所述底层存储文件格式进行存储,生成新底层存储文件;设置读取所述新底层存储文件的存储文件读取方式,将所述新底层存储文件还原成分布式系统能够读取的原始底层存储文件,并进行读取,本发明能够减少底层存储文件的冗余信息,减少数据加载时计算资源的消耗,同时减少生成的存储文件的大小,提高了加载性能。

    一种多维区间查询方法及系统

    公开(公告)号:CN101866358B

    公开(公告)日:2012-09-05

    申请号:CN201010205946.3

    申请日:2010-06-12

    Abstract: 本发明涉及一种多维区间查询方法和系统,方法包括:步骤1,将用于备份数据的副本组织成为多份互为补充和校验的互补聚簇索引表;互补聚簇索引表以每个索引列创建一张以列值加原行主键加列值长度为新主键的顺序表,并将原行中其余列的数据完整存储;互补聚簇索引表用于供查询时进行连续扫描;步骤2,将查询串转换为查询计划树,进行查询优化后完成查询的执行。本发明能够同时满足高性能、低存储开销和高可靠性要求。

    基于不一致窗口的索引表与主文件一致性强度的度量方法

    公开(公告)号:CN107291823B

    公开(公告)日:2020-02-28

    申请号:CN201710380223.9

    申请日:2017-05-25

    Abstract: 本发明涉及一种基于不一致窗口的索引表与主文件一致性强度的度量方法,该方法包括有:向存在的数据库索引软件读取主文件中记录的步骤;对记录进行不同进程下的读或写操作得到度量操作的步骤;多进程下的并发执行串行化获得执行序列的步骤;对执行序列按照度量操作结束时间先后排序获得结果序列的步骤;最后是根据不一致窗口度量方法计算索引技术的不一致窗口大小的步骤。本发明的方法解决了现有数据库索引技术的缺陷,即没有一种定量去度量索引表与主文件之间的一致性强度的方法,也无法比较在属于同一种一致性模型下数据库索引技术的一致性强度。

    提高顺序表性能方法、系统、架构、优化方法及存储装置

    公开(公告)号:CN105045891B

    公开(公告)日:2018-08-31

    申请号:CN201510462899.3

    申请日:2015-07-31

    Inventor: 查礼 刘威

    Abstract: 本发明提供一种提高分布式顺序表性能的方法、系统、改进的HBase架构、数据存储装置及内存数据存储结构优化方法,该提高分布式顺序表性能的方法,通过对HB+‑Trie树结构进行改进来提高分布式顺序表性能,包括:步骤1,为HB+‑Trie树结构选择最佳分段值,根据所述最佳分段值将键值key分成不同的段,并对不同的分段进行层次存储从而构成所述HB+‑Trie树结构的节点;步骤2,为所述HB+‑Trie树结构的每个节点设定一个阈值,节点中数据条数小于相应的阈值则不向下扩展。由此,能够提高现有分布式顺序表系统插入性能、删除性能、查询性能和降低内存利用率。

    一种训练用于预测社交网络用户转发消息的模型的方法

    公开(公告)号:CN107566249A

    公开(公告)日:2018-01-09

    申请号:CN201710727462.7

    申请日:2017-08-23

    Abstract: 一种训练用于预测社交网络用户转发消息的模型的方法,包括:1)获得所述社交网络中的历史数据,所述历史数据包括不同用户对同一条消息进行发布、转发的次序;2)根据所述历史数据,求解使得损失函数取值最小时各名用户的影响力和易感性;其中,所述影响力用于描述该名用户发布的消息被转发的概率,所述易感性用于描述该名用户受到发布消息的源发用户的影响而对所述消息进行转发的概率,所述损失函数是发布消息的源发用户的影响力、除所述源发用户之外的其他用户的易感性的函数;以及其中,所述用户的影响力和易感性作为所述用于预测社交网络用户转发消息的模型的参数。

    一种分布式文件系统的自适应压缩方法及系统

    公开(公告)号:CN105718538A

    公开(公告)日:2016-06-29

    申请号:CN201610030950.8

    申请日:2016-01-18

    Inventor: 查礼 王锐坚 王超

    CPC classification number: G06F17/30153 G06F17/30194

    Abstract: 本发明提出一种分布式文件系统的自适应压缩方法及系统,涉及分布式系统文件压缩领域,该方法包括步设置压缩文件格式,形成压缩数据流,所述压缩数据流由头部信息与多个数据块组成,其中所述头部信息用于判断所述压缩数据流是否已经过压缩;接收所述待压缩文件,将所述待压缩文件按照所述压缩文件格式将所述待压缩文件进行压缩生成所述压缩数据流;设置索引文件,其中所述索引文件由多个记录组成,每条记录维护所述压缩数据流中数据的数据信息,所述索引文件用于快速定位所述压缩数据流。本发明能够提高压缩效率,节省压缩时间。

    一种面向分布式顺序表的缓存方法及系统

    公开(公告)号:CN105045894A

    公开(公告)日:2015-11-11

    申请号:CN201510463230.6

    申请日:2015-07-31

    CPC classification number: G06F17/3048 G06F17/30545 G06F17/30575

    Abstract: 本发明涉及分布式信息处理技术领域,特别涉及一种面向分布式顺序表的缓存方法及系统,该方法包括为所有数据块设置基础分值,当进行数据查询操作时,通过分布式顺序表,获取数据查询操作所涉及的数据范围,统计数据范围中各数据块将要被访问的访问次数,将访问次数累加到相应的数据块;当数据块被缓存命中时,被命中的数据块的分值减去固定值,当缓存空间已满时,则触发缓存的换出操作,在换出操作开始时,根据数据块的分值进行排序,从分值最小的数据块开始淘汰,直到缓存空间能够增加数据块。

    分布式顺序表片内二级索引方法及系统

    公开(公告)号:CN104133867A

    公开(公告)日:2014-11-05

    申请号:CN201410345063.0

    申请日:2014-07-18

    Inventor: 查礼 万浩 程学旗

    CPC classification number: G06F17/30321

    Abstract: 本发明公开了一种分布式顺序表片内二级索引方法及系统,其中系统包括,索引布局管理模块,为每个数据存储文件创建对应的索引存储文件;一致性更新模块,写入数据时,先将该数据写入预写日志中,再写入内存存储中,若该内存存储中该数据部分丢失,将该预写入日志中未成功写入磁盘上的该数据重新写入该内存存储中;内存存储刷写模块,若该内存存储存量达到某阈值,先生成该内存存储中类型不为“删除”的数据记录对应的索引记录,并刷写该索引记录到该磁盘上生成该索引存储文件,再生成数据存储文件;合并和分裂模块,索引存储文件随着数据存储文件一起合并和分裂,保证两者的一致性;多维区间查询模块,对每个数据分片单独查询,一次查询可使用多列索引。

    一种网格文件处理方法及其处理设备

    公开(公告)号:CN101291346B

    公开(公告)日:2012-02-15

    申请号:CN200810114496.X

    申请日:2008-06-06

    Abstract: 本发明提供一种用于处理网格文件系统中文件的方法,包括:网格文件系统根据网格用户的身份信息GUInfo获取用于表示所述主机用户文件挂载点信息NStruc的元数据;网格文件系统进行初始化操作,构造元数据表;根据文件操作命令,通过虚拟路径转换确定文件以及文件所在的主机用户文件挂载点;根据元数据表中的信息,将网格用户映射到文件所在主机用户文件挂载点上的主机用户nU;主机根据所述主机用户nU所提交的文件操作命令查找对应的主机文件;根据文件操作命令处理主机文件。本发明通过对网格文件的虚拟化表示和面向网格用户的设计,屏蔽了不同主机和/或不同文件系统的差异,在不需对主机文件系统进行修改的情况下提供方便、统一的网格文件处理操作。

Patent Agency Ranking