一种用户鼠标行为的合成与模拟方法及系统

    公开(公告)号:CN107908300B

    公开(公告)日:2019-08-13

    申请号:CN201711148377.1

    申请日:2017-11-17

    Abstract: 本发明涉及一种用户鼠标行为的合成与模拟方法及系统,包括:(1)数据采集与处理:实时采集用户的原始鼠标数据,分割、清洗后,存入历史操作数据库;(2)模型训练:对于无需移动的操作,训练截尾正态分布模型,生成时间间隔参数;对于需要移动的操作,提取聚类特征和匹配特征,构建训练集;(3)操作合成与模拟:对于无需移动的操作,使用截尾正态分布模型构造模拟操作的消息序列;对于需要移动的操作,使用聚类模型和分类模型,匹配出一个样本作为模板;合成出符合待模拟操作的要求参数的合成操作序列。

    一种用于中文句子语义相似度计算的方法,设备以及计算机可读存储介质

    公开(公告)号:CN109101494A

    公开(公告)日:2018-12-28

    申请号:CN201810909436.0

    申请日:2018-08-10

    Abstract: 本发明提供一种用于中文句子语义相似度计算的方法,设备以及计算机可读存储介质,对字级别词向量进行预训练;基于句子语义相似度训练集表示句子向量;提取手工特征;基于TCN的神经网络计算,输出句子之间的语义相似度结果。对中文句子不进行分词处理,构建字级别的词向量,用时间卷积网络分别对两个句子进行时间卷积操作提取特征向量,结合手工提取的特征,然后将两个句子的特征向量和手工特征拼接起来,最后计算出两个句子语义相似度。可以很好地避免分词结果的误差传播,也解决了lstm训练速度慢、cnn只有局部特征的问题,可以很好地完成中文句子语义相似度的计算。

    一种基于融合思想的实体多准则综合排序方法,设备及存储介质

    公开(公告)号:CN109086980A

    公开(公告)日:2018-12-25

    申请号:CN201810778206.5

    申请日:2018-07-16

    Abstract: 本发明提供一种基于融合思想的实体多准则综合排序方法,基于融合思想的实体多准则综合排序的初始化及预处理;基于TOPSIS方法对整体排序;对排序结果分组;基于ELECTRE方法分组内排序;若分组后组内元素数不少于2个,采用ELECTRE方法进行排序;合并排序结果,迭代执行直到每组元素个数少于2个。使基于多个准则的方案排序的结果更加精确,为决策问题提供更加合理的方案参考,以便决策者根据备选方案的优劣作出及时、准确的评判和决定。不管是应用到经济、政治、文化领域,还是医疗、教育领域都会有显著效果。

    一种基于无监督学习的领域词发现方法

    公开(公告)号:CN111881678B

    公开(公告)日:2023-11-10

    申请号:CN202010747924.3

    申请日:2020-07-30

    Abstract: 本发明涉及一种基于无监督学习的领域词发现方法,属于计算机文本信息处理技术领域,输入通用语料和领域语料便可提取出来领域词,步骤为先把通用语料和领域语料切分,获得通用候选词库和领域候选词库,两种领域词库的处理方式相同;获取了通用候选词库和领域候选词库,对领域文本进行无监督学习,将两个词库中的词频转换为对应的概率,对两个词库的未分割句子任意切分,计算每一种切分方式的标准化概率得分,统计得分靠前的句子切分组合中的词语,收集领域词汇,把领域候选词库中的通用词转移到通用候选词库中,并保存获得领域词汇。无需人工标注语料,提高了含有标点符号的实体名称识别率。

Patent Agency Ranking