基于大数据的股票市场的内幕交易行为的识别方法

    公开(公告)号:CN110648231A

    公开(公告)日:2020-01-03

    申请号:CN201910745026.1

    申请日:2019-08-13

    Abstract: 本发明公开了一种基于大数据的股票市场的内幕交易行为的识别方法,包括以下步骤:获取公司相关数据;计算股票成交量均值的增量,若大于阈值,则计算该行业的所有股票成交量均值的增量,若小于阈值,则查询前期是否发布对外公告,计算对外公告引起的股票收盘价的波动幅度,若不超过波动阈值,则计算该上市公司的加权平均净资产收益率是否低于加权平均净资产收益率,若低于,则获取后期的上市公司的对外公告,判断是否为利好公告,若是,则计算后期股票收盘价的最大涨幅,如果大于涨幅阈值,则查询是否有与该公司的股票概念板块语义一致的信息,若没有,则该股票存在内幕交易行为。本发明具有实时监测、精准识别股票市场内幕交易行为的有益效果。

    一种学术论文高效分配方法

    公开(公告)号:CN103336804A

    公开(公告)日:2013-10-02

    申请号:CN201310250302.X

    申请日:2013-06-21

    Abstract: 本发明公开了一种学术会议论文高效分配方法,包括:建立学术会议论文数据库;根据数据库中的实体及其属性搜集数据;根据数据库中的审稿人对论文的竞标程度、审稿人研究方向、论文方向、论文对审稿人的利益冲突、审稿人对论文的利益冲突、审稿人的冲突域等内容计算得分矩阵,同时需要加上审稿人不能审阅自己的论文的自然约束条件;根据得分矩阵对文章进行“冷热”度排序,并利用启发式算法对“冷门”论文进行优先分配,如果出现并列分数的情况,应加入对并列分数审稿人的意向以及工作量的考虑,再进行选择;在进行得分矩阵遍历的时候,需要考虑每位审稿人的工作量均衡分配;最后,将分配结果反映到矩阵中,直观反映审稿任务分配结果。

    征信模型的成员隐私风险检测的数据生成方法及系统

    公开(公告)号:CN119558955A

    公开(公告)日:2025-03-04

    申请号:CN202411504808.3

    申请日:2024-10-27

    Inventor: 吴俊杰 韩潇

    Abstract: 本发明公开了一种征信模型的成员隐私风险检测的数据生成方法及系统,包括:分别估算成员数据和非成员数据在各个征信类别上的平均预测置信度,作为判断阀值;从待测目标征信模型的样本空间中随机采样得到一个样本,并对于样本的每一个特征维度,从该特征维度的特征值空间中随机采样一个新的特征值替换当前的特征值,生成得到一个种子样本;将种子样本输入至待测目标征信模型,得到后验概率预测输出;当种子样本在目标标签c的预测概率满足成员数据或非成员数据的判断阈值条件时,则对应作为成员检测样本或非成员检测样本;生成满足样本数量的检测数据。本发明能够更精准地捕捉征信模型在两类不同数据上的表现差异,保障所生成检测数据的有效性。

    多平台信息疫情风险评估方法及装置

    公开(公告)号:CN114896522A

    公开(公告)日:2022-08-12

    申请号:CN202210382759.5

    申请日:2022-04-14

    Abstract: 本发明公开了多平台信息疫情风险评估方法,包括:步骤一:采集各平台的流数据;步骤二:对每条流数据,提取域名列表,获得域名重定向历史信息,并与域名可靠性语料库匹配,获得流数据的可靠性标签;步骤三:对每条流数据,解析用户自定义位置,获得地理信息;步骤四:按照地理信息、时间两个维度对流数据进行分组;步骤五:对每组流数据,基于用户粉丝数、可靠性标签,量化静态信息疫情风险指标值;步骤六:对每组流数据,基于点赞数、转发数、评论数、可靠性标签,量化动态信息疫情风险指标值。本发明还提供了评估装置。本发明通过构建静态信息疫情风险指标和动态信息疫情风险指标,反映了信息疫情的风险上限和信息疫情程度。

    融合文本信息的信用债发债主体违约风险评估方法

    公开(公告)号:CN111583012A

    公开(公告)日:2020-08-25

    申请号:CN202010208514.1

    申请日:2020-03-23

    Abstract: 本发明公开了一种融合文本信息的信用债发债主体违约风险评估方法,包括:构建违约词典;计算新闻舆情负面程度值;获取宏观数据、财务数据、是否发生违约的数据;构建训练样本和测试样本;以上一季度的宏观数据、新闻舆情负面程度值和财务数据为输入值,以下一季度是否发生违约的数据为输出值,构建评估模型,训练并测试得到稳定的评估模型;将待评估发债主体的新闻舆情负面程度值、宏观数据、财务数据输入至评估模型,输出得到该发债主体在当前季度是否发生违约的评估数据。本发明具有融合文本信息,将难以利用结构化数据度量,且引入评估时存在较大的主观随意性的指标,以更为客观的方式纳入风险评估过程中,增强评估方法的可信度的有益效果。

    基于不同人格特征的文本观点挖掘方法

    公开(公告)号:CN110825842A

    公开(公告)日:2020-02-21

    申请号:CN201910959523.1

    申请日:2019-10-10

    Abstract: 本发明公开了一种基于不同人格特征的文本观点挖掘方法,包括以下步骤:S1、构建最大熵模型;S2、针对某个事件,将全语料依据人格特征分成多个集合语料c,并通过耦合的狄利克雷过程DP构建跨人格特征主题模型;S3、每条文档进行分词处理,将每条文档的分词组成输入列表,作为跨人格特征主题模型的输入,并初始化跨人格特征主题模型的参数;S4、根据输入内容,采用吉布斯采样法,依据跨人格特征主题模型、最大熵模型迭代计算得出最终的人格特征主题模型的参数。本发明具有自动、准确地发现事件的主要主题,并区分不同人格特征对每个主题的客观方面(属性词)和主观观点(观点词)的有益效果。

    基于关键词提取的实体名消岐方法

    公开(公告)号:CN110705295A

    公开(公告)日:2020-01-17

    申请号:CN201910859136.0

    申请日:2019-09-11

    Abstract: 本发明公开了一种基于关键词提取的实体名消岐方法,包括:文本预处理及负面词过滤阶段,词性标注及分析阶段,关键词提取组合对比三个阶段,目的是从零散且异质化严重的互联网文本中找到与实体相关且实体在文本中占有重要地位的目标文本;采用提取文本中的关键词与实体名进行组合判断是否为相关文本,在实际中可以有效的解决多个实体名出现在同一文本中时的匹配问题;本发明将多阶段处理步骤融合,极大地提升了用实体名称匹配文本的准确性。

    一种基于一致性聚类的Web文本分类方法

    公开(公告)号:CN103049581B

    公开(公告)日:2015-10-07

    申请号:CN201310025642.2

    申请日:2013-01-21

    Abstract: 本发明公开了基于一致性聚类的Web文本分类方法,包括:输入一段文字信息数据,其中包括n个文本;根据含有m个词汇的预设词库,对n个文本进行分词处理;根据每个文本中的分词在词库中出现的次数,制作每个文本的m维向量空间模型,n个文本组合在一起形成n×m的向量空间矩阵;在n×m的向量空间矩阵中随机提取n×m′的子矩阵,其中m′小于m,对n×m′子矩阵进行聚类分析;重复上述步骤r次,直到得到r个聚类分析结果;将r个聚类分析结果再进行聚类分析,得到最终聚类结果,这个最终聚类结果表征n个文本之间的归类关系,由此将n个文本分类。本方法能够克服聚类分析中的维度灾难,对海量文本数据进行分析,特别适合网络舆情监控等信息安全领域。

Patent Agency Ranking