一种基于层级化聚类的金融新闻流突发检测方法

    公开(公告)号:CN113449108B

    公开(公告)日:2022-10-21

    申请号:CN202110734921.0

    申请日:2021-06-30

    Abstract: 一种基于层级化聚类的金融新闻流突发检测方法,包括:文本的预处理;抽取关键词并构建关键词共现图;采用二分K‑Means算法对关键词聚类,将关键词共现图划分为若干子图,每个子图中的关键词为一个金融主题;通过相似度计算识别每篇金融新闻所属金融主题;构建以每篇金融新闻为节点的无向图,采用二分K‑Means算法对金融新闻聚类,将金融新闻节点无向图划分为若干子图,每个子图中的金融新闻为一个金融事件;通过相似度计算生成故事链;突发事件检测。本发明通过自然语言处理及图论相关技术,对金融新闻进行事件聚类,解决了传统金融突发事件不能将同一事件相关新闻综合考虑的问题,实现了高效准确地检测出金融突发事件,具有一定的工业价值。

    一种基于MPI的分布式ADMM垃圾邮件分类方法

    公开(公告)号:CN114154581A

    公开(公告)日:2022-03-08

    申请号:CN202111477718.6

    申请日:2021-12-06

    Abstract: 本发明公开了一种基于MPI的分布式ADMM垃圾邮件分类方法,包含以下步骤:将文本数据向量化为数字格式的数据集;将数据集分割为训练集和测试集,对训练集进行过采样处理,再分割为若干份分别保存在若干个从节点上;MPI并行执行所有节点上的代码,从节点并行更新局部模型;主节点通过MPI规约功能汇总从节点的局部模型;主节点更新全局模型,并利用MPI广播功能将全局模型分发到各个从节点;循环交替更新从节点和主节点的模型,直到满足终止条件;保存主节点的全局模型作为分类器模型;利用训练得到的分类器模型对测试集进行分类,输出分类结果。本发明适合大数据场景下垃圾邮件分类任务,有效提升了分类的效率和精度。

    基于线性回归的短时交通流量预测方法

    公开(公告)号:CN108985517A

    公开(公告)日:2018-12-11

    申请号:CN201810845924.X

    申请日:2018-07-27

    Abstract: 本发明公开了一种基于线性回归的短时交通流量预测方法。方法为:首先对获取到的可能影响交通流量的因子进行特征缩放;初始化经过特征缩放后的各个因子的参数,结合线性回归方法对特征缩放后的因子进行建模;然后根据实际交通流量和建立的模型确定代价函数,对代价函数进行正则化处理;接着利用梯度下降算法求解代价函数最小值,根据代价函数最小值求得的最优参数;最后利用求得的最优参数对该道路的短时交通流量进行预测。本发明通过线性回归算法对短时交通流量进行预测,通过多组特征数据的使用,利用正则化方法进行优化,减少了过拟合的问题,提高了预测的准确性。

    一种基于提示微调的事件检测方法

    公开(公告)号:CN117609699A

    公开(公告)日:2024-02-27

    申请号:CN202311643046.0

    申请日:2023-12-04

    Inventor: 胡莫闲 周沧琦

    Abstract: 本发明公开了一种基于提示微调的事件检测方法,包括:文本预处理;构建分类模型,并训练分类器;构建可学习的提示,引入一个BART编码器,将原始的离散提示信息转换成可学习的提示;构建生成模型,并训练生成器;联合训练,在训练阶段同时训练分类模型和生成模型,并通过动态调整损失权重进一步优化上述模型;使用训练完成的语言模型,对输入的文本进行检测,完成基于提示微调的事件检测。本发明结合了当前自然语言处理领域流行的提示学习范式,解决了传统事件检测任务中无法充分利用事件类型标签信息这一问题,并在相关数据集上取得了不错的表现,能够有效地抽取出文本中包含的事件和对应的触发词,具有一定的实际应用价值。

    一种模型训练的方法、装置、设备及存储介质

    公开(公告)号:CN116029298A

    公开(公告)日:2023-04-28

    申请号:CN202310117049.4

    申请日:2023-02-14

    Abstract: 本说明书公开了一种模型训练的方法、装置、设备及存储介质,可以先通过预测模型对各待标记样本集进行标记,并将标记结果为指定标记结果的各待标记样本集中的各待标记样本筛选出来,交由标记人员进行人工标记。这里的指定标记结果是指预先设置的预测模型容易出现识别错误的一类样本的标记结果。从而可以根据标记人员针对预测模型容易出现识别错误的一类样本的标记结果,对用于训练预测模型的待标记样本集进行拆分、重新聚合得到新的样本集,并使用新的样本集对预测模型进行训练,进而可以在减少需要人工标记的样本的数量以降低预测模型的训练成本的同时,提升预测模型的训练效果。

    一种基于层级化聚类的金融新闻流突发检测方法

    公开(公告)号:CN113449108A

    公开(公告)日:2021-09-28

    申请号:CN202110734921.0

    申请日:2021-06-30

    Abstract: 一种基于层级化聚类的金融新闻流突发检测方法,包括:文本的预处理;抽取关键词并构建关键词共现图;采用二分K‑Means算法对关键词聚类,将关键词共现图划分为若干子图,每个子图中的关键词为一个金融主题;通过相似度计算识别每篇金融新闻所属金融主题;构建以每篇金融新闻为节点的无向图,采用二分K‑Means算法对金融新闻聚类,将金融新闻节点无向图划分为若干子图,每个子图中的金融新闻为一个金融事件;通过相似度计算生成故事链;突发事件检测。本发明通过自然语言处理及图论相关技术,对金融新闻进行事件聚类,解决了传统金融突发事件不能将同一事件相关新闻综合考虑的问题,实现了高效准确地检测出金融突发事件,具有一定的工业价值。

Patent Agency Ranking