一种数据自适应平衡分组方法

    公开(公告)号:CN110175651A

    公开(公告)日:2019-08-27

    申请号:CN201910452021.X

    申请日:2019-05-28

    Abstract: 本发明公开一种数据自适应平衡分组方法,将数据块边界点信息加入到传统聚类中,并将该聚类算法运用于分布式环境中结点数据分组中,利用数据块边界点信息约束数据块大小,使不同数据块之间满足较高的平衡性,解决了现有基于聚类的数据分组方法效率较低的问题,同时还提高了数据分组的准确率,具有很高的实用价值。

    一种多级融合图像和文本的多模态方面级情感分析方法

    公开(公告)号:CN117708642A

    公开(公告)日:2024-03-15

    申请号:CN202311456751.X

    申请日:2023-11-03

    Inventor: 李优 丁涵 林煜明

    Abstract: 本发明涉及图像和文本融合技术领域,具体地说,涉及一种多级融合图像和文本的多模态方面级情感分析方法,包括以下步骤:步骤1、多粒度视觉对齐;包括粗粒度对齐、细粒度对齐以及字符粒度对齐;步骤2、多尺度视觉融合;先通过利用多粒度视觉对齐的视觉数据来捕捉多尺度视觉特征并获得相应的层次视觉表示,然后进行视觉方面和意见的监督,最后基于prompt的动态视觉融合;步骤3、文本引导的多模态训练;通过最小化文本输出空间与文本+图像上下文输出空间的KL损失,得到多模态方面级情感分析结果。本发明能较佳地进行多模态方面级情感分析。

    时空众包在线微任务快速分配方法

    公开(公告)号:CN117707722A

    公开(公告)日:2024-03-15

    申请号:CN202311458097.6

    申请日:2023-11-04

    Abstract: 本发明涉及数据库和数据挖掘技术领域,涉及一种时空众包在线微任务快速分配方法,包括:步骤1、实时动态到达平台的时空众包参与者,根据参与者的属性分类,属于工作者存放Workers队列中,属于任务存放在Tasks队列中;步骤2、根据Workers队列和Tasks队列数量大小确定构建二分图,并采用KM算法来实现最优匹配;步骤3、输出最优的匹配对集合M。本发明能实现快速分配,能实现时空众包平台收益最大化。

    基于边界token标注的情感四元组抽取方法

    公开(公告)号:CN117688933A

    公开(公告)日:2024-03-12

    申请号:CN202311446036.8

    申请日:2023-11-02

    Abstract: 本发明涉及自然语言处理技术领域,涉及一种基于边界token标注的情感四元组抽取方法,其包括以下步骤:1)使用预训练的语言模型作为主干,生成语义上下文的token表示;2)利用GCN引入句法依赖树到token表示;3)枚举所有可能的token对,分别将1)和2)中对应的token表示输入到CLN中,分别生成带有上下文语义和句法依赖的所有token对的表示;4)通过线性层融合两种token对表示,获得最终的token对表示,并且使用多标签分类器来预测标签;5)从标签中还原出结构化情感四元组。本发明能较佳地进行情感四元组抽取。

    一种用于探测预训练深度语言模型生成的句子表示的方法

    公开(公告)号:CN117648922A

    公开(公告)日:2024-03-05

    申请号:CN202311397452.3

    申请日:2023-10-26

    Abstract: 本发明涉及语言处理技术领域,涉及一种用于探测预训练深度语言模型生成的句子表示的方法,包括:一、给定句子W、W对应的模型M;二、从模型M中获得向量序列H=M(W);三、设计树拓扑探针,树拓扑探针首先使用结构探针计算H的探测树深序列probSeqf;然后,构建伪树深序列pesuSeqW并计算pesuSeqf与pesuSeqW之间的距离度量;四、将任务损失和距离度量输入综合损失得到最后的微调损失,通过树拓扑探针微调发现预训练深度语言模型生成的句子表示的内部结构是否具有树形结构的层次结构。本发明能较佳地探测句子表示。

    一种基于情感知识增强的词语分布式表示学习系统

    公开(公告)号:CN114417814B

    公开(公告)日:2022-11-15

    申请号:CN202111531641.6

    申请日:2021-12-14

    Abstract: 本发明涉及情绪侦测与情感分析技术领域,具体地说,涉及一种基于情感知识增强的词语分布式表示学习系统,其包括情感知识整合框架和弱监督知识生成框架;情感知识整合框架包括知识查询模块,知识整合模块以及词表示生成模块;弱监督知识生成框架用于生成一个领域情感词典DSD,DSD整合了目标领域的无标签文本、领域独立的情感词典和目标领域文本的标签三部分的资源。本发明能较佳地进行情感知识整合。

    基于注意力的音频和歌词的多模态音乐风格分类方法

    公开(公告)号:CN113177136A

    公开(公告)日:2021-07-27

    申请号:CN202110460027.9

    申请日:2021-04-27

    Abstract: 本发明涉及音乐风格分类技术领域,涉及一种基于注意力的音频和歌词的多模态音乐风格分类方法,步骤如下:一、数据获取;二、音频预处理:先对音频数据采取Mel频谱特征提取,然后经过CNN网络得到音频特征;三、歌词预处理:先进行BERT预训练得到词向量,然后经过HAN网络得到歌词特征向量;四、attention模间融合:通过Attention模间融合,将获取的音频和歌词特征,进行交互融合获取融合的Attention注意力向量,再与音频和歌词特征向量拼接,获得包含音频和歌词各自模态特征,以及模态间融合特征的音乐风格特征;五、经过softmax层进行分类。本发明能较佳地对数据进行学习和分类。

Patent Agency Ranking