一种文本分类方法、装置以及存储介质

    公开(公告)号:CN114860930B

    公开(公告)日:2025-04-15

    申请号:CN202210441429.9

    申请日:2022-04-25

    Abstract: 本发明提供一种文本分类方法、装置以及存储介质,属于文本分类领域,方法包括:S1:对多个原始文本数据进行划分得到训练集和测试集;S2:分别对训练集和测试集进行数据预处理得到多个单词训练矩阵以及多个单词测试矩阵;S3:分别对各个单词训练矩阵进行向量化处理得到词向量矩阵;S4:构建训练模型,根据多个词向量矩阵对训练模型进行训练得到待测试模型;S5:根据多个单词测试矩阵对待测试模型进行测试得到分类模型;S6:导入待分类文本数据,通过分类模型对待分类文本数据进行分类得到分类结果。本发明能够突出文本中的关键信息,同时增强文本上下文语义信息,更准确的表示文本语义,从而提高了文本分类的准确度。

    一种商品推荐方法、系统及存储介质

    公开(公告)号:CN118964737A

    公开(公告)日:2024-11-15

    申请号:CN202411039982.5

    申请日:2024-07-31

    Inventor: 蔡晓东 李婷

    Abstract: 本发明提供一种商品推荐方法、系统及存储介质,涉及数据推荐技术领域;方法包括:将从购物平台采集的用户数据导入构建初始推荐模型,并对用户数据进行可靠性分析,得到可靠性值,对用户数据和可靠性值进行用户建模,得到用户特征表示向量,对用户数据和可靠性值进行商品建模,得到商品特征表示向量,对用户特征表示向量和商品特征表示向量进行融合计算,得到预测评分;通过损失函数基于预测评分对初始推荐模型进行迭代优化,得到推荐模型;通过推荐模型为用户进行商品推荐,得到商品推荐结果。利用可靠性值对商品评分进行分析,完成信任传播的捕捉,并学习用户和商品的潜在特征,来挖掘用户对商品的偏好和兴趣,使得推荐结果更加准确。

    一种多特征融合的视频描述方法、装置及存储介质

    公开(公告)号:CN114596523B

    公开(公告)日:2024-11-08

    申请号:CN202210167890.X

    申请日:2022-02-23

    Inventor: 蔡晓东 周美欣

    Abstract: 本发明提供一种多特征融合的视频描述方法、装置及存储介质,导入数据集,数据集包括多个数据组,各个数据组包括视频与描述信息;分别对各个数据组中的视频进行特征提取,得到运动特征和全局特征,将运动特征和全局特征进行特征拼接,得到各个视频对应的视频特征,分别提取各个数据组中描述信息对应的对象特征,并计算贡献值,根据各个贡献值计算对应视频中所有视频帧的区域特征和;分别将各个视频对应的特征输入训练模型中进行融合训练,得到融合特征;分别将各个所述视频对应的描述信息转换为文本特征;分别将各个所述视频对应的文本特征和各个所述视频对应的融合特征输入到预设的transformer语言模型中,输出视频描述语句。

    一种图像生成方法、装置、系统以及存储介质

    公开(公告)号:CN118470374A

    公开(公告)日:2024-08-09

    申请号:CN202410400315.9

    申请日:2024-04-03

    Inventor: 蔡晓东 黄永森

    Abstract: 本发明提供一种图像生成方法、装置、系统以及存储介质,属于图像生成技术领域,方法包括:对待处理图像进行映射处理得到原始潜在表示向量;对原始提示词文本进行向量化分析得到原始文本向量组;通过原始提示词文本、原始潜在表示向量以及原始文本向量组对训练模型进行训练得到图像生成模型;通过图像生成模型对待生成提示词文本进行预测得到图像生成结果。本发明实现了对文本描述中关键属性的精确捕捉和准确映射,提高了生成的图像与文本之间的属性对应关系,提高了图像生成的准确率,在图像生成领域具有重要的实际应用价值。

    一种序列推荐方法、装置、系统以及存储介质

    公开(公告)号:CN118193835A

    公开(公告)日:2024-06-14

    申请号:CN202410343759.3

    申请日:2024-03-25

    Inventor: 蔡晓东 李明惠

    Abstract: 本发明提供一种序列推荐方法、装置、系统以及存储介质,属于物品推荐技术领域,方法包括:导入原始用户交互序列,对原始用户交互序列进行预处理得到用户嵌入序列;构建训练模型,通过用户嵌入序列对训练模型进行训练得到推荐模型;导入待推荐用户交互序列,通过推荐模型对待推荐用户交互序列进行推荐得到序列推荐结果。本发明更有效地提取了用户的长期和短期兴趣,能够自适应不同任务的短期兴趣窗口,能适应不同的场景与任务,解决了长期兴趣与短期兴趣的纠缠,提供了更可解释的推荐结果,提高了推荐结果的准确性。

    一种兴趣社交关系的推荐方法、装置、系统以及存储介质

    公开(公告)号:CN118013136A

    公开(公告)日:2024-05-10

    申请号:CN202410279900.8

    申请日:2024-03-12

    Inventor: 蔡晓东 方晟

    Abstract: 本发明提供一种兴趣社交关系的推荐方法、装置、系统以及存储介质,属于社交推荐技术领域,方法包括:导入用户I D数据、原始项目交互数据以及原始社交数据;对用户I D数据以及原始项目交互数据进行向量化处理得到初始用户节点向量以及原始项目交互向量;对原始项目交互向量以及与原始社交数据进行数据清洗得到兴趣社交数据;构建训练模型,通过初始用户节点向量、原始项目交互向量以及原始兴趣社交数据对训练模型进行模型分析得到社交关系推荐模型。本发明能够动态筛选和去除兴趣社交空间中的无意义社交,有效地过滤可能干扰或误导用户的社交信息,提升了推荐算法的计算效率,还能提高推荐的准确率,在推荐方法中具有较大的实用价值,极大地满足了用户的需求。

    一种会话推荐方法、装置、系统以及存储介质

    公开(公告)号:CN117668356A

    公开(公告)日:2024-03-08

    申请号:CN202311565028.5

    申请日:2023-11-22

    Inventor: 蔡晓东 卢玮

    Abstract: 本发明提供一种会话推荐方法、装置、系统以及存储介质,属于会话推荐技术领域,方法包括:导入会话序列,对会话序列进行节点提取,得到多个商品节点;对所有商品节点进行全局会话偏好的分析,得到全局会话偏好向量组;对全局会话偏好向量组进行用户偏好的计算,得到会话推荐结果。本发明能够减弱了噪声点击的影响,去除了无效的意图学习,提高了推荐结果的准确率。

    一种语义关系匹配模型训练方法、系统、设备及介质

    公开(公告)号:CN117648996A

    公开(公告)日:2024-03-05

    申请号:CN202311720923.X

    申请日:2023-12-14

    Inventor: 蒋鹏 蔡晓东

    Abstract: 本发明涉及一种语义关系匹配模型训练方法、系统、设备及介质,方法包括:获取多对语句作为训练集,每个语句包括句子主旨和事实细节信息;将训练集输入预训练语义模型中,利用每对语句和对应的一对句子主旨、一对事实细节信息调整预训练语义模型中的网络参数,直到每对语句和对应的一对句子主旨、一对事实细节信息三者对应的总损失值均小于设定值。解决了现有的独立的one‑hot向量无法揭示两个语句之间的关系的丰富语义信息和指导性,从而导致信息损失,使得两个语句的匹配概率不准确的问题。

    一种解决句子匹配中混淆事实信息的处理方法及装置

    公开(公告)号:CN117272978A

    公开(公告)日:2023-12-22

    申请号:CN202311243930.5

    申请日:2023-09-25

    Inventor: 蒋鹏 蔡晓东

    Abstract: 本发明提供一种解决句子匹配中混淆事实信息的处理方法及装置,方法为:将句子匹配文本的证据序列数据输入GPT4预训练语言模型中,得到上下文嵌入,并根据所述上下文嵌入得到所述证据序列数据的隐藏层表示;基于原始GCN图神经网络和所述证据序列数据的隐藏层表示构建GCN图神经网络,构建扰动矩阵,将其引入到GCN图神经网络中,得到扰动GCN图神经网络,可减轻噪声证据的影响,并通过设置的诊断属性对扰动GCN图神经网络的提取证据子图过程的规范进行验证,以提高没有任何明确注释解释的质量,并通过总目标函数进行模型优化,最终得到了优化GCN图神经网络,解决了句子匹配中混淆事实信息的问题。

    一种文本匹配方法、装置、系统以及存储介质

    公开(公告)号:CN117131153A

    公开(公告)日:2023-11-28

    申请号:CN202310928224.8

    申请日:2023-07-26

    Abstract: 本发明提供一种文本匹配方法、装置、系统以及存储介质,属于文本匹配领域,方法包括:导入原始文本数据集,对原始文本数据集进行分词处理得到多个分词后文本句子;将所有分词后文本句子两两分为一组得到多个分词后文本句子组;分别对各个分词后文本句子组进行更新得到目标文本句子组;分别对各个目标文本句子组进行预测,得到文本匹配结果。本发明提高了特征提取的效果,增强了数据效率以及模型的泛化能力,同时,减少了计算量,较好的节省了训练成本,能够更好的获取句子的全局信息,解决了长文本匹配中的长程依赖等问题。

Patent Agency Ranking