一种多模态文章内容处理系统及其控制方法

    公开(公告)号:CN117893862A

    公开(公告)日:2024-04-16

    申请号:CN202311856803.2

    申请日:2023-12-29

    IPC分类号: G06V10/80 G06F40/284

    摘要: 本申请提供了一种多模态文章内容处理系统及其控制方法,通过获取目标多模态文章的图像模态特征向量集和文本模态词特征向量集,根据图像模态特征向量集中各个图像模态特征向量之间的图像主题敏感因子确定图像模态主题特征界定域,确定文本模态词特征向量集中每个文本模态词特征向量的核心分词度量因子,根据所述文本模态词特征向量集和所有的核心分词度量因子确定文本模态核心词特征界定域,通过所述图像模态主题特征界定域和所述文本模态核心词特征界定域确定目标多模态文章的模态融合评价熵集,根据所述模态融合评价熵集和所有的核心分词度量因子对目标多模态文章进行主题划分,可提高多模态文章中各模态之间的信息融合度。

    融合藏文构件元素特征的藏汉神经机器翻译方法及设备

    公开(公告)号:CN117494732A

    公开(公告)日:2024-02-02

    申请号:CN202311535656.9

    申请日:2023-11-17

    摘要: 本申请涉及语种翻译技术领域,尤其涉及一种融合藏文构件元素特征的藏汉神经机器翻译方法及设备,方法包括:获取待翻译藏文数据;将待翻译藏文数据输入预先训练的翻译模型,得到汉文翻译结果。其中,翻译模型的训练过程,包括:获取藏文语料数据;对藏文语料数据进行分词;遍历分词后的藏文语料数据中的每个词汇,对每个词汇逐字进行构件元素提取;将同一词汇内每个字的构件元素按照字的前后顺序进行拼接,得到词汇对应的构件元素字符串;对每个词汇及其对应的构件元素字符串进行向量的训练和获取,得到词向量和词构件元素向量;将词向量和词构件元素向量进行融合,将融合向量作为训练数据训练翻译模型。本申请可以大幅提升翻译模型的翻译质量。

    汉藏语多方言多模态的资源推荐方法和装置

    公开(公告)号:CN116089726B

    公开(公告)日:2023-07-14

    申请号:CN202310200016.6

    申请日:2023-03-06

    IPC分类号: G06F16/9535 G06F40/58

    摘要: 本申请涉及一种汉藏语多方言多模态的资源推荐方法和装置,所述方法包括如下步骤:识别出每一条内容资源所属的语种/方言类型,根据识别结果给所述内容资源打上相应的资源‑语言类型标签;提取用户的语言类型和兴趣点;从各种类型的内容资源中筛选出第一内容资源,将所述第一内容资源在对应的目标人群内进行冷启试探;根据冷启试探结果从所述第一内容资源中筛选出第二内容资源,将所述第二内容资源在多语言人群间进行传播扩散。本申请的方案基于机器翻译与相似人群扩散,能够实现多语种/方言的匹配推荐,达到了特定语言资源在特定语言人群中进行扩散的目标,在精准性和泛化性之间实现个性化均衡。

    汉藏语多方言多模态的资源推荐方法和装置

    公开(公告)号:CN116089726A

    公开(公告)日:2023-05-09

    申请号:CN202310200016.6

    申请日:2023-03-06

    IPC分类号: G06F16/9535 G06F40/58

    摘要: 本申请涉及一种汉藏语多方言多模态的资源推荐方法和装置,所述方法包括如下步骤:识别出每一条内容资源所属的语种/方言类型,根据识别结果给所述内容资源打上相应的资源‑语言类型标签;提取用户的语言类型和兴趣点;从各种类型的内容资源中筛选出第一内容资源,将所述第一内容资源在对应的目标人群内进行冷启试探;根据冷启试探结果从所述第一内容资源中筛选出第二内容资源,将所述第二内容资源在多语言人群间进行传播扩散。本申请的方案基于机器翻译与相似人群扩散,能够实现多语种/方言的匹配推荐,达到了特定语言资源在特定语言人群中进行扩散的目标,在精准性和泛化性之间实现个性化均衡。