面向大语言模型的词向量生成方法、电子设备及存储介质

    公开(公告)号:CN117113990A

    公开(公告)日:2023-11-24

    申请号:CN202311374453.6

    申请日:2023-10-23

    Abstract: 本发明涉及计算机技术应用领域,提供了一种面向大语言模型的词向量生成方法、电子设备及存储介质,包括:获取待分词的文本,作为目标文本;对目标文本进行分词处理,得到对应的分词集S;基于预设词向量基准表T,获取每个词在每个嵌入矩阵的特征向量;基于预设滑动窗口长度d,将S划分为多个语句片段,得到对应的语句片段集SP;对每个语句片段的特征向量进行融合,得到对应的特征向量;得到SP对应的特征向量F作为目标文本的特征向量。本发明在词向量生成过程中,将多个相邻的词组合视为一个词,能够使得分词的长度得到极大的压缩。此外,将不同词的特征向量通过张量积的方式组合成一个词的特征向量,可以极大的降低可训练参数量。

    数据处理方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN117056408A

    公开(公告)日:2023-11-14

    申请号:CN202311110409.4

    申请日:2023-08-30

    Abstract: 本公开涉及一种数据处理方法、装置、设备及计算机可读存储介质,该方法包括:获取序列化的二进制数据,将所述数据解码为标准化格式的数据对象;对所述标准化格式数据进行数据处理,得到处理结果;将所述处理结果序列化编码后存储到内存,进而写入磁盘中。本公开通过将数据解码为标准化格式数据,通过解码为标准化格式数据,提高使用便捷度;对标准化格式数据进行数据处理,得到处理结果,并将结果通过网络传输,降低了传输的数据大小,节省了带宽;将处理结果编码后存储到内存中,降低了对内存空间的占用;写入磁盘,提高了磁盘利用率,节省了磁盘的使用。

    基于语音驱动和人脸自驱动的虚拟人视频合成方法

    公开(公告)号:CN116528019A

    公开(公告)日:2023-08-01

    申请号:CN202310724745.1

    申请日:2023-06-19

    Abstract: 本发明提供了一种基于语音驱动和人脸自驱动的虚拟人视频合成方法,包括:对原始虚拟人视频素材进行预处理,得到首帧人脸图像为基准人脸图像的第一视频素材;利用设定口型驱动模型驱动所述第一视频素材,得到第二视频素材;将第一视频素材中的首帧人脸图像作为被驱动人脸图像,将第二视频素材中的人脸图像作为口型驱动图像序列,通过设定人脸驱动算法得到第三视频素材;利用第三视频素材中的人脸图像替换原始虚拟人视频素材中对应的人脸图像,得到第四视频素材;将第四视频素材和目标音频文件进行合成,得到虚拟人内容播报视频。本发明能够高清化虚拟人的唇形、牙齿细节,发音和唇形吻合度高,可以对新的人物形象不加训练而快速迁移。

    一种视觉驱动的虚拟角色处理系统

    公开(公告)号:CN116452787A

    公开(公告)日:2023-07-18

    申请号:CN202310696721.X

    申请日:2023-06-13

    Abstract: 本发明提供了一种视觉驱动的虚拟角色处理系统,该系统包括非虚拟角色图像组列表A={A1,A2,……,Ai,……,Am}、虚拟角色图像组B、处理器和存储有计算机程序的存储器,i=1,2,……,m,m为非虚拟角色图像组数量,Ai为第i帧非虚拟角色图像组,还包括根据A获得的非虚拟姿态图像组C={C1,C2,……,Ci,……,Cm}和非虚拟面部图像组D={D1,D2,……,Di,……,Dm},以及根据虚拟角色图像组B获得的虚拟角色的姿态图像Bb和虚拟角色的表情图像Bm,当所述计算机程序被处理器执行时,将Ci与Bb对齐,将Di与Bm对齐,提高了虚拟角色与非虚拟角色的吻合度。

    基于细粒度感知的文本视频跨模态检索方法和装置

    公开(公告)号:CN116166843A

    公开(公告)日:2023-05-26

    申请号:CN202310200445.3

    申请日:2023-03-02

    Abstract: 本公开涉及一种基于细粒度感知的文本视频跨模态检索方法和装置。所述方法包括:通过文本特征编码模型,对待匹配文本进行特征提取,获得所述待匹配文本的多个词语的文本特征向量集;通过视频特征编码模型,对待匹配视频进行特征提取,获得多个目标对象的目标特征向量集;通过跨模态匹配模型,确定目标特征向量集和文本特征向量集之间的相关性得分。根据本公开的实施例的基于细粒度感知的文本视频跨模态检索方法,可在检索任务中引入更细粒度的语义特征,并在模型训练中针对更细粒度的语义特征的识别和对比能力加以训练,使得模型能够对更细粒度的语义特征进行检索,可提升跨模态检索的准确性。

    税收预测方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN115796389A

    公开(公告)日:2023-03-14

    申请号:CN202310045255.9

    申请日:2023-01-30

    Abstract: 本公开涉及一种税收预测方法、装置、设备及计算机可读存储介质,该方法包括:获取目标税收主体的税收样本数据以及所述税收样本数据的演化模式标注结果;基于所述税收样本数据以及所述演化模式标注结果进行模型训练,得到训练好的税收演化模式匹配模型;将目标税收主体的历史税收数据输入所述税收演化模式匹配模型,得到所述目标税收主体的税收演化模式预测结果;基于所述税收演化模式预测结果,生成所述目标税收主体的衍生特征向量;将所述目标税收主体的衍生特征向量输入预先训练好的多模式税收预测模型,得到所述目标税收主体的税收预测结果。本公开通过为目标税收主体匹配最佳的税收演化模式,显著提升了预测的精准性。

    迁出风险企业的税源管理方法、装置、设备及存储介质

    公开(公告)号:CN115660796A

    公开(公告)日:2023-01-31

    申请号:CN202211577616.6

    申请日:2022-12-09

    Abstract: 本公开涉及一种迁出风险企业的税源管理方法、装置、设备及存储介质,涉及数据分析技术领域,迁出风险企业的税源管理方法包括:获取目标企业的经营数据;对经营数据进行特征提取处理,得到目标企业与企业迁出行为相关的特征;将特征输入预设的企业迁出风险监控模型,基于企业迁出风险监控模型,对目标企业进行迁出风险检测。本公开实施例可以通过预设的企业迁出风险监控模型对存在迁出风险的企业进行精准稳定地的识别与预警,无需依靠人为经验,缩短企业迁出风险税前监控的时间,提高对重点税源流失预警响应的时效性和准确性。

Patent Agency Ranking