域适应的声纹特征识别方法及系统

    公开(公告)号:CN116229990A

    公开(公告)日:2023-06-06

    申请号:CN202211431413.6

    申请日:2022-11-15

    Inventor: 张星东 赵胜 丁卓

    Abstract: 本方案涉及一种域适应的声纹特征识别方法及系统。所述方法包括:中心服务器接收声纹查询请求,并获取待识别音频;所述中心服务器通过域适应循环对抗神经网络对所述待识别音频进行域分类,得到类别序号并发送给分布式存储设备;所述分布式存储设备在声纹数据底库中查找与所述类别序号相同的已注册名单,并根据所述已注册名单计算出各个打分矩阵;所述分布式存储设备将各个所述打分矩阵发送至所述中心服务器,所述中心服务器根据各个所述打分矩阵得到声纹识别结果。通过使用域适应循环对抗神经网络进行域分类,从而根据类别序号计算打分矩阵并得到声纹识别结果,当数据属于不同域时,不会出现域不匹配的现象,提高了声纹识别的识别性能。

    一种基于远域迁移学习的图像识别方法

    公开(公告)号:CN114783072B

    公开(公告)日:2022-12-30

    申请号:CN202210266952.2

    申请日:2022-03-17

    Abstract: 本发明公开一种基于远域迁移学习的图像识别方法,包括如下步骤:将医学领域的小样本图像作为目标域,同时将与目标域相似度高的无标签图像作为辅助域,将自然场景图像作为源域,通过基于Resnet50的轻量级网络提取各自域的高级语义特征;利用具有域距离度量的卷积自动编码器并通过辅助域作为桥梁对源域和目标域的高级语义特征进行特征融合;通过卷积自动解码器重构各自域的高级语义特征;最后通过全连接层对目标域图像进行识别,整个过程通过多任务损失函数进行优化。本发明改善了模型对高级语义信息的提取能力和稳定性,有效提升了模型远域特征迁移能力,本发明可以用于不同任务的图像识别任务。

    一种用于数据库计算引擎节点执行时动态扩缩的方法

    公开(公告)号:CN120066781A

    公开(公告)日:2025-05-30

    申请号:CN202510135317.4

    申请日:2025-02-07

    Inventor: 吴启文 丁卓

    Abstract: 本发明涉及数据处理技术领域,具体涉及一种用于数据库计算引擎节点执行时动态扩缩的方法,包括如下步骤:提供查询集群扩缩挂起策略的接口;生成并采集计算集群内核心指标,并根据元数据提供的集群当前扩缩挂起策略来判断集群是否需要挂起及扩缩;接收计算集群的扩缩、挂起请求,进行合法性校验;执行挂起、扩缩动作,通过上述方式,实现资源调整的自动化和无缝衔接,减少人工干预,提高数据库系统灵活性和响应速度。

    基于图卷积网络的匿名说话人攻击方法

    公开(公告)号:CN120048241A

    公开(公告)日:2025-05-27

    申请号:CN202510192231.5

    申请日:2025-02-21

    Abstract: 本发明涉及语言转换技术领域,具体涉及一种基于图卷积网络的匿名说话人攻击方法;包括如下步骤:将F0特征与原始F0特征进行拼接融合作为新F0特征;提取音频的特征并进行矢量量化;将处理后的F0特征和特征进行拼接,生成匿名化语音;计算来自试验话语和注册话语的说话者嵌入;输出匿名化试验话语嵌入和匿名化注册话语嵌入的相似性分数,根据分数判断是否属于同一说话人;通过多个试验和注册话语对,计算等错误率作为性能指标,评估攻击者系统对匿名化系统的攻击能力;通过考虑F0特征不同帧之间的时间相关性,利用图卷积网络和F0特征协同匿名说话人身份信息,来提升攻击者系统性能。

    基于改进卷积循环网络的轻量化单通道语音增强方法

    公开(公告)号:CN119993175A

    公开(公告)日:2025-05-13

    申请号:CN202510157170.9

    申请日:2025-02-13

    Abstract: 本发明涉及语音增强技术领域,具体涉及一种基于改进卷积循环网络的轻量化单通道语音增强方法:充分利用改进卷积循环网络在提取特征时的出色能力,使用聚合分组双路径循环网络和卷积混合分组双路径循环网络来提升多通道的深度时频特征以及对各通道之间的特征进行融合,使得深度特征所包含的语音信息更加的丰富,再利用深度特征来训练分离模型,进一步增强语音的性能,并且提出了聚合分组双路径循环网络和卷积混合分组双路径循环网络,改进了分组双路径循环网络架构,不仅使得卷积循环网络的语音增强性能得到了提升,而且保持了模型的轻量化,从而提高了增强模型的有效性,使得增强语音的清晰度和可懂度提高。

    基于生成式大模型的风险资金预测方法及系统

    公开(公告)号:CN119963332A

    公开(公告)日:2025-05-09

    申请号:CN202510052036.2

    申请日:2025-01-14

    Inventor: 段艺博 丁卓

    Abstract: 本发明涉及金融风险管理技术领域,具体涉及一种基于生成式大模型的风险资金预测方法及系统,实时收集金融交易数据;对收集到的数据进行预处理,并采用深度特征聚类技术,将相似的交易行为聚集在一起;采用Qwen‑2模型作为核心,针对交易数据调整生成式大模型参数,实现风险交易大模型的构建、用户交易画像的生成、风险交易预测与预警,以及模型反馈机制;将生成式大模型的输出与实时交易数据结合,快速识别潜在的异常交易,并输出风险评分;结合自然语言处理技术,实现语音生成与用户的智能客服交互,实时反馈风险评估结果并提供相应建议。解决了现有技术在风险资金预测中存在不足的问题。

    互联网项目开发智能项目管理系统及方法

    公开(公告)号:CN119671140A

    公开(公告)日:2025-03-21

    申请号:CN202411730250.0

    申请日:2024-11-29

    Inventor: 董乐 蔡势坤 丁卓

    Abstract: 本发明涉及项目管理技术领域,具体涉及一种互联网项目开发智能项目管理系统及方法:包括项目管理平台、信息更新及任务分配模块、资源配置模块、项目更新模块、风险管控模块和决策支持模块,通过信息更新及任务分配模块、资源配置模块、项目更新模块、风险管控模块和决策支持模块的设置,实现项目管理的全面智能化和自动化,提高项目管理效率,优化资源分配,实现实时监控和全面的风险管理,为项目管理决策提供科学的支持,从而显著提升互联网项目开发的管理水平和成功率。

    一种场景话术分类系统
    70.
    发明公开

    公开(公告)号:CN119106137A

    公开(公告)日:2024-12-10

    申请号:CN202411274850.0

    申请日:2024-09-12

    Inventor: 谢羽凯 丁卓

    Abstract: 本发明涉及电子数字数据处理技术领域,具体涉及一种场景话术分类系统,包括话术样本关键词提取模块、音频处理模块和话术筛选模块;话术样本关键词提取模块、音频处理模块和话术筛选模块依次连接;话术样本关键词提取模块用于提取诈骗样本话术中的关键词,并将关键词分类加入词库中;音频处理模块用于提取音频中的关键词,并将关键词分类加入词库中;话术筛选模块用于根据词库中的关键词评估文本的风险等级;本发明能够满足特殊场景下的业务功能需求,且能在占用极少资源的情况下,同时保证高效、高准确率的场景话术分类。

Patent Agency Ranking