微分段安全语音转录
    6.
    发明公开

    公开(公告)号:CN115605947A

    公开(公告)日:2023-01-13

    申请号:CN202180032695.X

    申请日:2021-04-30

    Abstract: 提供了用于在多个分布式计算设备处保护对机器学习训练数据的数据访问的实施例。包括与优选的数据安全性等级相对应的原始数据的电子内容被划分成多个微分段。多个微分段被限制性地分发到多个计算设备,该多个计算设备将转录标签应用于多个微分段。带标签的微分段被重构成训练数据,该训练数据随后被用于训练机器学习模型,同时促进来自经重构的微分段的训练数据所包括的原始数据的数据安全性的提高。

    经由可穿戴和移动设备的基于自然运动的控制

    公开(公告)号:CN106922185A

    公开(公告)日:2017-07-04

    申请号:CN201580052576.5

    申请日:2015-09-28

    Abstract: “自然运动控制器”标识用户的身体的一个或多个部分的各种运动以与电子设备交互,由此实现各种自然用户接口(NUI)场景。自然运动控制器通过连结从多个分离的惯性传感器集接收到的惯性传感器数据的可调整数目的顺序时段来构建复合运动识别窗口。这些分离的惯性传感器集中的每个惯性传感器集被耦合到分离的用户穿戴、携带或者手持的移动计算设备,或者提供与分离的用户穿戴、携带或者手持的移动计算设备有关的传感器数据。每个复合运动识别窗口然后被传递到由一个或多个基于机器的深度学习过程训练的运动识别模型。该运动识别模型然后被应用到复合运动识别窗口以标识一个或多个预定义运动的序列。所标识的运动然后被用作触发一个或多个应用命令的执行的基础。

    与阵列几何形状无关的多通道个性化语音增强

    公开(公告)号:CN118020101A

    公开(公告)日:2024-05-10

    申请号:CN202280065219.2

    申请日:2022-08-22

    Abstract: 与阵列几何形状无关的多通道个性化语音增强(PSE)的示例从目标说话者登记数据中提取说话者嵌入,该说话者嵌入表示一个或多个目标说话者的声学特性。从由麦克风阵列所捕获的输入音频中提取空间特征(例如,通道间相位差)。输入音频包括(多个)目标说话者和一个或多个干扰说话者的语音数据的混合。输入音频、所提取的说话者嵌入和所提取的空间特征被提供给经训练的与几何形状无关的PSE模型。产生输出数据,其包括(多个)目标说话者的估计的干净语音数据,其具有(多个)干扰说话者的语音数据的减少(或消除),而经训练的PSE模型不需要麦克风阵列的几何形状信息。

Patent Agency Ranking