Patent search ap:("数据堂(北京)科技股份有限公司" OR "北京市大数据中心") AND inv:"齐红威" Page 4

31.

发明公开
基于联邦数据及联邦服务的数据共享方法及装置有权

公开(公告)号：CN113204795A

公开(公告)日：2021-08-03

申请号：CN202110764949.9

申请日：2021-07-07

Applicant: 数据堂(北京)科技股份有限公司

Inventor： 丰强泽 , 齐红威 , 何鸿凌 , 肖永红

IPC: G06F21/62 , G06F16/27 , G06F16/2458

Abstract: 本发明公开了一种基于联邦数据及联邦服务的数据共享方法及装置，该方法包括：接收数据使用方提交的模型运算需求；基于联邦节点能力数据库，根据模型运算需求匹配生成最优决策结果；基于最优决策结果选择计算模型，将公钥和计算模型发送至相应联邦节点；接收相应联邦节点返回的计算结果，其中，计算结果为联邦节点根据自身的联邦数据基于计算模型计算得出并通过公钥加密后的结果；将结果进行解密返回给数据使用方；计算参与计算的每个联邦节点的数据收益，提供给数据提供方；将计算过程数据存储在区块链的记账节点上；数据提供方作为联邦节点。本发明通过联邦服务机制来实现对各个数据使用方需求的决策生成，进而实现服务的联邦化。

32.

发明授权
迭代式大规模发音词典构建方法及装置有权

公开(公告)号：CN112530414B

公开(公告)日：2021-05-25

申请号：CN202110178948.6

申请日：2021-02-08

Applicant: 数据堂(北京)科技股份有限公司

Inventor： 王治愚 , 王大亮 , 王丽媛 , 齐红威

IPC: G10L15/06 , G10L15/16 , G10L15/02

Abstract: 本发明公开了一种迭代式大规模发音词典构建方法及装置，其中该方法包括：根据文本生数据生成词条序列；根据音频生数据生成音标序列；根据词条序列，利用G2P模型生成二元组；根据音标序列，利用P2G模型生成二元组；计算两个二元组之间的匹配度，并与预设匹配度进行比较，对匹配度小于预设匹配度对应的二元组和二元组进行鉴别性样本抽取，获得鉴别性样本；获取领域专家对鉴别性样本的标注和校正，将标注和校正后的二元组和二元组存入多层次大规模发音词典。本发明能够快速有效地构建大规模发音词典，提升语音识别系统的工作效率并降低人工成本。

33.

发明授权
多媒体文件的同步方法及装置有权

公开(公告)号：CN108769559B

公开(公告)日：2020-12-01

申请号：CN201810546057.X

申请日：2018-05-25

Applicant: 数据堂(北京)科技股份有限公司

Inventor： 袁鲲 , 齐红威 , 丰强泽

IPC: H04N5/76 , H04N5/92 , H04N5/60 , H04N5/04

Abstract: 本发明提供了一种多媒体文件的同步方法及装置，其中，多媒体文件的同步方法中，在每个视频设备拍摄的音频文件均包括同一脉冲波，在确定所述脉冲波在每个音频文件中的起始采样点之后，利用将样本序列和校验音频文件中的脉冲波进行相似度对比，得到每个所述校验音频文件中的最相似序列，依据每个所述校验音频文件中的最相似序列的位置，计算得到每个所述校验音频文件中的最相似序列的参照位置，实现了对多个视频设备录制的音频文件的同步。

34.

发明公开
多媒体文件的同步方法及装置有权

公开(公告)号：CN108769559A

公开(公告)日：2018-11-06

申请号：CN201810546057.X

申请日：2018-05-25

Applicant: 数据堂(北京)科技股份有限公司

Inventor： 袁鲲 , 齐红威 , 丰强泽

IPC: H04N5/76 , H04N5/92 , H04N5/60 , H04N5/04

Abstract: 本发明提供了一种多媒体文件的同步方法及装置，其中，多媒体文件的同步方法中，在每个视频设备拍摄的音频文件均包括同一脉冲波，在确定所述脉冲波在每个音频文件中的起始采样点之后，利用将样本序列和校验音频文件中的脉冲波进行相似度对比，得到每个所述校验音频文件中的最相似序列，依据每个所述校验音频文件中的最相似序列的位置，计算得到每个所述校验音频文件中的最相似序列的参照位置，实现了对多个视频设备录制的音频文件的同步。

35.

发明公开
一种点云数据的动静目标区分标注方法及系统审中-公开

公开(公告)号：CN120031970A

公开(公告)日：2025-05-23

申请号：CN202510512020.5

申请日：2025-04-23

Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司

Inventor： 马晓光 , 王大亮 , 齐红威

IPC: G06T7/73 , G06T7/62 , G06T3/4007

Abstract: 本发明公开了一种点云数据的动静目标区分标注方法及系统，涉及自动驾驶技术领域，所述动静目标区分标注方法为：获取待标注的所有3D点云数据；将当前帧点云坐标系下的3D点云数据转换为世界坐标系下的3D点云数据；对转换后的3D点云数据进行插值计算；基于已知3D点云数据各类目标插值，进行预测后续插值。系统用于执行方法。本发明可以实现动目标和静态目标的自动判读，大大减少后续标注人员的工作量，省去了人工判断过程，整体提高了后续3D点云目标的整体标注效率。

36.

发明公开
多模态大模型训练数据采集方法及系统有权

公开(公告)号：CN119380144A

公开(公告)日：2025-01-28

申请号：CN202411946438.9

申请日：2024-12-27

Applicant: 数据堂(北京)科技股份有限公司

Inventor： 齐红威 , 丰强泽 , 王大亮 , 高禹 , 郑继龙 , 史红欣

IPC: G06V10/774 , G06V20/70 , G06V30/19 , G06V10/82 , G06N3/0464

Abstract: 本申请涉及计算机技术领域，其具体地公开了一种多模态大模型训练数据采集方法及系统，其采用基于深度学习的数据处理技术对语义对齐的图像数据和图像内容文本描述数据进行语义特征提取和跨模态联合编码，以捕捉到模态间的语义关联，实现跨模态的语义信息融合，并在此基础上进一步进行图像样本的生成，进而，通过对生成的图像样本与原始图像数据进行语义偏移度量，以智能识别生成的图像样本是否为合格增强样本。通过这种方式，可以有效地丰富多模态训练数据集，确保数据的质量，解决多模态数据增强过程中跨模态语义一致性的问题，从而提高多模态大模型的训练效率。

37.

发明公开
多维度的大模型数据质量评测方法及系统审中-实审

公开(公告)号：CN119377625A

公开(公告)日：2025-01-28

申请号：CN202411946980.4

申请日：2024-12-27

Applicant: 数据堂(北京)科技股份有限公司

Inventor： 齐红威 , 丰强泽 , 肖永红 , 栗全峰 , 郑继龙 , 史红欣

IPC: G06F18/21 , G06F18/25 , G06N3/0442 , G06F18/10

Abstract: 本申请公开了一种多维度的大模型数据质量评测方法及系统，其在提取出满足最低内在质量要求的数据集和参考数据集中的各个数据特征之后，基于数据集中各个数据样本之间的信息场效应，对各个数据样本进行特征更新和上下文语义关联强化处理，从而提高各个数据样本的语义特征表达能力，实现更为准确的数据质量评估。这样，通过引入数据集的上下文关联信息，能够更准确地理解各个数据样本的语义信息，进而提升整体数据质量评估的准确性。

38.

发明授权
语音摘要生成模型训练方法、语音摘要生成方法及装置有权

公开(公告)号：CN115827854B

公开(公告)日：2023-08-11

申请号：CN202211687868.4

申请日：2022-12-28

Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司

Inventor： 王大亮 , 李昱璇 , 齐红威 , 姜丹

IPC: G06F16/34 , G06F16/33 , G06F16/35 , G06N3/04 , G06N3/08

Abstract: 本发明涉及一种语音摘要生成模型训练方法、语音摘要生成方法及装置，训练方法包括如下步骤：提取样本文本的样本词语集合，以及提取样本音频数据的样本音频特征；将所述样本词语集合、所述样本音频特征进行多模态特征融合，获得多模态特征向量；根据样本文本所归属的领域，获得样本文本的领域权重；将所述领域权重加入所述多模态特征向量；将所述多模态特征向量输入摘要生成模型，通过逐步迭代训练获得最优摘要生成模型。本技术方案的语音摘要生成模型训练方法通过融合音频数据与文本的多模态信息，使生成的语音摘要更精确、重点性更强；并且通过校正多模态特征向量的领域，增强了语音摘要的领域倾向性，修正生成的语音摘要，使语音摘要更精准。

39.

发明公开
语音摘要生成模型训练方法、语音摘要生成方法及装置有权

公开(公告)号：CN115827854A

公开(公告)日：2023-03-21

申请号：CN202211687868.4

申请日：2022-12-28

Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司

Inventor： 王大亮 , 李昱璇 , 齐红威 , 姜丹

IPC: G06F16/34 , G06F16/33 , G06F16/35 , G06N3/04 , G06N3/08

Abstract: 本发明涉及一种语音摘要生成模型训练方法、语音摘要生成方法及装置，训练方法包括如下步骤：提取样本文本的样本词语集合，以及提取样本音频数据的样本音频特征；将所述样本词语集合、所述样本音频特征进行多模态特征融合，获得多模态特征向量；根据样本文本所归属的领域，获得样本文本的领域权重；将所述领域权重加入所述多模态特征向量；将所述多模态特征向量输入摘要生成模型，通过逐步迭代训练获得最优摘要生成模型。本技术方案的语音摘要生成模型训练方法通过融合音频数据与文本的多模态信息，使生成的语音摘要更精确、重点性更强；并且通过校正多模态特征向量的领域，增强了语音摘要的领域倾向性，修正生成的语音摘要，使语音摘要更精准。

40.

发明公开
一种交互式人工智能技术评测方案的构建方法有权

公开(公告)号：CN115810137A

公开(公告)日：2023-03-17

申请号：CN202310087037.1

申请日：2023-02-09

Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司

Inventor： 丰强泽 , 齐红威 , 何鸿凌 , 肖永红 , 王大亮

IPC: G06V10/776 , G06V40/16 , G06V10/82

Abstract: 本发明公开了一种交互式人工智能技术评测方案的构建方法，涉及人工智能测评技术领域，方法包括以下步骤：步骤S1：构建数据层，数据层包括评测数据库、评测工具库、评测标准库和基准模型库；步骤S2：构建封装层；步骤S3：构建执行层。本发明基于评测工具、评测数据、评测标准、基准模型等要素，快速构建一个人工智能评测方案，从而解决人工智能评测经验和方法无法重复利用、评测要求技术门槛高的问题，提供了交互式的配置环境，支持用户通过拖拽配置的可视化方式快速构建复杂的评测方案流程，从而实现为不同类型人工智能任务快速开发新的评测方案。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification