-
公开(公告)号:CN120031314A
公开(公告)日:2025-05-23
申请号:CN202510112094.X
申请日:2025-01-23
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06Q10/0631 , G06Q10/1093 , G06N3/0499 , G06N3/0985
Abstract: 本发明提供一种排班排产模型设计方法、装置、存储介质和程序产品,涉及生产加工自动控制技术领域,还涉及认知智能和大模型技术领域。其中,排班排产模型设计方法包括:分类收集排版排产相关数据;进行数据预处理;以多头注意力机制模块为基础,进行输入处理、数据标准化、特定层添加以及模型叠加,构建启发式算法模块;使用神经网络结构,叠加预处理模块和多层感知器,构建深度学习模块;整合启发式算法模块和深度学习模块,形成自适应认知智能网络。本发明以大模型为基座,创新性地提出一种融合了深度学习和启发式算法的混合模型架构:自适应认知智能网络。该模型能够同时捕捉数据的深层次特征和排班排产的复杂逻辑,给出自适应认知智能排产排班方案。
-
公开(公告)号:CN120031133A
公开(公告)日:2025-05-23
申请号:CN202510140764.9
申请日:2025-02-08
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06N5/04 , G06F40/30 , G06F40/284
Abstract: 本公开提供了一种非公理推理系统中命题逻辑语句的生成方法、系统和设备,该生成方法包括:获取初始文本;基于非公理推理系统中命题逻辑语句的输入要求,得到预设大语言模型的目标提示词;基于所述目标提示词,将所述初始文本输入至所述预设大语言模型,以输出目标命题逻辑语句。本公开通过命题逻辑语句的输入要求得到目标提示词,进而根据目标提示词将初始文本输入至预设大语言模型,以输出目标命题逻辑语句,实现了初始文本到命题逻辑语句的自动化转换,显著降低了用户的使用门槛,大大提高了转换效率,提高了非公理推理系统的推理结果的质量和可靠性,具有良好的扩展性、可维护性和适应性,提升了智能化程度、便捷性、实际应用价值和范围。
-
公开(公告)号:CN118840414B
公开(公告)日:2025-04-29
申请号:CN202411038198.2
申请日:2024-07-30
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本发明提供一种视觉Transformer模型设计方法、装置、存储介质和程序产品,其中,方法包括:设定最小形变图像的大小和最小区域块的大小;根据原图的宽高,得到原图的长边与短边之比取整的值,确定形变目标图像的一边长和待划分区域块的一边长;根据原图的长边与短边之比取整的值,计算出形变目标图像的宽高和待划分区域块的宽高;根据形变目标图像的宽高和待划分区域块的宽高,对图像进行形变和划分,得到若干区域块,送入Transformer结构中。将每个区域块划分成若干方块,对所述若干方块进行编码,得到每个区域块特征;整合所有的区域块特征,送入Transformer结构中进行训练。本发明可以在较少形变情况下提取更符合原始图像的特征信息。
-
公开(公告)号:CN119541452A
公开(公告)日:2025-02-28
申请号:CN202411525174.X
申请日:2024-10-29
Applicant: 华院计算技术(上海)股份有限公司
IPC: G10L13/08 , G10L13/047 , G10L15/26
Abstract: 本发明提供一种语音合成模型构建方法、系统、存储介质和程序产品,其中方法包括以下步骤:获取音频、文字、拼音;设置音频编码模块对所述音频提取音频编码,设置文字tokenizer将所述文字转为文字编码,设置拼音编码模块对所述拼音提取拼音编码;设置特征融合模块,将所述音频编码和所述文字编码或所述拼音编码进行融合,得到融合后的特征;将所述融合后的特征通过大语言模型,得到最终的音频向量;采用声学解码器,对所述最终的音频向量进行解码,得到最终的音频;根据损失对语音合成模型进行反向迭代。本发明能够精准控制单字读音的语音合成模型,解决现有语音合成模型中对语音合成中读音精准控制的能力差的问题。
-
公开(公告)号:CN118052911B
公开(公告)日:2025-02-18
申请号:CN202410281747.2
申请日:2024-03-12
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T13/00 , G06N3/0475
Abstract: 本申请提供一种基于深度学习和手部变换的语音驱动手部动作图像生成方法及系统、计算机可读存储介质。技术方案包括如下步骤:获取音频和相应的包含手部的人物图像;将所述音频输入变换网络得到相应的手部变换参数;将所述包含手部的人物图像输入分割网络得到相应的手部分层图像和背景图片;将所述手部变换参数带入到所述手部分层图像,得到相应的手部变换图像;将所述手部变换图像和所述背景图片输入生成网络得到最终的图像。针对生成和语音相匹配的手部动作经常会存在手部截断、错位等效果不佳的问题,本发明采用手部变换来刻画手部运动,并通过深度网络,有效、准确地生成带手部动作的图像。
-
公开(公告)号:CN118233697B
公开(公告)日:2025-02-07
申请号:CN202410464923.6
申请日:2024-04-17
Applicant: 华院计算技术(上海)股份有限公司
IPC: H04N21/44 , H04N21/4402 , H04N21/845 , G06V40/16 , G06N3/08
Abstract: 传统的视频数据集切分方法主要依赖于手工标注,这一过程耗时耗力,且难以适应大规模视频数据处理的需求。本发明提供一种切分新闻主播视频数据集的方法、系统及电子设备,包括:获取用户提交的新闻主播视频;对所述新闻主播视频进行快速筛查,得到包含新闻主播和采访观众的人脸数据库;对所述包含新闻主播和采访观众的人脸数据库进行过滤,过滤掉采访观众的人脸数据,得到仅含新闻主播的人脸数据库;根据所述仅含新闻主播的人脸数据库,使用深度模型对所述新闻主播视频进行逐帧筛查,得到精确的新闻主播视频切分结果。以实现高精度、全自动的新闻主播视频切分。
-
公开(公告)号:CN119313789A
公开(公告)日:2025-01-14
申请号:CN202411304862.3
申请日:2024-09-18
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T13/40 , G06F18/2431 , G06F18/21 , G06N3/0464 , G06N3/08 , G10L25/63 , G10L25/57
Abstract: 本发明提供一种带表情的数字人生成方法、系统、存储介质和程序产品,其中方法包括以下步骤:输入音频和相应图片;将音频输入到音频情绪提取网络提取相应的情绪类别;根据情绪类别从表情模板中抽取对应的模板;将模板和图片一起输入到生成网络生成相应的带表情基础图片;将基础图片经过处理以后,提取图像特征,同时对音频进行音频特征提取;将图像特征和音频特征输入到解码网络得到带表情的图片。本发明提供一种带表情的数字人生成方法、系统、存储介质和程序产品,能够通过引入相应的音频情绪提取和表情模板,实现对于带表情的,并且是多种表情变化的数字人生成任务。
-
公开(公告)号:CN119248916A
公开(公告)日:2025-01-03
申请号:CN202411303314.9
申请日:2024-09-18
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/30 , G06N5/04 , G06N5/022 , G06N3/0455
Abstract: 本发明提供一种自适应检索增强大语言模型构建和问答方法、系统、存储介质和程序产品,其中构建方法包括:收集问答数据,包括问题、标准答案和参考的上下文;使用大语言模型回答问题,得到初始答案;判断所述初始答案和标准答案是否一致,根据判断结果构建训练数据;基于所述训练数据,对大语言模型进行微调训练,得到自适应检索增强大语言模型。问答方法包括:输入问题;自适应检索增强大语言模型回答问题,并判断是否需要获取额外知识;根据判断结果,输出answer作为最终答案。本发明能够在资源利用和回答质量之间实现平衡,解决资源消耗大、问答效率低以及回答准确度差的问题。
-
公开(公告)号:CN119088947A
公开(公告)日:2024-12-06
申请号:CN202411206209.3
申请日:2024-08-30
Applicant: 浙江大学 , 华院计算技术(上海)股份有限公司
IPC: G06F16/335 , G06F16/33 , G06F16/35 , G06F18/2415 , G06F18/2431 , G06F18/27 , G06Q50/26
Abstract: 本发明公开了一种基层社会网格治理复杂事件机制智能推荐方法及装置,该方法包括:对接第三方信息化平台,以接口或数据库直连的方式获取基层社会网格治理的待处理事件,对所述待处理事件提取第一特征;采用繁简分类模型,基于所述第一特征,将所述待处理事件划分为简单事件或复杂事件;若所述待处理事件为复杂事件,则通过向量化检索和机器学习的方法为其推荐相应的处理机制,分别得到其属于各处理机制的第一概率和第二概率,对所述第一概率和第二概率进行排序,从而为其推荐概率最高的处理机制,可以实现对复杂事件的快速响应和有效处置。而智能化技术的运用则能够进一步提升治理的精准性和高效性,为基层社会治理注入新的活力。
-
公开(公告)号:CN118658515B
公开(公告)日:2024-12-06
申请号:CN202410682660.6
申请日:2024-05-29
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本发明公开了一种基于抗体结构微调的蛋白质大语言模型针对特定抗原设计新抗体的系统。一种训练抗体3D结构模型的系统,所述系统包括以下模块:(1)模型微调模块:该模块用于使用抗体序列数据库对蛋白质语言大模型进行微调;(2)抗体设计模块:该模块用于使用抗体序列微调后的蛋白质大语言模型进行目标抗体序列的优化和设计;(3)3D结构建模模块:该模块用于对优化和设计后的抗体序列进行3D结构建模。本发明的模型构建了从模型训练、抗体序列生成、抗体结构预测、抗原抗体对接的全过程,增加了抗体和特定抗原的亲和力与特异性,能大大缩短抗体筛选的时间,帮助企业加速抗体药物的研发。
-
-
-
-
-
-
-
-
-