Patent search ap:("之江实验室") AND inv:"刘扶芮" Page 1

1.

发明公开
一种基因表达量的检测数据管理方法及装置审中-实审

公开(公告)号：CN117935915A

公开(公告)日：2024-04-26

申请号：CN202410072107.0

申请日：2024-01-17

Applicant: 之江实验室

Inventor： 张秋云 , 许吾琴 , 郑进芳 , 刘扶芮 , 杨耀

IPC: G16B25/00 , G16B50/30 , G16B40/00

Abstract: 在本说明书提供的一种基因表达量的检测数据管理方法及装置中，响应于用户的管理请求，通过提取该管理请求携带的存储基因表达量检测值的源文件中的各第一标签信息，以及针对每个第一标签信息，从第一数据仓库中检索该第一标签信息，确定有效性，当有效性为有效时，将该第一标签信息以及该第一标签信息的基因表达量检测值，作为检测数据，并按照预设规则，存入第二数据仓库，通过该第二数据仓库中的检测数据，确定管理信息返回给用户。将第一标签信息的有效性为有效作为筛选标准，确定符合该筛选标准的检测数据，并按照预设规则存入第二数据仓库，实现了对源文件中基因表达量检测值的筛选，以及实现了存储方式的统一，便于用户后续管理。

2.

发明公开
一种细胞检测数据预处理方法、装置及存储介质有权

公开(公告)号：CN117743809A

公开(公告)日：2024-03-22

申请号：CN202410189827.5

申请日：2024-02-20

Applicant: 之江实验室

Inventor： 张秋云 , 许吾琴 , 郑进芳 , 陈广勇 , 刘扶芮

IPC: G06F18/20 , G06F18/213 , G06F18/22 , G06N20/00

Abstract: 本说明书公开了一种细胞检测数据预处理方法、装置及存储介质，获取待处理的各细胞检测数据和各细胞检测数据对应的配置信息，配置信息至少包含若干提取规则，针对各细胞检测数据包含的每个子数据，确定该子数据的数据标识，根据数据标识，确定数据标识对应的各提取规则，依次针对每个提取规则，通过该提取规则从该子数据中提取对应的目标值，按照提取各目标值的顺序，确定该子数据对应的目标数据，根据各子数据对应的目标数据，确定结果数据。通过提取规则，可以实现对细胞检测数据中的各数据值的提取，并将提取到的各数据值重新排列整合为结果数据输出，该结果数据可用于机器学习算法的数据分析，与手动进行预处理相比，提高了预处理效率。

3.

发明授权
一种基于大模型的潜在绿色企业挖掘方法和装置有权

公开(公告)号：CN119066185B

公开(公告)日：2025-04-22

申请号：CN202411574862.5

申请日：2024-11-06

Applicant: 之江实验室

Inventor： 李晓晨 , 王艺涵 , 刘扶芮

IPC: G06F16/3329 , G06F16/36 , G06F16/953 , G06F18/214 , G06Q40/03

Abstract: 本发明公开了一种基于大模型的潜在绿色企业挖掘方法和装置，包括：对大语言模型基座进行领域预训练以及进行绿色企业与绿色产业识别任务的微调；获取每个企业的经营范围、业务范围以及生态环境行政处罚相关文本信息，并与企业申请绿色信贷时填写的信贷业务相关文本信息进行文本处理；将经过处理的文本数据和问题输入微调后的大语言模型，输出是否为绿色企业以及绿色企业所属的绿色产业类别，同时由人工对输出结果进行二次确认得到确认结果，将确认结果作为标签对大语言模型进行训练；利用训练好的大语言模型进行绿色企业挖掘。本发明通过一整套智能的流程设计，极大削减了人力成本，简化了潜在绿色企业的挖掘流程，缩短潜在绿色企业的挖掘周期。

4.

发明授权
一种细胞检测数据预处理方法、装置及存储介质有权

公开(公告)号：CN117743809B

公开(公告)日：2024-05-24

申请号：CN202410189827.5

申请日：2024-02-20

Applicant: 之江实验室

Inventor： 张秋云 , 许吾琴 , 郑进芳 , 陈广勇 , 刘扶芮

IPC: G06F18/20 , G06F18/213 , G06F18/22 , G06N20/00

Abstract: 本说明书公开了一种细胞检测数据预处理方法、装置及存储介质，获取待处理的各细胞检测数据和各细胞检测数据对应的配置信息，配置信息至少包含若干提取规则，针对各细胞检测数据包含的每个子数据，确定该子数据的数据标识，根据数据标识，确定数据标识对应的各提取规则，依次针对每个提取规则，通过该提取规则从该子数据中提取对应的目标值，按照提取各目标值的顺序，确定该子数据对应的目标数据，根据各子数据对应的目标数据，确定结果数据。通过提取规则，可以实现对细胞检测数据中的各数据值的提取，并将提取到的各数据值重新排列整合为结果数据输出，该结果数据可用于机器学习算法的数据分析，与手动进行预处理相比，提高了预处理效率。

5.

发明授权
基于联邦学习客户端选择的分类模型训练方法及系统有权

公开(公告)号：CN117557870B

公开(公告)日：2024-04-23

申请号：CN202410022912.2

申请日：2024-01-08

Applicant: 之江实验室

Inventor： 李清明 , 缪居正 , 刘扶芮 , 周丽 , 马振国 , 严笑然

IPC: G06V10/764 , G06V10/774 , G06V10/74

Abstract: 本申请涉及一种基于联邦学习客户端选择的分类模型训练方法、系统及介质，其中，基于联邦学习客户端选择的分类模型训练方法包括：初始化全局模型，并初始化虚拟队列、客户端相似度矩阵以及客户端选中频率矩阵；在每一次迭代训练过程中，基于所述虚拟队列、所述客户端相似度矩阵以及所述客户端选中频率矩阵，确定参与本轮训练的K个客户端；将所述全局模型发送至所述K个客户端进行并行训练，得到聚合后的全局模型；更新所述虚拟队列、所述客户端相似度矩阵以及所述客户端选中频率矩阵，并重复所述迭代训练过程直至达到设定的迭代次数，获得训练好的全局模型；使用训练好的全局模型对目标数据集进行分类，得到分类结果，提高了图像分类的精度。

6.

发明公开
一种基于贝叶斯优化的多肽筛选方法和装置审中-实审

公开(公告)号：CN118588155A

公开(公告)日：2024-09-03

申请号：CN202410637669.5

申请日：2024-05-22

Applicant: 之江实验室

Inventor： 黄婉莹 , 王二成 , 陈广勇 , 刘扶芮 , 吴边

IPC: G16B15/30 , G16B20/50 , G16B35/20 , G16B20/30 , G06N7/01

Abstract: 本发明公开了一种基于贝叶斯优化的多肽筛选方法和装置，该方法在原始天然肽的基础上，充分结合分子动力学和分子对接等多种结合模拟手段，基于贝叶斯优化筛选出高亲和力的多肽序列；对天然多肽和蛋白进行分子对接；使用贝叶斯优化进行多肽突变生成新的多肽序列，并进行分子对接；使用构建的多肽蛋白的目标函数，基于贝叶斯优化筛选出推荐的多肽序列，不断迭代循环，最终筛选出高亲和力的突变多肽。本发明能够解决多肽药物序列生成高亲和力肽序列较为困难的行业痛点，能够很好的开展多肽蛋白间的优化筛选，基于贝叶斯优化不断迭代出极高亲和力的多肽序列，为大分子药物设计提供了一体化的生成与筛选流程。

7.

发明公开
一种基于词权统计和预训练模型的文本分类方法及装置有权

公开(公告)号：CN118535743A

公开(公告)日：2024-08-23

申请号：CN202411004264.4

申请日：2024-07-25

Applicant: 之江实验室

Inventor： 李晓晨 , 李栓 , 刘扶芮

IPC: G06F16/35 , G06F40/216 , G06F40/242 , G06F40/30 , G06N3/0455 , G06N3/09

Abstract: 本发明公开了一种基于词权统计和预训练模型的文本分类方法及装置，主要包括以下步骤：获取文本语料并存储在文本数据库中；对文本语料进行数据清洗得到文本数据集；利用词频‑逆标签集频率算法生成词‑标签权重词典；利用词‑标签权重词典生成文本权重得分向量结合预处理后的文本经文本分类模型得到文本分类预测结果，对模型进行迭代训练；利用预训练后的文本分类模型对新输入文本进行分类。本发明将每个词相对于每个标签的重要程度作为先验知识，之后在文本分类模型中使用注意力机制将该先验知识融入预训练BERT模型输出的文本语义表示中，能够进一步提高文本分类的准确率和效率。

8.

发明公开
一种推荐塑料降解酶突变位点的方法、电子设备、介质审中-实审

公开(公告)号：CN116863996A

公开(公告)日：2023-10-10

申请号：CN202310724842.0

申请日：2023-06-19

Applicant: 之江实验室

Inventor： 胡捷 , 侯丽亚 , 李安妮 , 唐进 , 刘扶芮 , 崔海洋 , 吴丽娜 , 李秀娟

IPC: G16B20/30 , G16B20/50 , G16B30/10

Abstract: 本发明公开了一种推荐塑料降解酶突变位点的方法、电子设备、介质，包括：步骤S1，获取待预测塑料降解酶的氨基酸序列及其底物；预测底物与塑料降解酶的相互作用区域；设置阈值距离，以底物分子或塑料降解酶活性位点为基准阈值距离内的塑料降解酶氨基酸作为候选氨基酸突变位点；步骤S2，获取待预测塑料降解酶的空间结构，以氨基酸为节点，氨基酸之间的连接为边，经几何向量感知机预测输出每个候选氨基酸突变位点对应的i种氨基酸的预测概率，将概率最高的氨基酸作为该候选氨基酸突变位点可推荐的氨基酸；比较每个候选氨基酸突变位点的预测结果，当预测结果与原氨基酸序列不一致时，将该候选氨基酸突变位点作为推荐的塑料降解酶突变位点。

9.

发明公开
一种基于大模型的潜在绿色企业挖掘方法和装置有权

公开(公告)号：CN119066185A

公开(公告)日：2024-12-03

申请号：CN202411574862.5

申请日：2024-11-06

Applicant: 之江实验室

Inventor： 李晓晨 , 王艺涵 , 刘扶芮

IPC: G06F16/332 , G06F16/36 , G06F16/953 , G06F18/214 , G06Q40/03

Abstract: 本发明公开了一种基于大模型的潜在绿色企业挖掘方法和装置，包括：对大语言模型基座进行领域预训练以及进行绿色企业与绿色产业识别任务的微调；获取每个企业的经营范围、业务范围以及生态环境行政处罚相关文本信息，并与企业申请绿色信贷时填写的信贷业务相关文本信息进行文本处理；将经过处理的文本数据和问题输入微调后的大语言模型，输出是否为绿色企业以及绿色企业所属的绿色产业类别，同时由人工对输出结果进行二次确认得到确认结果，将确认结果作为标签对大语言模型进行训练；利用训练好的大语言模型进行绿色企业挖掘。本发明通过一整套智能的流程设计，极大削减了人力成本，简化了潜在绿色企业的挖掘流程，缩短潜在绿色企业的挖掘周期。

10.

发明授权
一种基于词权统计和预训练模型的文本分类方法及装置有权

公开(公告)号：CN118535743B

公开(公告)日：2024-11-05

申请号：CN202411004264.4

申请日：2024-07-25

Applicant: 之江实验室

Inventor： 李晓晨 , 李栓 , 刘扶芮

IPC: G06F16/35 , G06F40/216 , G06F40/242 , G06F40/30 , G06N3/0455 , G06N3/09

Abstract: 本发明公开了一种基于词权统计和预训练模型的文本分类方法及装置，主要包括以下步骤：获取文本语料并存储在文本数据库中；对文本语料进行数据清洗得到文本数据集；利用词频‑逆标签集频率算法生成词‑标签权重词典；利用词‑标签权重词典生成文本权重得分向量结合预处理后的文本经文本分类模型得到文本分类预测结果，对模型进行迭代训练；利用预训练后的文本分类模型对新输入文本进行分类。本发明将每个词相对于每个标签的重要程度作为先验知识，之后在文本分类模型中使用注意力机制将该先验知识融入预训练BERT模型输出的文本语义表示中，能够进一步提高文本分类的准确率和效率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification