一种文本关键词提取方法、装置、电子设备及存储介质

    公开(公告)号:CN116432638A

    公开(公告)日:2023-07-14

    申请号:CN202111645767.6

    申请日:2021-12-30

    Inventor: 范潇

    Abstract: 本申请涉及文本分析技术领域,尤其涉及一种文本关键词提取方法、装置、电子设备及存储介质,对待处理文本进行分词处理,获得待处理文本中包含的各个词语,分别创建以各个词语为中心词的词团,并确定各词团各自对应的词团重要度权重,从各词团中,选择出满足预设词团重要度权重条件的各词团,并将确定出的各词团各自对应的词团向量,作为相应的类别中心向量,基于各类别中心向量,以及各词语各自对应的词向量,对各个词语进行聚类,并分别从各词语类中,确定出待处理文本的各文本关键词,从而提高提取文本关键词的质量。

    一种查询图的生成方法及装置、电子设备、存储介质

    公开(公告)号:CN115544270A

    公开(公告)日:2022-12-30

    申请号:CN202211271802.7

    申请日:2022-10-18

    Inventor: 贾炎 范潇

    Abstract: 本发明实施例提供了一种查询图的生成方法及装置、电子设备、存储介质,方法包括:获取第一查询问句和针对查询问句进行关系检测的关系检测模型;确定第一查询问句的多个链接实体;通过关系检测模型对第一查询问句进行关系检测,对所述多个链接实体进行排序,以从所述多个链接实体中确定目标链接实体集合;基于第一查询问句生成第二查询问句;通过关系检测模型对第二查询问句进行关系检测,从所述目标链接实体集合中确定目标链接实体,并基于所述目标链接实体生成查询图。通过本发明实施例,实现了增强信息提取能力,不依赖知识图谱遍历计算,基于二次关系检测从查询问句的中心实体出发,聚焦于局部查询图的生成,使生成的查询图更加准确。

    一种文本信息分类方法、装置、电子设备及存储介质

    公开(公告)号:CN114943295A

    公开(公告)日:2022-08-26

    申请号:CN202210607812.7

    申请日:2022-05-31

    Inventor: 范潇 贾炎 康志峰

    Abstract: 本发明实施例提供了一种文本信息分类方法、装置、电子设备及存储介质,通过在完成对标签向量矩阵和文本向量矩阵构建后的推理过程中,且在通过既有模型利用用于表达类别标签置信度的标签观测概率作为推理依据的前提下,通过计算出不同层次之间的标签转移概率,对各层级的类别标签的分类结果进行约束,避免了在输出错误标签的置信度高于正确标签的置信度时,将错误标签作为标签预测结果,并将错误信息传递给下层的预测中,从而提高了针对文本信息分类的准确率。

    大模型生成方法、装置、计算机程序产品

    公开(公告)号:CN118427214A

    公开(公告)日:2024-08-02

    申请号:CN202410425321.X

    申请日:2024-04-09

    Inventor: 范潇 边江涛 白桦

    Abstract: 本申请公开了一种大模型生成方法、装置、计算机程序产品。其中,该方法包括:获取自然语言目标问句,并确定自然语言目标问句内的至少一个关键词;利用预设的知识图谱确定各个关键词的要素和要素的属性信息,并由各个关键词的要素和要素的属性信息生成初始SQL语句;确定预设的语料库内的自然语言样例问句与自然语言目标问句或语料库内的样例SQL语句与初始SQL语句的相似度,并基于相似度确定至少一组目标问答对;利用至少一组目标问答对作为提示工程对预设的初始大模型进行训练,得到目标大模型。本申请解决了相关技术采用关键词识别、维护SQL语句模板等方法对自然语言文本进行语义分析,导致SQL预测准确率较低的技术问题。

    文本处理方法、装置、存储介质及电子设备

    公开(公告)号:CN115374782A

    公开(公告)日:2022-11-22

    申请号:CN202211072526.1

    申请日:2022-09-02

    Abstract: 本申请属于人工智能技术领域,涉及文本处理方法、装置、存储介质及电子设备。该方法包括:获取待处理文本,对所述待处理文本进行预处理和分词处理,以获取与所述待处理文本对应的分词向量序列;将所述分词向量序列输入至融合语言模型,通过所述融合语言模型对所述分词向量序列进行语义特征提取,以获取与所述待处理文本对应的目标词向量;其中,所述融合语言模型是基于Nezha模型、Bert模型和Roformer模型构建的。本申请能够通过融合语言模型充分挖掘待处理文本中隐藏的信息,提高语义特征提取和词向量的精准度。

    异常通信号码的识别方法、装置、电子设备和可读介质

    公开(公告)号:CN114169439A

    公开(公告)日:2022-03-11

    申请号:CN202111492196.7

    申请日:2021-12-08

    Inventor: 胡玉婷 范潇

    Abstract: 本公开提供一种异常通信号码的识别方法、装置、电子设备和可读介质,其中,异常通信号码的识别方法包括:通过改进的聚类算法对训练好的深度学习模型输出的任一疑似异常号码的特征指标数据进行聚类处理;确定聚类处理后的特征指标数据中的各个细项指标的权重;确定特征指标数据中的各个细项指标的标准分;根据权重和标准分计算各个细项指标的异常度得分;根据异常度得分确定疑似异常号码为异常号码。通过本公开实施例,提高了异常号码识别的准确率和可靠性。

    数据共享方法、装置、电子设备及可读存储介质

    公开(公告)号:CN116933282A

    公开(公告)日:2023-10-24

    申请号:CN202310754261.1

    申请日:2023-06-25

    Abstract: 本申请实施例提供了一种数据共享方法、装置、电子设备及可读存储介质,属于数据处理领域,该方法应用于数据共享中间方,包括:接收数据使用方发送的计算任务,并根据计算任务确定至少一个计算子任务;其中,计算任务是数据使用方根据加密密钥对计算模型进行加密,并根据加密后的计算模型生成的;将至少一个计算子任务发送给各自对应的数据提供方;接收各数据提供方发送的计算子结果;其中,计算子结果是对应的数据提供方根据加密后的计算模型对目标数据进行计算得到的,目标数据是数据提供方对应的计算子任务所指定的数据;根据各数据提供方发送的计算子结果确定计算结果,并向数据使用方发送所述计算结果。可以提高数据共享的安全性。

    日志模板获取方法、装置、计算机设备及存储介质

    公开(公告)号:CN116029289A

    公开(公告)日:2023-04-28

    申请号:CN202211705220.5

    申请日:2022-12-28

    Abstract: 本申请提供日志模板获取方法、装置、计算机设备及存储介质,应用于计算机技术领域,该方法包括:获取当前日志数据,并进行预处理,得到待处理日志数据;对待处理日志数据中的每条当前日志进行分词处理,得到每条当前日志对应的当前日志分词组;获取预设的词频统计信息,并根据预设的词频统计信息和每条当前日志对应的当前日志分词组对每条当前日志进行分组,得到多个日志分组,实现对当前日志进行准确分组,有效避免在变长变量日志场景下由于日志事件的当前日志的长度不同,造成当前日志分类不准确的问题,然后根据预设的词频统计信息、每个日志分组和预设的日志模板数据库,获取目标日志模板,从而提高日志模板提取的准确率。

    车辆云多路计算卸载方法及装置
    10.
    发明公开

    公开(公告)号:CN116360878A

    公开(公告)日:2023-06-30

    申请号:CN202111620685.6

    申请日:2021-12-28

    Inventor: 范潇 许世琳

    Abstract: 本公开提供了一种车辆云多路计算卸载方法及装置,首先构建车载资源总体效应值的计算卸载目标函数,以该函数值的最大化为计算卸载的优化目标,针对计算资源供大于求的高密度车辆云环境,提出将计算卸载目标函数的优化,转换为对基于风险因子的多路计算卸载可靠性模型的优化,以提升多路计算卸载的成功率与资源利用率。另外,本公开还通过针对多路计算卸载可靠性模型,构建马尔科夫博弈建模,使用基于深度确定性策略梯度的多智能体深度强化学习算法实现计算卸载,同时为了避免收敛至局部最优解,提出了采用基于均值回收和扩散的奥恩斯坦‑乌伦贝克过程来增加模型的泛化能力。

Patent Agency Ranking