构建具有逻辑推理和事实判别功能ChatGPT模型的方法及装置

    公开(公告)号:CN117371489A

    公开(公告)日:2024-01-09

    申请号:CN202311422425.7

    申请日:2023-10-30

    Inventor: 蒋鹏 蔡晓东

    Abstract: 本发明提供一种构建具有逻辑推理和事实判别功能ChatGPT模型的方法及装置,方法包括:将无标签语料训练集输入chatGPT语言模型中并通过多头自注意力机制进行预训练,得到预训练阶段损失函数和隐藏向量;通过预训练阶段损失函数、隐藏向量和外部知识库构建逻辑推理概率和事实判别概率,并进行组合,得到输出概率;通过带标签语料训练集对输出概率进行调整,通过调整后的输出概率,并最大化所述输出概率,得到调整阶段损失函数;通过预训练阶段损失函数和调整阶段损失函数构建总损失函数,通过总损失函数得到最优chatGPT语言模型,该模型能够拥有强大的逻辑推理能力和能够清楚且有依据的生成事实结果。

    一种文本摘要评价方法、装置以及存储介质

    公开(公告)号:CN115221863B

    公开(公告)日:2023-08-04

    申请号:CN202210844106.4

    申请日:2022-07-18

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明提供一种文本摘要评价方法、装置以及存储介质,属于语言处理领域,方法包括:对原始中文文本进行预处理得到处理后文本;对所有的原始中文文本和所有的处理后文本进行摘要关键信息覆盖率的分析得到摘要关键信息覆盖率、原始文本摘要概率分布以及处理后文本摘要概率分布;对摘要关键信息覆盖率、原始文本摘要概率分布以及处理后文本摘要概率分布进行评价分数的计算得到文本摘要评价结果。本发明能够更加合理地评价生成摘要,且评价结果更加接近人工评价,从而使评价内容更灵活且合理。

    一种物品评分预测方法、装置、系统以及存储介质

    公开(公告)号:CN115759381A

    公开(公告)日:2023-03-07

    申请号:CN202211413372.8

    申请日:2022-11-11

    Inventor: 蔡晓东 周青松

    Abstract: 本发明提供一种物品评分预测方法、装置、系统以及存储介质,属于物品推荐领域,方法包括:对原始评分数据进行预处理得到交互图;对交互图进行采样分析得到目标用户节点、目标物品节点、目标用户数据以及目标物品数据;对目标用户节点以及目标用户数据进行目标用户节点的特征学习得到用户全局向量;对目标物品节点以及目标物品数据进行目标物品节点的特征学习得到物品全局向量。本发明能够在进行用户对物品的评分预测建模中令目标节点聚合到更相关的邻居节点的信息,从而生成更为精准的评分预测结果,对于提升推荐准确率有着显著的价值和意义。

    一种文本匹配方法、装置、系统以及存储介质

    公开(公告)号:CN115712713A

    公开(公告)日:2023-02-24

    申请号:CN202211476656.1

    申请日:2022-11-23

    Inventor: 蔡晓东 董丽芳

    Abstract: 本发明提供一种文本匹配方法、装置、系统以及存储介质,属于语言处理领域,方法包括:对原始句子对进行标注分析得到标注句子对;利用编码器对各个标注句子对进行编码得到句子对隐藏向量;根据各个原始句子对以及句子对隐藏向量进行向量分析得到差异向量、第一初始全局向量以及第二初始全局向量;根据差异向量、第一初始全局向量以及第二初始全局向量进行句子对相似性匹配分数的计算得到文本匹配结果。本发明突出了关键字这一重要匹配粒度在句子匹配中的重要性,实现了更精确的文本匹配,相对现有技术,能够更精确地判断文本的相似性且提升了文本匹配的准确率。

    一种文本匹配数据处理方法、装置、系统以及存储介质

    公开(公告)号:CN115658844A

    公开(公告)日:2023-01-31

    申请号:CN202211209355.2

    申请日:2022-09-30

    Inventor: 蔡晓东 董丽芳

    Abstract: 本发明提供一种文本匹配数据处理方法、装置、系统以及存储介质,属于语言处理领域,方法包括:对原始句子对的编码得到原始句子对向量;对原始句子对向量的卷积处理得到第一文本向量和第二文本向量;分别对第一文本向量以及第二文本向量的均值化处理对应得到第一均值化后向量以及第二均值化后向量;分别对第一均值化后向量以及第二均值化后向量的规范化分析对应得到多个第一目标向量以及多个第二目标向量;将各个第一目标向量与各个第二目标向量对应的相似性分数计算得到文本匹配结果。本发明能准确提取句子对丰富的语义信息,实现不同视角下的文本匹配,相对现有技术,能够更全面、客观地判断文本的相似性且提升了文本匹配的准确性。

    一种文本分类方法、装置以及存储介质

    公开(公告)号:CN114860930A

    公开(公告)日:2022-08-05

    申请号:CN202210441429.9

    申请日:2022-04-25

    Abstract: 本发明提供一种文本分类方法、装置以及存储介质,属于文本分类领域,方法包括:S1:对多个原始文本数据进行划分得到训练集和测试集;S2:分别对训练集和测试集进行数据预处理得到多个单词训练矩阵以及多个单词测试矩阵;S3:分别对各个单词训练矩阵进行向量化处理得到词向量矩阵;S4:构建训练模型,根据多个词向量矩阵对训练模型进行训练得到待测试模型;S5:根据多个单词测试矩阵对待测试模型进行测试得到分类模型;S6:导入待分类文本数据,通过分类模型对待分类文本数据进行分类得到分类结果。本发明能够突出文本中的关键信息,同时增强文本上下文语义信息,更准确的表示文本语义,从而提高了文本分类的准确度。

    一种文本摘要生成方法、装置以及存储介质

    公开(公告)号:CN114662483A

    公开(公告)日:2022-06-24

    申请号:CN202210332378.6

    申请日:2022-03-30

    Abstract: 本发明提供一种文本摘要生成方法、装置以及存储介质,属于语言处理领域,方法包括:对文本数据集进行分词处理得到多个原文信息以及摘要信息;根据各个原文信息分别对训练模型进行训练得到原始预测序列;根据多个原始预测序列和多个摘要信息对训练模型进行损失函数分析,根据分析结果得到摘要生成模型;将各个原文信息以及摘要信息分别输入至摘要生成模型中进行预测分析,得到文本摘要生成的结果。本发明使得生成摘要中的词序问题得到改善,文本的语序更加的通畅,从而提高了摘要的可读性。

    一种物品推荐方法、装置以及存储介质

    公开(公告)号:CN114491266A

    公开(公告)日:2022-05-13

    申请号:CN202210110843.1

    申请日:2022-01-29

    Inventor: 蔡晓东 刘家良

    Abstract: 本发明提供一种物品推荐方法、装置以及存储介质,属于数据分析技术领域,方法包括:导入正样本数据集,对正样本数据集的交互矩阵构建得到交互矩阵和多个物品向量;构建训练模型,根据交互矩阵和多个物品向量对训练模型进行训练得到物品推荐模型;导入待推荐数据,将待推荐数据输入至物品推荐模型中,根据物品推荐模型得到物品推荐结果。本发明不需要进行传统的负采样,避免了采样过程带来的噪声干扰,也避免了在模型训练过程中训练崩塌的问题,提高了推荐的准确率和鲁棒性。

    一种商品信息推荐方法、装置及存储介质

    公开(公告)号:CN112800207B

    公开(公告)日:2022-05-13

    申请号:CN202110041795.0

    申请日:2021-01-13

    Inventor: 蔡晓东 洪涛

    Abstract: 本发明提供一种商品信息推荐方法、装置及存储介质,方法包括:导入商品信息数据集,对商品信息数据集的数据集划分得到商品信息训练集和商品信息测试集;对商品信息训练集进行向量化分析,得到知识图谱矩阵和训练集矩阵。本发明能够有效的挖掘出数据间的隐含特性,进而实现了准确的推荐,还能够在数学上有更好的区分,进而有利于挖掘出图中更多的有效信息,能够实现快速推荐并在特定场景下实现准确推荐,且具有一定的泛化性,对不同类型的数据均有一定的效果,同时,能够有效的提高推荐准确性,并具有良好的鲁棒性,能够合理准确的给用户推荐商品,实现了冷启动对用户推荐商品并提高了推荐的可靠性和准确性。

    一种身份识别方法、装置以及存储介质

    公开(公告)号:CN114387646A

    公开(公告)日:2022-04-22

    申请号:CN202111640925.9

    申请日:2021-12-29

    Abstract: 本发明提供一种身份识别方法、装置以及存储介质,属于图片识别技术领域,方法包括:导入多个行人图片,分别对各个行人图片进行人脸识别得到目标人脸图片;对多个目标人脸图片进行隶属度矩阵的构建分析得到隶属度矩阵;根据隶属度矩阵对多个目标人脸图片以及多个行人图片进行划分得到接受域、拒绝域和不确定域;分别对接受域、拒绝域以及不确定域进行身份识别分析得到身份识别结果。本发明能够在不同场景下的目标采用合适的识别方法,区别于单一仅采用人脸或者行人的识别,对目标身份的识别准确率有了显著的提升,能够适用于复杂的现实情况。

Patent Agency Ranking