-
公开(公告)号:CN113449108B
公开(公告)日:2022-10-21
申请号:CN202110734921.0
申请日:2021-06-30
Applicant: 南京理工大学
IPC: G06F16/35 , G06F16/33 , G06F40/194 , G06F40/242 , G06F40/289 , G06K9/62 , G06Q40/00
Abstract: 一种基于层级化聚类的金融新闻流突发检测方法,包括:文本的预处理;抽取关键词并构建关键词共现图;采用二分K‑Means算法对关键词聚类,将关键词共现图划分为若干子图,每个子图中的关键词为一个金融主题;通过相似度计算识别每篇金融新闻所属金融主题;构建以每篇金融新闻为节点的无向图,采用二分K‑Means算法对金融新闻聚类,将金融新闻节点无向图划分为若干子图,每个子图中的金融新闻为一个金融事件;通过相似度计算生成故事链;突发事件检测。本发明通过自然语言处理及图论相关技术,对金融新闻进行事件聚类,解决了传统金融突发事件不能将同一事件相关新闻综合考虑的问题,实现了高效准确地检测出金融突发事件,具有一定的工业价值。
-
公开(公告)号:CN119295091B
公开(公告)日:2025-03-11
申请号:CN202411822646.8
申请日:2024-12-12
Applicant: 图灵人工智能研究院(南京)有限公司 , 南京理工大学
IPC: G06Q30/015 , G06Q30/0601 , G06F16/3329 , G06F16/334 , G06F16/9535 , G06F40/186 , G06F40/30 , G06N3/042 , G06N3/092
Abstract: 本发明公开一种基于大语言模型的企微营销辅助方法与系统,利用大语言模型来提升营销的效率和效果。所述方法通过整合向量数据库、嵌入模型和上下文学习技术,实现了对用户意图的实时理解、个性化回复以及快速适应业务变化的能力。该方法的核心优势在于其精准的用户需求分析、个性化服务提供以及高效的知识检索系统。通过分析用户行为和对话记录,本发明能够提供符合用户偏好的产品推荐和营销策略。此外,本发明还具备实时话术更新能力,确保信息的时效性和准确性;自动化订单信息抽取技术提高了信息处理效率,减少了人工操作的时间和成本。本发明不仅提高了营销效率,还增强了用户与客服之间的互动体验,为企业在竞争激烈的市场中提供了竞争优势。
-
公开(公告)号:CN114154581A
公开(公告)日:2022-03-08
申请号:CN202111477718.6
申请日:2021-12-06
Applicant: 南京理工大学
IPC: G06K9/62 , G06N20/00 , H04L51/212 , H04L51/42
Abstract: 本发明公开了一种基于MPI的分布式ADMM垃圾邮件分类方法,包含以下步骤:将文本数据向量化为数字格式的数据集;将数据集分割为训练集和测试集,对训练集进行过采样处理,再分割为若干份分别保存在若干个从节点上;MPI并行执行所有节点上的代码,从节点并行更新局部模型;主节点通过MPI规约功能汇总从节点的局部模型;主节点更新全局模型,并利用MPI广播功能将全局模型分发到各个从节点;循环交替更新从节点和主节点的模型,直到满足终止条件;保存主节点的全局模型作为分类器模型;利用训练得到的分类器模型对测试集进行分类,输出分类结果。本发明适合大数据场景下垃圾邮件分类任务,有效提升了分类的效率和精度。
-
公开(公告)号:CN113515619B
公开(公告)日:2024-08-13
申请号:CN202110783307.3
申请日:2021-07-12
Applicant: 南京理工大学 , 感易智能科技(南京)有限公司
IPC: G06F16/335 , G06F16/215 , G06F16/9535 , G06F16/9536 , G06F40/242 , G06F40/284 , G06F40/289 , G06N3/0442 , G06N3/08 , G06Q50/00
Abstract: 本发明涉及一种基于显著性信息门控机制的关键词生成方法,属于关键词生成领域。该系统使用预训练模型BERT作为编码器来获取源文档的上下文语义信息,在Transformer解码器端增加显著性门控机制,构建Saliency‑Transformer解码器模块,显式地管理从编码器到解码器的信息流,减少源文档中低语义词的权重,降低了它们在最终关键词生成中出现的可能性,从而提升关键词生成的准确性和质量。本发明通过自然语言处理和深度学习相关技术创新关键词生成方法,为文本生成领域提供技术支撑,对数据挖掘领域来说,具有一定的商业工业应用价值。
-
公开(公告)号:CN108985517A
公开(公告)日:2018-12-11
申请号:CN201810845924.X
申请日:2018-07-27
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于线性回归的短时交通流量预测方法。方法为:首先对获取到的可能影响交通流量的因子进行特征缩放;初始化经过特征缩放后的各个因子的参数,结合线性回归方法对特征缩放后的因子进行建模;然后根据实际交通流量和建立的模型确定代价函数,对代价函数进行正则化处理;接着利用梯度下降算法求解代价函数最小值,根据代价函数最小值求得的最优参数;最后利用求得的最优参数对该道路的短时交通流量进行预测。本发明通过线性回归算法对短时交通流量进行预测,通过多组特征数据的使用,利用正则化方法进行优化,减少了过拟合的问题,提高了预测的准确性。
-
公开(公告)号:CN119295091A
公开(公告)日:2025-01-10
申请号:CN202411822646.8
申请日:2024-12-12
Applicant: 图灵人工智能研究院(南京)有限公司 , 南京理工大学
IPC: G06Q30/015 , G06Q30/0601 , G06F16/3329 , G06F16/334 , G06F16/9535 , G06F40/186 , G06F40/30 , G06N3/042 , G06N3/092
Abstract: 本发明公开一种基于大语言模型的企微营销辅助方法与系统,利用大语言模型来提升营销的效率和效果。所述方法通过整合向量数据库、嵌入模型和上下文学习技术,实现了对用户意图的实时理解、个性化回复以及快速适应业务变化的能力。该方法的核心优势在于其精准的用户需求分析、个性化服务提供以及高效的知识检索系统。通过分析用户行为和对话记录,本发明能够提供符合用户偏好的产品推荐和营销策略。此外,本发明还具备实时话术更新能力,确保信息的时效性和准确性;自动化订单信息抽取技术提高了信息处理效率,减少了人工操作的时间和成本。本发明不仅提高了营销效率,还增强了用户与客服之间的互动体验,为企业在竞争激烈的市场中提供了竞争优势。
-
公开(公告)号:CN117609699A
公开(公告)日:2024-02-27
申请号:CN202311643046.0
申请日:2023-12-04
Applicant: 南京理工大学
IPC: G06F18/10 , G06F18/24 , G06F18/214 , G06F40/284 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于提示微调的事件检测方法,包括:文本预处理;构建分类模型,并训练分类器;构建可学习的提示,引入一个BART编码器,将原始的离散提示信息转换成可学习的提示;构建生成模型,并训练生成器;联合训练,在训练阶段同时训练分类模型和生成模型,并通过动态调整损失权重进一步优化上述模型;使用训练完成的语言模型,对输入的文本进行检测,完成基于提示微调的事件检测。本发明结合了当前自然语言处理领域流行的提示学习范式,解决了传统事件检测任务中无法充分利用事件类型标签信息这一问题,并在相关数据集上取得了不错的表现,能够有效地抽取出文本中包含的事件和对应的触发词,具有一定的实际应用价值。
-
公开(公告)号:CN116029298A
公开(公告)日:2023-04-28
申请号:CN202310117049.4
申请日:2023-02-14
IPC: G06F40/295 , G06F40/216 , G06F16/33
Abstract: 本说明书公开了一种模型训练的方法、装置、设备及存储介质,可以先通过预测模型对各待标记样本集进行标记,并将标记结果为指定标记结果的各待标记样本集中的各待标记样本筛选出来,交由标记人员进行人工标记。这里的指定标记结果是指预先设置的预测模型容易出现识别错误的一类样本的标记结果。从而可以根据标记人员针对预测模型容易出现识别错误的一类样本的标记结果,对用于训练预测模型的待标记样本集进行拆分、重新聚合得到新的样本集,并使用新的样本集对预测模型进行训练,进而可以在减少需要人工标记的样本的数量以降低预测模型的训练成本的同时,提升预测模型的训练效果。
-
公开(公告)号:CN113515619A
公开(公告)日:2021-10-19
申请号:CN202110783307.3
申请日:2021-07-12
Applicant: 南京理工大学 , 感易智能科技(南京)有限公司
IPC: G06F16/335 , G06F16/215 , G06F16/9535 , G06F16/9536 , G06F40/242 , G06F40/284 , G06F40/289 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明涉及一种基于显著性信息门控机制的关键词生成方法,属于关键词生成领域。该系统使用预训练模型BERT作为编码器来获取源文档的上下文语义信息,在Transformer解码器端增加显著性门控机制,构建Saliency‑Transformer解码器模块,显式地管理从编码器到解码器的信息流,减少源文档中低语义词的权重,降低了它们在最终关键词生成中出现的可能性,从而提升关键词生成的准确性和质量。本发明通过自然语言处理和深度学习相关技术创新关键词生成方法,为文本生成领域提供技术支撑,对数据挖掘领域来说,具有一定的商业工业应用价值。
-
公开(公告)号:CN113449108A
公开(公告)日:2021-09-28
申请号:CN202110734921.0
申请日:2021-06-30
Applicant: 南京理工大学
IPC: G06F16/35 , G06F16/33 , G06F40/194 , G06F40/242 , G06F40/289 , G06K9/62 , G06Q40/00
Abstract: 一种基于层级化聚类的金融新闻流突发检测方法,包括:文本的预处理;抽取关键词并构建关键词共现图;采用二分K‑Means算法对关键词聚类,将关键词共现图划分为若干子图,每个子图中的关键词为一个金融主题;通过相似度计算识别每篇金融新闻所属金融主题;构建以每篇金融新闻为节点的无向图,采用二分K‑Means算法对金融新闻聚类,将金融新闻节点无向图划分为若干子图,每个子图中的金融新闻为一个金融事件;通过相似度计算生成故事链;突发事件检测。本发明通过自然语言处理及图论相关技术,对金融新闻进行事件聚类,解决了传统金融突发事件不能将同一事件相关新闻综合考虑的问题,实现了高效准确地检测出金融突发事件,具有一定的工业价值。
-
-
-
-
-
-
-
-
-