-
公开(公告)号:CN120012941A
公开(公告)日:2025-05-16
申请号:CN202510457743.X
申请日:2025-04-14
Applicant: 西南科技大学 , 西南科大四川天府新区创新研究院
IPC: G06N5/04 , G06F16/9535
Abstract: 本申请公开了一种企业政策推荐方法、装置、设备及介质,包括:获取用户的待查询数据并基于所述待查询数据设定至少一个企业标签;将所述企业标签向量化得到企业标签向量,基于预设向量数据库确定所述企业标签向量的相关向量;将所述企业标签向量和所述企业标签向量的相关向量输入大语言模型,得到生成句子;基于所述生成句子得到所述用户的企业政策推荐信息。本申请可以解决传统推荐方法对于新用户难以提供准确推荐的技术问题。
-
公开(公告)号:CN118193515A
公开(公告)日:2024-06-14
申请号:CN202410589297.3
申请日:2024-05-13
IPC: G06F16/215 , G06F16/28 , G06F16/29 , G06F18/2113 , G06F18/213 , G06F18/23213 , G06F18/27
Abstract: 本发明公开了一种统一社会信用代码从业人数数据补全方法与系统,涉及文件系统管理及自然语言处理领域,用以高效、准确补全统一社会信用代码从业人数数据。本发明采集统一社会信用代码数据,经预处理后,基于注册地址进行数据的聚类。将每一簇类的机构数据集进行特征提取和特征编码等操作,再根据夏普利值模型进行特征筛选,得到每一簇类特定的机构数据特征集。再分别利用XGBoost算法训练出对应不同地理空间的目标从业人数预测模型,组合构建出复合从业人数预测模型,以自适应地对不同地理空间的机构进行从业人数预测。最后将预测的从业人数信息进行后处理操作。本发明可以提高模型的性能、降低特征维度,并增强模型的可解释性。
-
公开(公告)号:CN117592622A
公开(公告)日:2024-02-23
申请号:CN202410079202.3
申请日:2024-01-19
Applicant: 西南科技大学 , 西南科大四川天府新区创新研究院
IPC: G06Q10/04 , G06Q10/10 , G06F18/26 , G06F18/213 , G06N5/025
Abstract: 本发明公开了一种面向机器人流程自动化的行为序列预测方法及系统,方法包括:采集机器人流程自动化的行为序列数据;利用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口;根据行为序列数据的特征类型划分任务并构建多任务网络模型;对采集的数据进行处理并转换为事务型数据,利用频繁项集挖掘算法从事务型数据中挖掘有效的强关联规则;实时记录用户当前的行为序列,并利用多任务网络模型滚动预测用户后续的行为序列数据;对预测的行为序列数据进行独热解码,基于有效的强关联规则集对预测的行为序列数据进行后处理。通过本发明提高了业务流程的自动化程度,降低业务流程的人工干预,提升业务流程的执行效果。
-
公开(公告)号:CN117216688A
公开(公告)日:2023-12-12
申请号:CN202311465129.5
申请日:2023-11-07
IPC: G06F18/243 , G06N3/088 , G06N3/04 , G06Q50/26
Abstract: 本发明公开了一种基于层次标签树与神经网络的企业行业识别方法与系统,所述方法包括:将国民经济行业分类数据,构建为层次标签树;根据层次标签树,构建用于神经网络模型训练的正例数据与反例数据;根据正例数据与反例数据和企业经营范围数据,计算层次标签树的路径得分,对企业进行行业识别。本发明采用了基于层次标签树与神经网络的企业行业识别方法,可以高精度的对企业进行行业识别,以便于后续对企业数据进行更为详尽的分析。
-
公开(公告)号:CN116050419A
公开(公告)日:2023-05-02
申请号:CN202310323198.6
申请日:2023-03-30
Applicant: 西南科技大学
IPC: G06F40/295 , G06F40/242 , G06F40/253 , G06F40/30 , G06F16/35 , G06F18/22 , G06N5/025 , G06N3/045 , G06N3/048 , G06N3/088 , G06N3/0895
Abstract: 本发明涉及知识实体识别技术领域,公开了一种面向科学文献知识实体的无监督识别方法及系统,该方法,利用无标注的科学文献文本数据对全词遮盖模型进行预训练,通过结合对比学习和聚类的方法构建知识实体代表词及其类别的集合作为评判依据,然后利用预训练后的全词遮盖模型对科学文献文本中的词语进行预测,通过计算预测出的词语与代表词之间的相似度来判断科学文献文本中的词语是否为知识实体,并确定科学文献文本中的词语的类别。本发明解决了现有技术存在的针对知识实体的识别时难以识别缺乏公开数据集的科技文本数据资源等问题。
-
公开(公告)号:CN115775601A
公开(公告)日:2023-03-10
申请号:CN202211471391.6
申请日:2022-11-23
Applicant: 西南科技大学
IPC: G16C60/00 , G06F18/23213 , G06F18/2433
Abstract: 本发明公开了一种材料力热试验的异常数据监测方法及系统,该方法先计算试验数据之间的紧密度,选取密度最大的采样点作为初始聚类中心,再对试验数据进行聚类,通过聚类结果计算所有采样点的异常度值,最后基于聚类后的异常值,找出异常试验数据。采用无监督聚类的方法,不需要对试验数据进行标注训练,操作简便、省时;通过聚类联系采样的不同维度,来判断试验数据之间的相关性;在聚类过程中设置异常度值可以有效的找到异常试验数据。解决了目前材料力热试验的异常数据监测效率不高的技术问题。
-
公开(公告)号:CN106484828A
公开(公告)日:2017-03-08
申请号:CN201610864062.6
申请日:2016-09-29
Applicant: 西南科技大学
IPC: G06F17/30
Abstract: 本发明公开了一种分布式互联网数据快速采集系统,包括种子网站设置节点,超链接采集层,实时队列,网页下载与解析层,网页数据存储层五个层;种子网站设置节点用于设置存储数据源的各项参数及抽取规则;超链接采集层用于对数据源的超链接列表网页进行请求并提取目标网页的超链接;实时队列用于存取超链接采集层提取的URL超链接及其对应的抽取规则及已访问过的URL超链接;网页下载与解析层用于请求并解析实时队列中未访问过的URL超链接并格式化提取特定数据;网页数据存储层用于存储网页下载与解析层格式化抽取的目标数据。本发明采用分布式分层协作方式进行数据采集,能够应对数据采集量大、数据来源多、实时性要求高的系统应用需求。
-
公开(公告)号:CN118690210B
公开(公告)日:2024-10-29
申请号:CN202411187354.1
申请日:2024-08-28
IPC: G06F18/22 , G06F18/214 , G06N3/0442 , G06F16/332
Abstract: 本发明提供了一种基于证据理论的产业链校正方法、系统和设备,方法包括:根据已有产业链信息,获取具有上下游关系的产业链三元组;使用外部数据集训练文本生成模型,生成若干个与产业链三元组相关的生成文本;搭建文本相似度模型,并使用公开数据集训练文本相似度模型;从搜索引擎逐一检索生成文本,利用文本相似度模型计算生成文本与检索文本的相似度,将最高相似度值作为该生成文本的置信系数;应用证据理论构建信任分配函数,使用置信系数计算信任函数值,根据信任函数值对产品三元组进行划分,并基于划分结果校正产业链。本发明能够根据互联网的相关数据校正现有产业链,减少单一数据源、人为因素和信息滞后导致的误差,提高产业链的精准度。
-
公开(公告)号:CN118412066B
公开(公告)日:2024-10-18
申请号:CN202410599137.7
申请日:2024-05-15
Applicant: 西南科技大学 , 西南科大四川天府新区创新研究院
Abstract: 本申请公开了一种有机分子虚拟筛选库构建方法、装置、设备及介质,涉及虚拟数据库构建技术领域,解决了现有虚拟筛选库对新分子的发现效率较低的技术问题。所述方法包括:获取并基于SMILES已知分子片段集,将分子片段中的活性位点采用R占位符进行标记,生成多个带有R标记的分子片段mol文件;再生成多个基团的SMILES字符串和多个待组装骨架;将各基团的SMILES字符串、各待组装骨架以及预设接入位点数量输入并发执行器中进行组装遍历循环,获得第一组合分子集;基于InChI标识符和第一组合分子的化学相似性指标,筛选获得第二组合分子,并构建获得有机分子虚拟筛选库。
-
公开(公告)号:CN118690210A
公开(公告)日:2024-09-24
申请号:CN202411187354.1
申请日:2024-08-28
IPC: G06F18/22 , G06F18/214 , G06N3/0442 , G06F16/332
Abstract: 本发明提供了一种基于证据理论的产业链校正方法、系统和设备,方法包括:根据已有产业链信息,获取具有上下游关系的产业链三元组;使用外部数据集训练文本生成模型,生成若干个与产业链三元组相关的生成文本;搭建文本相似度模型,并使用公开数据集训练文本相似度模型;从搜索引擎逐一检索生成文本,利用文本相似度模型计算生成文本与检索文本的相似度,将最高相似度值作为该生成文本的置信系数;应用证据理论构建信任分配函数,使用置信系数计算信任函数值,根据信任函数值对产品三元组进行划分,并基于划分结果校正产业链。本发明能够根据互联网的相关数据校正现有产业链,减少单一数据源、人为因素和信息滞后导致的误差,提高产业链的精准度。
-
-
-
-
-
-
-
-
-