-
公开(公告)号:CN110263266A
公开(公告)日:2019-09-20
申请号:CN201910417546.X
申请日:2019-05-20
Applicant: 江苏大学
IPC: G06F16/955 , G06F16/953 , G06F16/21
Abstract: 本发明公开了一种基于微信小程序和爬虫的数据展示方法,通过爬虫框架Scrapy对各个网站进行爬取数据,将爬取的数据村存储到云服务器上的MongoDB数据库中,通过Python的Django框架编写后端代码来获取爬取到的数据,并提供接口给微信小程序来获取数据将其进行展示。本发明充分利用了微信小程序的无需安装、节省内存的优点,运用了爬虫技术来爬取数据,解决以往安装App才能浏览信息的问题。
-
公开(公告)号:CN109801681A
公开(公告)日:2019-05-24
申请号:CN201811515699.X
申请日:2018-12-11
IPC: G16B40/00
Abstract: 本发明公开了一种基于改进的模糊聚类算法的SNP选择方法,包括:获取SNP数据集;对获取到的SNP数据进行预处理,包括数据的清洗和重新编码;对预处理后的数据基于假设性检验进行初步筛选;对初筛过的数据,分别计算每个SNP的重要程度;利用改进的模糊聚类算法对SNP进行聚类;从聚类得到的每个簇中根据对称的不平衡性原则进一步筛选,构造SNP子集。本发明针对SNP数据,在考虑单个SNP对分类结果的影响的同时,也兼顾了局部区域SNP之间的相互关联性,在对数据实现降维的同时,充分挖掘了SNP内部的信息。使用该方法构造出来的SNP子集,相比于其他选择方法而言具有更好的分类效果,可应用于SNP数据的选择中。
-
公开(公告)号:CN109684646A
公开(公告)日:2019-04-26
申请号:CN201910036276.8
申请日:2019-01-15
Applicant: 江苏大学
CPC classification number: G06F17/2775 , G06F17/277
Abstract: 本发明公开了一种基于话题影响力的微博话题情感分析方法,该方法包括以下步骤:采集微博用户个人信息数据及微博文本数据;对数据进行预处理;使用LDA模型进行主题聚类;选取话题的微博内容进行情感极性标注并训练生成SVM分类器;使用SVM分类器得到未标注文本的情感倾向性;计算微博用户影响力因子值及该微博与话题相似度,结合微博情感极性和话题影响力因子计算整个话题的情感值,并以此对话题进行排序,为舆情分析提供参考。本发明能及时发现微博文本的话题中可能突发的舆情事件及热点话题,并根据话题影响力对话题舆情度进行排序,可应用于网络舆情监管和突发舆情事件的监测,解决目前舆情系统监管不及时性和盲目性问题。
-
公开(公告)号:CN107862617A
公开(公告)日:2018-03-30
申请号:CN201710981630.5
申请日:2017-10-20
Applicant: 江苏大学 , 无锡恒创医信科技发展有限公司
CPC classification number: G06Q50/01 , G06K9/6256
Abstract: 本发明设计一种基于用户综合相似度的微博社区划分方法,该方法的具体过程是:1、获取微博数据,对博文集合进行LDA主题模型训练,通过基于特征扩展的主题挖掘得到用户主题相似度矩阵;2、构造以用户为节点、用户关系为边的网络拓扑图,根据节点链接相关度和主题相似度得出用户综合相似度矩阵;3、首先为每一个节点分配唯一的标签,并评估节点的潜在影响力,然后以潜在影响力降序作为节点选择顺序,以节点综合相似度降序作为节点更新标签的顺序;最后进行标签的迭代更新。通过上述方式,本发明能够在考虑用户综合相似度的基础上,通过改进的标签传播算法对微博用户进行社区划分,对于网络舆情监测、商业用户挖掘等都具有较好的应用价值。
-
公开(公告)号:CN107169062A
公开(公告)日:2017-09-15
申请号:CN201710303440.8
申请日:2017-05-02
CPC classification number: G06F16/2465 , G06K9/6215
Abstract: 本发明公开了一种基于始末距离的时间序列符号聚合近似表示方法,包括:获取时间序列数据;对时间序列数据进行预处理操作;对预处理后的数据进行分段并获取各段的分段信息;计算段间的始末距离,并结合符号距离定义新的距离度量。本发明将时间序列数据的形态趋势和统计特征相结合,形成一种新的符号聚合近似表示方法,将时间序列数据从高维空间映射到低维空间。该方法不仅和原符号聚合近似表示方法一样满足下界定理,而且还能达到更优秀的分类效果,可应用于时间序列数据集的降维操作和距离度量中。
-
公开(公告)号:CN106971091A
公开(公告)日:2017-07-21
申请号:CN201710122492.5
申请日:2017-03-03
Applicant: 江苏大学
CPC classification number: G06K9/6269 , G06N3/006 , G16B25/00 , G16B40/00
Abstract: 本发明公开了一种基于确定性粒子群优化和支持向量机的肿瘤识别方法,包括对肿瘤基因表达谱数据的预处理,在训练集上运用分类信息指数方法对信息基因进行初选,然后使用两两冗余方法去除冗余基因得到备选基因库;在训练集上进一步使用分类信息指数方法获取关键的基因子集;在训练集上使用确定性粒子群优化算法对支持向量机的参数进行优化,然后对待识别的肿瘤基因表达谱数据进行识别。本发明在充分利用支持向量机适合于小样本数据识别的特点上,运用确定性粒子群优化对支持向量机进行优化,进一步提高支持向量机的性能,从而提高肿瘤识别准确性。
-
公开(公告)号:CN106548041A
公开(公告)日:2017-03-29
申请号:CN201611126799.4
申请日:2016-12-08
Applicant: 江苏大学
Abstract: 本发明公开了一种基于先验信息和并行二进制微粒群算法的肿瘤关键基因识别方法,包括肿瘤基因表达谱数据的预处理,在训练集上,通过自定义的准则函数,利用改进的Elbow方法确定最优基因聚类数目K;运用微粒群算法PSO优选K个最优聚类中心,并在训练集上用K-均值方法将肿瘤基因聚成K类;在训练集上,分别获取基因类别灵敏度GCS信息和基因调控GR信息;通过所得的K个基因簇为搜索空间,结合上述获得的两类先验信息,运用并行二进制微粒群算法BPSO识别出关键的肿瘤基因。与现有的肿瘤关键基因识别方法相比,本发明通过考虑两类先验约束降低了丢失与肿瘤类别相关的关键信息基因的概率,从而有助于提高后续的肿瘤识别。
-
公开(公告)号:CN105787663A
公开(公告)日:2016-07-20
申请号:CN201610105015.3
申请日:2016-02-26
Applicant: 江苏大学
IPC: G06Q10/06
CPC classification number: G06Q10/0639
Abstract: 本发明公开了一种基于数据挖掘技术的手持移动终端评估方法及系统,包括:对手持移动终端的评估指标进行相关性分析;对保留的手持移动终端的评估指标进行预处理操作,基于数值型属性离散化和属性化过后的手持移动终端的评估指标建立C4.5决策树,得到手持移动终端的关键评估指标。本发明通过相关性分析用户评估信息和反馈数据得到相关性强的手持移动终端的评估指标,使厂商可以删除评估信息反馈表中相关性强的手持移动终端的评估指标;本发明通过C4.5决策树使用户可以根据自身要求选择手持移动终端,使厂商可以提高市场竞争力并得到可靠意见;本发明可应用于用户选择适合自己的手持移动终端及厂商对自制的手持移动终端进行有价值的改进。
-
公开(公告)号:CN105651303A
公开(公告)日:2016-06-08
申请号:CN201610125931.3
申请日:2016-03-04
Applicant: 江苏大学 , 无锡恒创医信科技发展有限公司 , 镇江市卫生和计划生育委员会
CPC classification number: G01C22/006 , G01C23/00
Abstract: 本发明公开了一种基于三轴加速度传感器的计步系统及方法,属于电子应用技术领域,通过三轴加速度传感器采集三轴加速度,滤波降噪处理后求合加速度,获取每步时长内的合加速度最大值、最小值,以及其所对应的三轴加速度数据,以三轴加速度数据为三维向量坐标求这两个点的向量夹角,并与普通人行走单步时长与步幅相比较,根据偏差情况更改计步行走单步采集时长与步幅判定角度。通过单步时长内的合加速度峰值检测以及合加速度向量夹角检测的双重判定,不仅可以记录每一个单独不连续的步伐,而且在连续行走过程中可以适应不同行走者的特点调整参数,从而实现准确计步的效果。
-
公开(公告)号:CN105574213A
公开(公告)日:2016-05-11
申请号:CN201610109847.2
申请日:2016-02-26
Applicant: 江苏大学
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/30705
Abstract: 本发明公开了一种基于数据挖掘技术的微博推荐方法及装置,包括:将微博按照内容进行分类;获取预置时间段内选定用户对各类微博的点击量,并根据各类微博的该所述点击量,计算得到所述用户在时间段内的微博兴趣模型;按照所述最终微博兴趣模型聚类各用户,并根据所述最终微博兴趣模型确定向聚类后的各类用户推荐的微博候选集;将所述微博候选集中的微博推荐给所述用户。通过上述方法,本发明能够在错综复杂的微博信息中,对微博进行分类和排序,对用户进行聚类,根据分析结果,最后针对不同特征的用户群体推荐相应的感兴趣的微博。本发明可应用于微博网站及时准确的向用户推荐感兴趣的热门微博。
-
-
-
-
-
-
-
-
-