论坛贴内容抽取方法和装置

    公开(公告)号:CN103116591A

    公开(公告)日:2013-05-22

    申请号:CN201110366367.1

    申请日:2011-11-17

    Abstract: 本发明提供了一种论坛贴内容抽取方法,包括:由论坛贴的源代码生成HTML标签树;将HTML标签树中的文本率大于第一阈值的标签子树合并得到一颗最大候选子树;从最大候选子树中筛选得到所有具有相似结构的节点簇;从节点簇中筛选文本率大于第二阈值的节点簇;抽取筛选的节点簇中的文本内容。本发明还提供了一种论坛贴内容抽取装置。本发明实现了论坛贴内容的自动抽取。

    Valactamide A及非对映异构体的合成方法

    公开(公告)号:CN115304659B

    公开(公告)日:2025-03-21

    申请号:CN202210794664.4

    申请日:2022-07-07

    Abstract: 本申请属于化学合成技术领域,尤其涉及一种Valactamide A及非对映异构体的合成方法。包括步骤:制备化合物16和化合物ent‑16;对所述化合物16或所述化合物ent‑16依次进行氧化处理,通过经典的Evans辅基控制的不对称甲基化反应引入两个手性甲基,然后与磷叶立德试剂进行维蒂希反应,与L‑缬氨酸叔丁酯三氟乙酸盐进行活化处理,脱除保护基团后,与含有保护基团的L‑异亮氨酸进行偶联反应,进行关环,得到Valactamide A或其非对映异构体。本申请完成了对Valactamide A及非对映异构体的首次全合成和结构鉴定,为其绝对立体化学结构的鉴定和生物活性的研究奠定了基础。

    类风湿性关节炎易感位点及其应用

    公开(公告)号:CN110459312B

    公开(公告)日:2024-01-12

    申请号:CN201810427418.9

    申请日:2018-05-07

    Abstract: 本发明涉及医学诊断领域,具体涉及一种类风湿关节炎易感位点及其应用。本发明发现的类风湿性关节炎易感位点,包括选自下列的至少之一:位于6号染色体上32609965位置的C突变为A;和/或位于6号染色体上32551894位置的C突变为T。利用本发明发现的SNP位点,可以实现对于类风湿性关节炎的快速预测,而且在未表现出类风湿性关节炎的症状时,或者在刚出生时即可进行患病风险的预测,准确又高效。

    Valactamide A及非对映异构体的合成方法

    公开(公告)号:CN115304659A

    公开(公告)日:2022-11-08

    申请号:CN202210794664.4

    申请日:2022-07-07

    Abstract: 本申请属于化学合成技术领域,尤其涉及一种Valactamide A及非对映异构体的合成方法。包括步骤:制备化合物16和化合物ent‑16;对所述化合物16或所述化合物ent‑16依次进行氧化处理,通过经典的Evans辅基控制的不对称甲基化反应引入两个手性甲基,然后与磷叶立德试剂进行维蒂希反应,与L‑缬氨酸叔丁酯三氟乙酸盐进行活化处理,脱除保护基团后,与含有保护基团的L‑异亮氨酸进行偶联反应,进行关环,得到Valactamide A或其非对映异构体。本申请完成了对Valactamide A及非对映异构体的首次全合成和结构鉴定,为其绝对立体化学结构的鉴定和生物活性的研究奠定了基础。

    一种混源软件中开源成分检测的方法和系统

    公开(公告)号:CN113721978A

    公开(公告)日:2021-11-30

    申请号:CN202111286072.3

    申请日:2021-11-02

    Applicant: 北京大学

    Inventor: 张涛 陈钟

    Abstract: 本申请公开的实施例提供了一种混源软件中开源成分检测的方法和系统。其中,该方法包括:获取目标混源软件中的源码文件,即获取第一源码文件,以及对所述第一源码文件分类及执行相应的同源分析;其中,对于所述第一源码文件中大小超过第一阈值的源码文件,基于Simhash算法对其进行同源分析;对于所述第一源码文件中大小不超过第一阈值的源码文件,基于Minhash算法对其进行同源分析。较之现有技术,上述方案能够均衡混源软件开源成分检测的效率需求和精确性间的矛盾,在保证检测效率的前提下获得可接受的开源成分检测结果。

    一种文本排序方法及设备

    公开(公告)号:CN104572789B

    公开(公告)日:2018-05-01

    申请号:CN201310522789.2

    申请日:2013-10-29

    Abstract: 本发明提供了一种文本排序方法及设备,该方法包括:对每一个待排序文本,获取检索请求query中的每一个子词相对于在所述query与该子词相邻的子词的文本偏移差dpage,根据获取到的文本偏移差dpage确定所述query在该待排序文本中的子词偏离系数offset_ratio;根据各个待排序文本对应的子词偏离系数offset_ratio对各个待排序文本进行排序。本发明中,由于query中相邻的子词term在文本中位置关系更能够反映query与该文本的相关性,则根据子词偏离系数做出的排名能够将更为相关的网页优先推荐给用户,从而提升用户体验。

    一种站点语种分类的方法和系统

    公开(公告)号:CN104572767B

    公开(公告)日:2017-11-10

    申请号:CN201310514221.6

    申请日:2013-10-25

    Abstract: 本发明提供一种站点语种分类的方法和系统,包括:对于每一种语种,利用该语种的预设搜索词进行搜索,得到对应于该语种的所有页面链接;根据所述所有页面链接的链接地址,将所有页面链接分类,每一类对应一个站点;从每一个站点对应的分类中抽样部分页面链接,组成样本集合,根据样本集合中页面链接的数量和语种信息,生成对应于该语种的训练模型;将需检测的网页资源的页面链接集合按照站点进行分类,得到各个需检测的站点;根据所述语种训练模型,得到每一个所述需检测的站点的语种预测值。本发明基于网页单页面语种识别技术,给出了一种合理高效的站点语种分类方法,系统架构简单易维护,满足了现代搜索引擎技术的要求。

    可资源化的挥发性有机尾气处理方法及撬装移动装置

    公开(公告)号:CN103463937A

    公开(公告)日:2013-12-25

    申请号:CN201310319801.X

    申请日:2013-07-25

    Abstract: 本发明涉及可资源化的挥发性有机尾气处理方法;含VOCs的尾气首先进入气液分离器,分离后气相由风机输出端进入喷淋室处理,去除污染物的气体从喷淋室顶排出到吸附室进一步净化后排放到大气,喷淋剂富液从喷淋室下排出,在热交换器换热后进入到分离室,分离室顶部放出有机污染物混合气相,气相经过冷凝器将携带一部分的喷淋剂冷凝后返回分离室,剩余的未凝气相由深冷器冷凝后回收到污染物储存罐,深冷器后设有真空调节系统,分离室下部连接加热釜,热分离后的喷淋剂贫液经热交换器冷却后由泵输送到喷淋室进行循环利用。本发明适用性广泛,可以处理高低浓度不同污染程度场所的VOCs尾气,另外装置的撬装式结构可根据污染现场需要而移动。

Patent Agency Ranking