一种面向词典集的复杂从属结构网页信息抽取方法及系统

    公开(公告)号:CN108416048B

    公开(公告)日:2021-09-21

    申请号:CN201810220100.3

    申请日:2018-03-16

    Applicant: 安徽大学

    Abstract: 本发明公开了一种面向词典集的复杂从属结构网页信息抽取方法:根据页面标识判断页面是否完整并返回目标完整html页面;根据语义相关性将预设语种主标题挂接至定义的规则表示词典集中对应的规则表示中,生成全表示词典集;从复杂从属结构页面下提取全文本内容并最终形成目标文本内容,并用规则表示词典集中的规则表示替换全表示词典集分割目标文本内容得到包含每个规则表示子集的全分割复杂从属文本集;合并全分割复杂从属文本集中相同规则表示的子集内容并将其作为每个规则表示的全内容;基于新发布页面重新抽取主标题内容动态扩充全表示词典集。本发明解决了传统的网页的信息解析方法中不同站点之间内容主题相同但页面结构不统一而导致的解析困难的问题。

    一种基于神经机器翻译技术的局部引文推荐方法及系统

    公开(公告)号:CN109145190B

    公开(公告)日:2021-07-30

    申请号:CN201810994562.0

    申请日:2018-08-27

    Applicant: 安徽大学

    Abstract: 本发明公开基于神经机器翻译技术的局部引文推荐方法及系统,对原始数据集进行引文提取、词形还原、词频统计数据清洗操作,得到引文上下文与被引文章标题的平行语料并构建初始待被引文章列表库;通过词向量模型中的跳字模型结合负采样的方法将引文上下文与被引文章标题中出现的词嵌入到低维语义空间得到词向量,构建一个带有注意力机制的双向门控循环单元的编码器和门控循环单元的解码器框架,将平行语料中的引文上下文通过词向量模型转换为词向量后作为模型的输入,被引文章标题作为输出来训练模型;将编码器‑解码器框架输出的种子标题与待被引文章列表中的所有文章标题逐条进行余弦相似度计算;依据文章年份,选取符合要求的文章作为推荐列表。

    一种面向词典集的复杂从属结构网页信息抽取方法及系统

    公开(公告)号:CN108416048A

    公开(公告)日:2018-08-17

    申请号:CN201810220100.3

    申请日:2018-03-16

    Applicant: 安徽大学

    Abstract: 本发明公开了一种面向词典集的复杂从属结构网页信息抽取方法:根据页面标识判断页面是否完整并返回目标完整html页面;根据语义相关性将预设语种主标题挂接至定义的规则表示词典集中对应的规则表示中,生成全表示词典集;从复杂从属结构页面下提取全文本内容并最终形成目标文本内容,并用规则表示词典集中的规则表示替换全表示词典集分割目标文本内容得到包含每个规则表示子集的全分割复杂从属文本集;合并全分割复杂从属文本集中相同规则表示的子集内容并将其作为每个规则表示的全内容;基于新发布页面重新抽取主标题内容动态扩充全表示词典集。本发明解决了传统的网页的信息解析方法中不同站点之间内容主题相同但页面结构不统一而导致的解析困难的问题。

    基于UCT算法的点格棋游戏系统

    公开(公告)号:CN105727550A

    公开(公告)日:2016-07-06

    申请号:CN201610060615.2

    申请日:2016-01-27

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于UCT算法的点格棋游戏系统,包括:外部显示装置、输入装置和内部处理单元;外部显示装置,用于与内部处理单元建立通讯,显示棋盘信息和对弈过程;输入装置,用于用户设置参数和策略选择,并与内部处理单元建立通讯,进行点格棋游戏,或者选择进行自动测试;内部处理单元,采用智能的博弈技术实现游戏系统的智能化,实现智能博弈技术之间自动对弈以及人与智能博弈技术之间的对弈。本发明采用UCT算法作为点格棋游戏系统的博弈技术,解决了原有算法的估值问题,在对所有的可能下棋选择进行全局搜索的基础上根据搜索结果选择好的节点进行更多次的局部搜索,可以搜索结果向着好的方向发展。并且可以同时利用多线程进行多次的模拟,充分利用了电脑的硬件资源。

    一种芡实皮渣多糖的提取方法
    9.
    发明公开

    公开(公告)号:CN118546268A

    公开(公告)日:2024-08-27

    申请号:CN202410748077.0

    申请日:2024-06-11

    Applicant: 安徽大学

    Abstract: 本发明提供了一种芡实皮渣多糖的提取方法,包括以下步骤:将新鲜的芡实皮渣经过冻干、粉碎,与三相溶剂和萃取剂充分混合,超声提取、离心后,取水相进行醇沉,再进行离心、取沉淀相纯水溶解、纯水透析、冻干后,得到芡实皮渣多糖粉末;所述三相溶剂为低共熔溶剂,所述萃取剂为硫酸铵溶液。本发明通过低共熔溶剂‑三相分离法提取芡实皮渣多糖,与传统水提醇沉法相比较,提取率更高,更加快速高效;与传统三相分离法相比较,更加安全绿色。

    基于UCT算法的点格棋游戏系统

    公开(公告)号:CN105727550B

    公开(公告)日:2019-10-25

    申请号:CN201610060615.2

    申请日:2016-01-27

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于UCT算法的点格棋游戏系统,包括:外部显示装置、输入装置和内部处理单元;外部显示装置,用于与内部处理单元建立通讯,显示棋盘信息和对弈过程;输入装置,用于用户设置参数和策略选择,并与内部处理单元建立通讯,进行点格棋游戏,或者选择进行自动测试;内部处理单元,采用智能的博弈技术实现游戏系统的智能化,实现智能博弈技术之间自动对弈以及人与智能博弈技术之间的对弈。本发明采用UCT算法作为点格棋游戏系统的博弈技术,解决了原有算法的估值问题,在对所有的可能下棋选择进行全局搜索的基础上根据搜索结果选择好的节点进行更多次的局部搜索,可以搜索结果向着好的方向发展。并且可以同时利用多线程进行多次的模拟,充分利用了电脑的硬件资源。

Patent Agency Ranking