-
公开(公告)号:CN112949259A
公开(公告)日:2021-06-11
申请号:CN202110316129.3
申请日:2021-03-24
Applicant: 北京林业大学 , 广州摩翼信息科技有限公司
IPC: G06F40/143 , G06F40/194
Abstract: 本发明提出一种自适应的基于词汇文本难度的生词标注方法及系统,所述方法包括以下步骤:步骤一、进行文本词汇难度评估,计算词汇w在包含N个词语的文本text中出现n次的α概率分位数;步骤二、进行词表对比,确定文本text中不在词库Lex的超纲词汇,并将这些词汇按照难度排序后存储;步骤三、进行生词标注,计算基于词汇文本难度词汇列表的累积词汇量,并对超过难度要求的生词进行标注;步骤四、进行文本难度评估,并给出文本难度提示信息。本发明既可以根据学习者所处的学习阶段,也可以根据文本的具体用词情况和学习者的真实水平,自动实现阅读文本生词的自动标注。
-
公开(公告)号:CN114547281B
公开(公告)日:2024-07-05
申请号:CN202210169435.3
申请日:2022-02-23
Applicant: 北京林业大学 , 广州摩翼信息科技有限公司
IPC: G06F16/335 , G06F16/33 , G06F40/253 , G06F40/289
Abstract: 本发明涉及一种基于词汇和语法的英文文本筛选方法及系统,其方法包括:步骤S1:用户登录文本筛选系统,选择文本筛选标准,文本筛选标准包括:文本筛选系统预定义的系统标准,用户定义的用户标准,以及由文本筛选系统基于用户上传的文本所定义的综合标准;步骤S2:用户输入待筛选本文,基于文本筛选标准进行筛选,获得筛选结果。本发明提供的方法,具有简单、高效以及筛选结果更为准确的特点,实现了针对不同学习阶段学习者的适合英语教学文本的筛选,极大程度的降低了人工劳力的投入。
-
公开(公告)号:CN114547281A
公开(公告)日:2022-05-27
申请号:CN202210169435.3
申请日:2022-02-23
Applicant: 北京林业大学 , 广州摩翼信息科技有限公司
IPC: G06F16/335 , G06F16/33 , G06F40/253 , G06F40/289
Abstract: 本发明涉及一种基于词汇和语法的英文文本筛选方法及系统,其方法包括:步骤S1:用户登录文本筛选系统,选择文本筛选标准,文本筛选标准包括:文本筛选系统预定义的系统标准,用户定义的用户标准,以及由文本筛选系统基于用户上传的文本所定义的综合标准;步骤S2:用户输入待筛选本文,基于文本筛选标准进行筛选,获得筛选结果。本发明提供的方法,具有简单、高效以及筛选结果更为准确的特点,实现了针对不同学习阶段学习者的适合英语教学文本的筛选,极大程度的降低了人工劳力的投入。
-
公开(公告)号:CN116702722A
公开(公告)日:2023-09-05
申请号:CN202310698174.9
申请日:2023-06-13
Applicant: 北京林业大学 , 广州摩翼信息科技有限公司
IPC: G06F40/169 , G06F40/237 , G06F40/194
Abstract: 本发明涉及一种基于句法与语义分析的生词自动标注方法及系统,其方法包括:S1:选择待标注生词以及生词文本句;步骤S2:根据待标注生词的词性筛选目标词条,若有多条目标词条,转步骤S3,若无目标词条,返回“无对应词性词条”,转步骤S4,若只有一条目标词条,则确定待标注生词的词义,转步骤S5;S3:计算生词文本句与每条目标词条相似性并以降序排序,得到相似性列表,如果相似性列表的最大值与次大值的差值不大于K,提示“存在多条可能的词条”,转步骤S4,否则根据相似性列表最大值对应词条确定待标注生词的词义并转步骤S5;S4:人工确定待标注生词词义;S5:根据待标注生词词义,对其进行标注。本发明提供方法实现了英语词汇的自动化标注。
-
公开(公告)号:CN112949259B
公开(公告)日:2023-08-08
申请号:CN202110316129.3
申请日:2021-03-24
Applicant: 北京林业大学 , 广州摩翼信息科技有限公司
IPC: G06F40/143 , G06F40/194
Abstract: 本发明提出一种自适应的基于词汇文本难度的生词标注方法及系统,所述方法包括以下步骤:步骤一、进行文本词汇难度评估,计算词汇w在包含N个词语的文本text中出现n次的α概率分位数;步骤二、进行词表对比,确定文本text中不在词库Lex的超纲词汇,并将这些词汇按照难度排序后存储;步骤三、进行生词标注,计算基于词汇文本难度词汇列表的累积词汇量,并对超过难度要求的生词进行标注;步骤四、进行文本难度评估,并给出文本难度提示信息。本发明既可以根据学习者所处的学习阶段,也可以根据文本的具体用词情况和学习者的真实水平,自动实现阅读文本生词的自动标注。
-
公开(公告)号:CN114547278A
公开(公告)日:2022-05-27
申请号:CN202210150091.1
申请日:2022-02-18
Applicant: 广州摩翼信息科技有限公司
IPC: G06F16/335 , G06F16/332 , G06F16/36 , G06Q50/20
Abstract: 本发明涉及一种英语学习辅助方法及系统,其方法包括:包括:S1:根据现有词典,构建词汇分级表;S2:根据英语教学大纲,构建语法分级表;S3:用户上传作文;根据所述作文,为所述用户创建用户词汇表,并结合所述词汇分级表,确定用户词汇等级;S4:根据所述作文,为所述用户创建用户语法表,结合所述语法分级表,确定用户语法等级;S5:根据所述用户词汇等级和所述用户语法等级,为所述用户推荐阅读内容。本发明提供的方法,可以更加全面、准确地评估用户的真实英语水平。
-
公开(公告)号:CN113065334A
公开(公告)日:2021-07-02
申请号:CN202110316123.6
申请日:2021-03-24
Applicant: 广州摩翼信息科技有限公司
IPC: G06F40/216 , G06F40/284 , G06Q10/10 , G06Q50/20
Abstract: 本发明提出一种基于阅读理解练习的词汇水平测试处理方法及系统,包括如下步骤:阅读文本预处理步骤:服务端针对每一篇阅读理解文本text,计算文本中各个词语w在当前文本中的难度;然后,对文本中各单词按照难度由大到小的顺序排序并统计其出现次数;为用户提供测试内容并进行难词累计步骤;词汇认知水平评估步骤:在用户积累够预定规模的阅读理解题目后,将其所有遇到的难词以其在词汇词频表WordFreq中的词频百分比为系数进行累加平均,获得平均词频百分比信息,再从WordFreq中找到平均词频百分比相对应的词汇排位,进而确定该用户的词汇量;基于词汇评估的英文文本推荐步骤:根据用户的词汇量,服务端为其推荐相应的词汇学习和阅读文本,通过网络发送到用户的终端。
-
公开(公告)号:CN117036545A
公开(公告)日:2023-11-10
申请号:CN202310874063.9
申请日:2023-07-17
Applicant: 北京林业大学 , 广州翼渡科技有限公司
IPC: G06T11/60 , G06N3/0464 , G06N3/0442 , G06V10/80 , G06V10/764 , G06V10/774
Abstract: 本发明涉及一种基于图像场景特征的图像描述文本生成方法及系统,提取CNN获得图像的特征图,通过RPN提取特征图中的对象建议框;采用GRU二分结构的推理迭代预测和生成场景图;利用场景图中的对象即节点及其关系,通过CNN从图像中提取视觉特征和从场景图中提取以两个节点及其连接的边构成的三元组作为语义特征,得到视觉特征和语义特征;以Transformer为基础框架,引入片段级递归机制与相对位置编码,利用融合特征实现长依赖文本生成;对基于图像场景特征的图像描述文本生成网络进行训练,通过交叉熵函数计算输出长依赖描述文本与实际值之间的误差,得到图像描述文本生成网络;将待生成描述的图像输入图像描述文本生成网络生成多句连贯可读的故事性文字描述。
-
公开(公告)号:CN110795526A
公开(公告)日:2020-02-14
申请号:CN201911034594.7
申请日:2019-10-29
Applicant: 北京林业大学
IPC: G06F16/31 , G06F16/332
Abstract: 本发明提出一种用于检索系统的数学公式索引创建方法与系统,其能够通过公式解析、公式树节点合并、公式树节点重排、叶子节点符号替换、公式树字符串索引创建等几个步骤,实现对Latex数学公式的快速索引创建,解决了由于公式书写习惯差异、基本运算规律使用而导致的索引创建不唯一问题,能够为数学公式的精确检索提供准确、有效的倒排索引。该发明在计算机检索系统中对于数学知识检索、自动推理等方面具有重要的应用价值,提高了检索系统的检索效率。
-
公开(公告)号:CN106055667B
公开(公告)日:2019-06-04
申请号:CN201610390441.6
申请日:2016-06-06
Applicant: 北京林业大学
IPC: G06F16/958
Abstract: 本发明涉及一种基于文本‑标签密度的网页核心内容提取方法,其包括:网页源代码预处理、网页核心内容范围预估、核心内容边界确定和删除剩余标签四个阶段。网页源代码预处理阶段从原始网页文本中提取标题、摘要、描述等核心要素,并删除原始网页文本中与网页核心内容无关的标签,从而得到待处理文本;网页核心内容范围预估阶段,确定网页核心内容的大致范围;核心内容边界确定阶段分别确定网页正文核心内容精确的起止位置;删除剩余标签阶段取出核心内容部分,并删除多余标签,获得便于分析处理的网页核心内容。本发明无需解析网页文档的DOM结构,也不限定网页的主题和内容,处理过程具有线性复杂度,能够适用于各种网页核心内容提取、网页去噪等技术应用。
-
-
-
-
-
-
-
-
-