带有偏移映射的分词算法
    1.
    发明公开

    公开(公告)号:CN117396878A

    公开(公告)日:2024-01-12

    申请号:CN202280038305.4

    申请日:2022-05-05

    Abstract: 提供了一种计算机系统,包括处理器,该处理器耦合到存储指令的大容量存储设备,该指令在由处理器执行后,使处理器存储由多个字符组成的原始串,对原始串执行分词算法,并将原始串标记化以生成已处理串,该已处理串包括由空格分隔的多个词标记。该处理器还被配置为生成已处理串中的词标记内的位置与原始串中的对应位置之间的偏移映射,并将已处理串的一部分分类为目标。该处理器还被配置为使用偏移映射,在原始串中标识与目标对应的目标字符,并对原始串中的目标字符执行预定动作。

    提取企业项目信息
    2.
    发明公开

    公开(公告)号:CN107430607A

    公开(公告)日:2017-12-01

    申请号:CN201580077811.4

    申请日:2015-06-25

    Abstract: 提出了项目信息提取实现,其通常提取项目信息并为企业生成项目信息数据库。这是通过从与企业相关联的信息源中提取企业项目名称来实现的。与对应于每个提取出的企业项目名称的项目相关联的人员使用与企业相关联的信息源来被标识。此外,在项目过程期间所生成和收集到的项目相关的项可以在信息源中被标识。项目信息数据库接着针对企业来被生成。该数据库具有每个项目的条目,其包括与项目相关联的提取出的企业项目名称、被标识成与项目相关联的人员的列表以及项目相关的项或到其的链接。

Patent Agency Ranking