一种电子报纸文档制作的方法和设备

    公开(公告)号:CN101751379A

    公开(公告)日:2010-06-23

    申请号:CN200810227889.1

    申请日:2008-12-02

    Abstract: 本发明的实施例公开了一种电子报纸文档制作的方法和设备,属于数字内容出版领域,所制作的电子报纸文档能够适合于在有着不同显示环境的各种手持数字设备上进行阅读。本发明实施例提供的方法包括:按照版面定制需求采用可扩展标记语言XML组织XML版次目录文档与XML版面文档;对所述XML版次目录文档与XML版面文档进行数字内容信息提取;对所述提取的数字内容信息构建包含内容数据与呈现方法的电子报纸对象;对所述构建的电子报纸对象通过对象序列化的写入机制生成电子报纸目标文档。本发明实施例制作的电子报纸对象,可以独立于目标阅读设备,适合于在各种手持数字设备上进行阅读。

    标记语言文档的存储方法及装置和输出方法及装置

    公开(公告)号:CN100489840C

    公开(公告)日:2009-05-20

    申请号:CN200710187142.3

    申请日:2007-11-16

    Abstract: 本发明公开了一种标记语言文档的存储方法及装置和输出方法及装置,解决了低资源配置的信息设备处理大容量标记语言文档时,反应速度慢的问题。存储时:将标记语言文档分成至少两个数据块;在相邻两个数据块之间加入分块标志;将全局标记和未关闭的局部标记及其标记属性,保存到分块标志;将数据块和分块标志进行存储。输出时,顺序选取至少两个数据块;读取存储在分块标志中的标记和标记属性;将分块标志与紧邻其后的数据块一同解析,每个数据块形成一个标记语言文档树结构;将2个或以上的标记语言文档树结构合并为一个树结构并输出。该方案适合处理XML类别的文档以及流式的结构化文档,适用于资源有限而用户对反应速度又有较高要求的移动终端。

    数字内容的授权文件与移动终端绑定的方法

    公开(公告)号:CN100485707C

    公开(公告)日:2009-05-06

    申请号:CN200710187143.8

    申请日:2007-11-16

    Abstract: 本发明公开了一种数字内容的授权文件与移动终端绑定的方法,涉及对数字化内容的知识产权进行保护的领域,解决了现有移动终端获取数字内容的授权文件较困难的问题。该数字内容的授权文件与移动终端绑定的方法包括:计算机获取移动终端的特征信息的步骤;计算机获取数字内容的授权文件的步骤,所述授权文件包含所述特征信息;计算机将所述授权文件发送给移动终端的步骤。本发明通过计算机在网络中下载授权文件,不用加强移动终端的通讯能力,也不用人工获取授权文件,降低了移动终端的成本,还加快了移动终端获取数字内容的授权文件的速度。本发明主要用于各种移动设备获取授权文件的情况,例如:手机、手持阅读器、掌上电脑、多媒体播放器等。

    数字内容的授权文件与移动终端绑定的方法

    公开(公告)号:CN101159002A

    公开(公告)日:2008-04-09

    申请号:CN200710187143.8

    申请日:2007-11-16

    Abstract: 本发明公开了一种数字内容的授权文件与移动终端绑定的方法,涉及对数字化内容的知识产权进行保护的领域,解决了现有移动终端获取数字内容的授权文件较困难的问题。该数字内容的授权文件与移动终端绑定的方法包括:计算机获取移动终端的特征信息的步骤;计算机获取数字内容的授权文件的步骤,所述授权文件包含所述特征信息;计算机将所述授权文件发送给移动终端的步骤。本发明通过计算机在网络中下载授权文件,不用加强移动终端的通讯能力,也不用人工获取授权文件,降低了移动终端的成本,还加快了移动终端获取数字内容的授权文件的速度。本发明主要用于各种移动设备获取授权文件的情况,例如:手机、手持阅读器、掌上电脑、多媒体播放器等。

    一种自动绑定移动设备的数字作品下载方法

    公开(公告)号:CN1758258A

    公开(公告)日:2006-04-12

    申请号:CN200510123594.6

    申请日:2005-11-22

    CPC classification number: G06F21/10 G06F2221/0744

    Abstract: 本发明涉及一种自动绑定移动设备的数字作品下载方法,属于嵌入式系统及数字版权保护技术领域。现有技术中,移动设备下载有版权保护的数字内容,存在使用不方便、安全性差等问题。本发明所述的方法针对移动设备实现方便、安全的数字作品绑定方法,移动设备的存储空间包含了可执行程序和数字内容,移动设备连接网络终端后自动执行程序,并实现购买或借阅数字内容,下载有版权保护的数字内容到移动设备。采用本发明所述的方法,移动设备下载数字作品的过程既方便又安全,而且可以由通用的硬件接口实现。

    一种中文事件抽取方法
    27.
    发明授权

    公开(公告)号:CN107122416B

    公开(公告)日:2021-07-06

    申请号:CN201710209305.7

    申请日:2017-03-31

    Applicant: 北京大学

    Abstract: 本发明公开了一种中文事件抽取方法。本方法为:1)对待抽取的中文文本进行实体识别,将识别出来的实体作为事件元素的候选词;对该中文文本逐字进行标注,然后根据标注结果,结合标注模式,识别该中文文本中的事件触发词以及该中文文本所描述的事件类型;2)将该中文文本、事件元素的候选词、事件触发词以及事件类型输入到分类模型中,判断每一所述候选词是否为真实的事件元素;3)根据上述得到的事件元素、事件触发词及事件类型,得到完整的事件结构,完成事件抽取。本发明解决了中文事件抽取中事件触发词和文本中的词语不完全匹配的问题,并提高了中文事件抽取的准确性。

    一种面向多源网络百科的知识库构建方法

    公开(公告)号:CN107239481B

    公开(公告)日:2021-03-12

    申请号:CN201710236165.2

    申请日:2017-04-12

    Applicant: 北京大学

    Abstract: 本发明公开了一种面向多源网络百科的知识库构建方法。本方法为:1)从设定的若干网络百科抓取页面,并从抓取的每一页面中抽取页面的类别信息;2)基于类别信息构建类别树,并将类别信息和类别树对应,形成知识库的类别体系;提取每个网络百科对应页面的的别名信息构建该网络百科的概念词典;3)对抓取的页面进行去重,得到知识库的概念集合;4)从页面集合中每一页面的页面信息框和正文中抽取三元组信息;5)将三元组中的客体转换成标准格式,然后根据得到的标准化三元组和类别体系建立知识库。本发明不仅可以输出实体的类别体系,还可以对三元组中的实体进行链接,得到高质量的三元组知识,适用于多个网络百科混合生成知识库的需求。

    一种结合正则表达式和神经网络的自然语言任务处理方法和装置

    公开(公告)号:CN110909864A

    公开(公告)日:2020-03-24

    申请号:CN201911006241.6

    申请日:2019-10-22

    Applicant: 北京大学

    Abstract: 本发明公开一种结合正则表达式和神经网络模型的自然语言任务处理方法和装置。本方法为:1)给定一个自然语言相关的任务,针对该任务涉及的具体领域,获取正则表达式形式的领域知识,得到正则表达式集合;2)针对该任务选择一个基础的能够解决该任务的神经网络模型;3)在神经网络模型的训练过程中引入正则表达式集合中蕴含的领域知识,从而提升神经网络模型针对该任务的性能,正则表达式和神经网络模型的结合可以在不同层面上进行,包括输入层,模块层和输出层。本发明能够基于正则表达式形式的领域知识对神经网络模型的特定模块进行微调,并且辅助神经网络的训练,从而提升神经网络模型在该任务上的性能。

    一种中文事件抽取方法
    30.
    发明公开

    公开(公告)号:CN107122416A

    公开(公告)日:2017-09-01

    申请号:CN201710209305.7

    申请日:2017-03-31

    Applicant: 北京大学

    Abstract: 本发明公开了一种中文事件抽取方法。本方法为:1)对待抽取的中文文本进行实体识别,将识别出来的实体作为事件元素的候选词;对该中文文本逐字进行标注,然后根据标注结果,结合标注模式,识别该中文文本中的事件触发词以及该中文文本所描述的事件类型;2)将该中文文本、事件元素的候选词、事件触发词以及事件类型输入到分类模型中,判断每一所述候选词是否为真实的事件元素;3)根据上述得到的事件元素、事件触发词及事件类型,得到完整的事件结构,完成事件抽取。本发明解决了中文事件抽取中事件触发词和文本中的词语不完全匹配的问题,并提高了中文事件抽取的准确性。

Patent Agency Ranking