基于权利要求的专利侵权检测方法

    公开(公告)号:CN109977362A

    公开(公告)日:2019-07-05

    申请号:CN201910236446.7

    申请日:2019-03-27

    Inventor: 吕学强 董志安

    Abstract: 本发明涉及一种基于权利要求的专利侵权检测方法,包括:步骤1)数据采集和预处理;步骤2)将权利要求书表示成层次向量矩阵;步骤3)根据不同层次分别计算得到的相似度结果检查专利是否侵权。本发明提供的基于权利要求的专利侵权检测方法,将专利文本中最为重要的权利要求书作为主要研究对象,通过对权利要求书的结构进行分解,分别计算分解后各部分的相似度并最终确定待检专利是否侵权,有效地提高了专利侵权检测的准确率,效率高,检测准确率高,降低了工作复杂度,提升了工作效率,可以很好地满足实际应用的需要。

    基于SAO结构的中文专利文本实体关系抽取方法

    公开(公告)号:CN109933781A

    公开(公告)日:2019-06-25

    申请号:CN201811202084.1

    申请日:2018-10-16

    Inventor: 吕学强 董志安

    Abstract: 本发明涉及一种基于SAO结构的中文专利文本实体关系抽取方法,包括:步骤一:从专利文本中获取候选SAO三元组;步骤二:提取候选SAO三元组的传统特征和句法语义特征。本发明提供的基于SAO结构的中文专利文本实体关系抽取方法,把中文专利文本的关系抽取问题,转化为SAO结构识别的分类问题,利用中文专利语料作为处理数据,抽取了词法特征、上下文特征、距离特征以及句法语义特征,能够显著地增强关系抽取的性能,能够有效地提升关系抽取的效果,可以很好地满足实际应用的需要。

    使用实时数据生成体育赛事战报的方法

    公开(公告)号:CN109740123A

    公开(公告)日:2019-05-10

    申请号:CN201811566675.7

    申请日:2018-12-21

    Abstract: 本发明涉及一种使用实时数据生成体育赛事战报的方法,使用基于Attention的序列模型TransFormer将关键事件转化为战报句,所述方法包括:使用抽取模型从实时数据中抽取关键事件,然后用生成式模型将抽取出来的每一个结构化的关键事件翻译成战报风格的语言,最后将这些句子按照时间线拼接成一篇战报。本发明提供的使用实时数据生成体育赛事战报的方法,使用抽取模型从实时数据中抽取关键事件,然后用生成式模型将抽取出来的每一个结构化的关键事件翻译成战报风格的语言,最后将这些句子按照时间线拼接成一篇战报,从结构化的实时数据里抽取关键事件,实时数据结构规范,内容精确,因此抽取效果很好,克服了现有技术存在的缺陷,可以很好地满足实际应用的需要。

    一种基于动态纹理基元的外观设计专利检索方法

    公开(公告)号:CN105701174B

    公开(公告)日:2019-04-23

    申请号:CN201610001349.6

    申请日:2016-01-05

    Abstract: 本发明涉及一种基于动态纹理基元的外观设计专利检索方法,包括以下步骤:步骤1):提取纹理基元;步骤2):对纹理基元提取基于统计分析的LBP特征,并对提取的特征向量进行归一化和相似性度量,返回检索结果。本发明以外观设计专利为基础,针对不同图像纹理基元大小不一定相等的特点,本发明提出一种根据图像内容动态提取纹理基元并对纹理基元提取特征的图像检索算法。在检索具有重复纹理基元的图像时,本发明的检索效果优于已有的基于整幅图像的检索方法,能检索出具有相同纹理基元,但排列结构不同的图像,可用于图像纹理结构相似性判断,具有良好的检索效果,可以很好地满足实际应用的需要。

    基于卷积神经网络的管道视频缺陷检测方法

    公开(公告)号:CN109559302A

    公开(公告)日:2019-04-02

    申请号:CN201811403708.6

    申请日:2018-11-23

    Abstract: 本发明涉及一种基于卷积神经网络的管道视频缺陷检测方法,对视频抽帧,训练多个CNN对每帧图像进行分类,统计每个CNN返回的结果,确定该帧的缺陷类型,以管道闭路电视视频为输入,将视频切分为连续图像帧,将每帧图像送入多个训练好的CNN中进行二分类,分类结果只包括含有某种特定缺陷和无缺陷。本发明显著提高了管道缺陷检测的准确率,为视频检测提供了一种可行方法,不仅可以提高管道缺陷的自动化检测效率,也可减轻工作人员的劳动强度,本方法检测准确率高且检测速度快,在管道视频缺陷检测中具有很大的应用价值,且取得了较为满意的结果,可作为管道缺陷检测工作者的技术参考,可以很好地满足实际应用的需要。

    一种专利文献领域术语抽取方法

    公开(公告)号:CN108549635A

    公开(公告)日:2018-09-18

    申请号:CN201810310200.5

    申请日:2018-04-09

    Inventor: 吕学强 董志安

    Abstract: 本发明涉及一种专利文献领域术语抽取方法,包括:专利文本预处理、术语标注、字序列标注、语料划分和CRFs模型训练及预测。本发明利用条件随机场模型对专利文献中的术语进行抽取,采用字序列标注的方法,建立字级层面的特征来抽取术语,减少了分词对特征提取带来的噪音干扰,同时,基于构建的领域核心词典自动标注训练语料和测试语料中的术语,减少了人工标注的成本,在不同词位类别标注下训练的模型的抽取效果好,准确率、召回率和F值较高,可以很好地满足实际应用的需要。

    一种中文专利文献术语自动识别方法

    公开(公告)号:CN105224520B

    公开(公告)日:2018-03-13

    申请号:CN201510623936.4

    申请日:2015-09-28

    Inventor: 吕学强 董志安

    Abstract: 本发明涉及一种中文专利文献术语自动识别方法,包括以下步骤:步骤1):基于专利标题自动生成词性规则;步骤2):手工构建停用词表;步骤3):对生成的所述词性规则按照所含词性的个数进行分类;步骤4):利用TermRank排序算法对候选术语进行排序。本发明首先利用统计学方法从专利标题中自动学习出构成术语的词性规则,解决了人工总结术语词性规则的不足;采用TermRank排序方法对候选术语进行排序,综合考虑了专利文献中的语言学和统计学特征,能够较好的区分术语和非术语,具有较高的可靠性,可以很好地满足实际应用的需要。

    一种面向中文专利的实体间非分类关系抽取方法

    公开(公告)号:CN105678327A

    公开(公告)日:2016-06-15

    申请号:CN201610001335.4

    申请日:2016-01-05

    Abstract: 本发明涉及一种面向中文专利的实体间非分类关系抽取方法,包括以下步骤:步骤1):初始化概念对所在的基本关系集合;步骤2):使用基于领域关系强度的关系词标记算法自动标记候选关系词;步骤3):进行特征选择,获得特征向量;步骤4):采用支持向量机SVM对步骤3)获得的特征数据进行分类。本发明将中文专利本体中实体间非分类关系抽取限定为满足SAO结构的实体间关系抽取,提出句法分析特征和关系词词典特征并结合传统特征的方法,使用支持向量机进行关系抽取,从而解决了SAO结构关系抽取任务中关系实例结构正确但是语义错误的问题,该方法优于传统关系抽取方法,可以很好地满足实际应用的需要。

    一种多动词汉语概念复合块的动词层次分类的方法

    公开(公告)号:CN105528340A

    公开(公告)日:2016-04-27

    申请号:CN201510863564.2

    申请日:2015-12-02

    CPC classification number: G06F17/277 G06F17/271 G06F17/274

    Abstract: 本发明涉及一种多动词汉语概念复合块的动词层次分类的方法,包括以下步骤:步骤1)对汉语句子进行词语切分和词性标记;步骤2)将所述句子分割为小句;步骤3)将所述小句中的多个动词进行层次划分;步骤4)将动词分为两类;步骤5)利用改进的CCC分析器对动词进行分析;步骤6)针对多动词的小句进行分析直到队列元素为空。本发明可以减少因动词的层次分析错误而导致的句子整体层次错误,从而提高组块分析的准确性,为后续进行复杂句的句法语义分析打下了很好的基础,可以很好地满足实际应用的需要。

    一种基于百度地图API的地理位置实体规范化方法

    公开(公告)号:CN105335468A

    公开(公告)日:2016-02-17

    申请号:CN201510623640.2

    申请日:2015-09-28

    Abstract: 本发明涉及一种基于百度地图API的地理位置实体规范化方法,包括以下步骤:步骤1):利用百度地图API,对缺陷地理位置实体进行检索;步骤2):利用步骤1)的检索结果,构建缺陷地理位置实体的区域特征向量;步骤3):利用所述区域特征向量,对明确地理位置实体进行规范化;步骤4):利用所述明确地理位置实体,对歧义地理位置实体进行规范化;步骤5):利用等价地理位置实体,对零地理位置实体进行规范化。本发明以城市管理投诉文本为基础,利用地图API实现地理位置实体的规范化,结合城市管理投诉文本的特点、地理位置实体中存在的问题,对不完整的地理位置实体进行区域补全,从而解决了统计分析工作难以进行的局面。

Patent Agency Ranking