相似文本的确定方法、装置及设备

    公开(公告)号:CN107329947B

    公开(公告)日:2019-07-26

    申请号:CN201710346160.5

    申请日:2017-05-15

    Abstract: 本发明实施例公开了一种相似文本的确定方法、装置及设备。该方法包括:将第一目标文本和第二目标文本划分为相同数量的短文本,并筛选第一特征文本和筛选第二特征文本;基于第一特征文本与第二特征文本中字符长度较大的目标字符长度值和预设相似阈值,计算第一目标文本和第二目标文本之间允许不相同字符数;识别第一特征文本和第二特征文本之间不相同字符数;不相同字符数大于允许不相同字符数,确定第一目标文本和第二目标文本不相似;不相同字符数小于等于允许不相同字符数,确定第一目标文本和第二目标文本相似。本发明实施例能够不依赖中文分词库与中文分词算法,确定两个目标文本是否相似,减少内存的消耗和开销。

    相似文本的确定方法、装置及设备

    公开(公告)号:CN107329947A

    公开(公告)日:2017-11-07

    申请号:CN201710346160.5

    申请日:2017-05-15

    CPC classification number: G06F17/2765 G06F17/277

    Abstract: 本发明实施例公开了一种相似文本的确定方法、装置及设备。该方法包括:将第一目标文本和第二目标文本划分为相同数量的短文本,并筛选第一特征文本和筛选第二特征文本;基于第一特征文本与第二特征文本中字符长度较大的目标字符长度值和预设相似阈值,计算第一目标文本和第二目标文本之间允许不相同字符数;识别第一特征文本和第二特征文本之间不相同字符数;不相同字符数大于允许不相同字符数,确定第一目标文本和第二目标文本不相似;不相同字符数小于等于允许不相同字符数,确定第一目标文本和第二目标文本相似。本发明实施例能够不依赖中文分词库与中文分词算法,确定两个目标文本是否相似,减少内存的消耗和开销。

    多媒体消息数据处理方法、装置和系统

    公开(公告)号:CN107273423B

    公开(公告)日:2019-04-12

    申请号:CN201710347013.X

    申请日:2017-05-15

    Abstract: 本发明公开了一种多媒体消息数据处理方法、装置和系统。该方法可以包括:创建记录有多个储存单元的标识的链表,多个存储单元存储有相同类型的多媒体消息,其中,标识在链表中按照每个存储单元中存储的相同类型的多媒体消息的数量升序排列。接收多媒体消息,根据接收的多媒体消息的类型选择按照该类型的多媒体消息的数量进行排列的链表。将接收的多媒体消息存储至选择的链表的链表首节点记录的标识对应的存储单元。本发明实施例的一种多媒体消息数据处理方法、装置和系统,能够在负载均衡的同时,在多媒体消息进行检索时避免I/O访问冲突。

    多媒体消息数据处理方法、装置和系统

    公开(公告)号:CN107273423A

    公开(公告)日:2017-10-20

    申请号:CN201710347013.X

    申请日:2017-05-15

    CPC classification number: G06F17/30017

    Abstract: 本发明公开了一种多媒体消息数据处理方法、装置和系统。该方法可以包括:创建记录有多个储存单元的标识的链表,多个存储单元存储有相同类型的多媒体消息,其中,标识在链表中按照每个存储单元中存储的相同类型的多媒体消息的数量升序排列。接收多媒体消息,根据接收的多媒体消息的类型选择按照该类型的多媒体消息的数量进行排列的链表。将接收的多媒体消息存储至选择的链表的链表首节点记录的标识对应的存储单元。本发明实施例的一种多媒体消息数据处理方法、装置和系统,能够在负载均衡的同时,在多媒体消息进行检索时避免I/O访问冲突。

    关键词提取方法及装置
    9.
    发明公开

    公开(公告)号:CN106649422A

    公开(公告)日:2017-05-10

    申请号:CN201610409544.2

    申请日:2016-06-12

    CPC classification number: G06F17/30867 G06F17/2785

    Abstract: 本发明公开一种关键词提取方法及装置;方法包括:解析待分析短信,得到各待分析短信所属的类别,从属于同一类别的待分析短信的内容中提取出与预设词库匹配的候选关键词,解析所提取的候选关键词得到相应候选关键词的特征,从所提取的候选关键词中提取出与预设特征匹配的目标关键词。采用本发明实施例,实现了对待分析短信关键词的自动提取,减少了对待分析短信关键词提取的时间,节省了人工成本。

    关键词提取方法及装置
    10.
    发明授权

    公开(公告)号:CN106649422B

    公开(公告)日:2019-05-03

    申请号:CN201610409544.2

    申请日:2016-06-12

    Abstract: 本发明公开一种关键词提取方法及装置;方法包括:解析待分析短信,得到各待分析短信所属的类别,从属于同一类别的待分析短信的内容中提取出与预设词库匹配的候选关键词,解析所提取的候选关键词得到相应候选关键词的特征,从所提取的候选关键词中提取出与预设特征匹配的目标关键词。采用本发明实施例,实现了对待分析短信关键词的自动提取,减少了对待分析短信关键词提取的时间,节省了人工成本。

Patent Agency Ranking