-
公开(公告)号:CN115066679B
公开(公告)日:2024-02-20
申请号:CN202080003897.7
申请日:2020-03-25
申请人: 苏州七星天专利运营管理有限责任公司
发明人: 李延
IPC分类号: G06F16/33
摘要: 本申请实施例公开了一种提取专业领域内的自造术语的方法。所述方法包括从文本中提取候选术语;确定所述候选术语在所述文本中出现情况的第一数据;确定所述候选术语的词元;确定所述词元在通用语料中出现情况的第二数据;确定所述词元在专业领域语料中出现情况的第三数据;以及基于参考数据,确定所述候选术语为自造术语的可能性,其中所述参考数据包括所述第一数据、所述第二数据、所述第三数据。(56)对比文件樊华 等.146-150.第三届智能电网会议论文集.2018,基于语义标注的电网文本数据知识抽取技术研究.Gang Li 等.The Application of DeepNeural Network Algorithm Consideringmulti-dimensional Meteorological FeatureExtraction in Short-Term Wind SpeedPrediction.2019 IEEE 3rd InformationTechnology, Networking, Electronic andAutomation Control Conference (ITNEC).2019,2432-2437.谷俊 .基于中文专利的新技术术语识别研究.竞争情报.2012,(第02期),25-29.朱波 等.基于边界特征的情感新词提取方法.重庆邮电大学学报(自然科学版).2014,(第06期),796-802.俞琰 等.基于通用词与术语部件的专利术语抽取.情报学报.2018,(第07期),742-752.Patrick Drouin 等.Automatic TermExtraction from Newspaper Corpora: Makingthe Most of Specificity and CommonFeatures.Proceedings of the 6thInternational Workshop on ComputationalTerminology (COMPUTERM 2020).2020,1-7.王密平.汉语专利术语抽取及应用研究--以钢铁冶金领域为例.中国优秀硕士学位论文全文数据库 哲学与人文科学辑.2017,(第9期),F084-18.
-
公开(公告)号:CN115221872B
公开(公告)日:2023-06-02
申请号:CN202210861227.X
申请日:2021-07-30
申请人: 苏州七星天专利运营管理有限责任公司
发明人: 李延
IPC分类号: G06F40/284 , G06F40/194 , G06F40/247
摘要: 本说明书实施例提供一种基于近义扩展的词汇扩展方法和系统,方法包括:获取目标词,其中包括以下中的一种或多种操作:获取基础词作为所述目标词;或获取基础词的翻译结果,并将所述翻译结果作为所述目标词;其中,所述基础词包括单个单词或两个以上单词构成的词组;获取与所述目标词关联的至少一个候选文本;从所述至少一个候选文本中确定多个候选词;从所述多个候选词中确定所述目标词的至少一个扩展词;确定所述扩展词中包括的多个单词;将所述多个单词中的各单词的单元近义词进行组合得到组合词组,所述单元近义词为单词的近义词,将所述组合词组确定为所述目标词的扩展词。
-
公开(公告)号:CN113569566A
公开(公告)日:2021-10-29
申请号:CN202110869338.0
申请日:2021-07-30
申请人: 苏州七星天专利运营管理有限责任公司
发明人: 李延
IPC分类号: G06F40/284 , G06F40/194 , G06F40/247
摘要: 本说明书实施例提供一种词汇扩展方法和系统,方法包括:获取目标词,目标词包括单个单词或两个以上单词构成的词组;获取与所述目标词关联的至少一个候选文本;从至少一个候选文本中确定多个候选词,多个候选词包括至少一个候选文本中的单词和连续的至少两个单词构成的词组;从多个候选词中确定目标词的至少一个扩展词。
-
公开(公告)号:CN112084753A
公开(公告)日:2020-12-15
申请号:CN202010963770.1
申请日:2020-09-14
申请人: 苏州七星天专利运营管理有限责任公司
发明人: 李延
IPC分类号: G06F40/166 , G06F40/14 , G06F40/197 , G06N20/00
摘要: 本说明书的实施例公开了一种文档辅助编辑的方法,应用于客户端,包括:接收并显示服务器基于第一文本获取的第二文本的文本结构;第一文本包括至少一条论述,每条论述包括至少一个关键点;第二文本的文本结构为树形结构,包括与至少一条论述或/和至少一个关键点对应的至少一个结构节点;第二文本还包括与至少一个结构节点对应的至少一个文本单元,至少一个文本单元用于说明第一文本;检测到结构节点被触发时,生成结构节点对应的目标文本单元的获取请求,并将获取请求发送给服务器;接收并显示服务器获取的结构节点对应的目标文本单元。
-
公开(公告)号:CN115293154A
公开(公告)日:2022-11-04
申请号:CN202210874267.8
申请日:2021-07-30
申请人: 苏州七星天专利运营管理有限责任公司
发明人: 李延
IPC分类号: G06F40/284 , G06F40/194 , G06F40/247
摘要: 本说明书实施例提供一种基于文本检索的词汇扩展方法和系统,方法包括:获取目标词,所述目标词包括单个单词或两个以上单词构成的词组;获取与所述目标词关联的至少一个候选文本,其中包括:确定文本检索条件;基于所述文本检索条件和所述目标词在文本库中检索,得到满足所述文本检索条件且与所述目标词关联的至少一个候选文本;从所述至少一个候选文本中确定多个候选词,所述多个候选词包括所述至少一个候选文本中的单词和位置连续的至少两个单词构成的词组;从所述多个候选词中确定所述目标词的至少一个扩展词。
-
公开(公告)号:CN115221872A
公开(公告)日:2022-10-21
申请号:CN202210861227.X
申请日:2021-07-30
申请人: 苏州七星天专利运营管理有限责任公司
发明人: 李延
IPC分类号: G06F40/284 , G06F40/194 , G06F40/247
摘要: 本说明书实施例提供一种基于近义扩展的词汇扩展方法和系统,方法包括:获取目标词,其中包括以下中的一种或多种操作:获取基础词作为所述目标词;或获取基础词的翻译结果,并将所述翻译结果作为所述目标词;其中,所述基础词包括单个单词或两个以上单词构成的词组;获取与所述目标词关联的至少一个候选文本;从所述至少一个候选文本中确定多个候选词;从所述多个候选词中确定所述目标词的至少一个扩展词;确定所述扩展词中包括的多个单词;将所述多个单词中的各单词的单元近义词进行组合得到组合词组,所述单元近义词为单词的近义词,将所述组合词组确定为所述目标词的扩展词。
-
公开(公告)号:CN115066679A
公开(公告)日:2022-09-16
申请号:CN202080003897.7
申请日:2020-03-25
申请人: 苏州七星天专利运营管理有限责任公司
发明人: 李延
IPC分类号: G06F16/33
摘要: 本申请实施例公开了一种提取专业领域内的自造术语的方法。所述方法包括从文本中提取候选术语;确定所述候选术语在所述文本中出现情况的第一数据;确定所述候选术语的词元;确定所述词元在通用语料中出现情况的第二数据;确定所述词元在专业领域语料中出现情况的第三数据;以及基于参考数据,确定所述候选术语为自造术语的可能性,其中所述参考数据包括所述第一数据、所述第二数据、所述第三数据。
-
公开(公告)号:CN111096079B
公开(公告)日:2022-07-05
申请号:CN201780094563.3
申请日:2017-09-04
申请人: 苏州七星天专利运营管理有限责任公司
IPC分类号: H05B47/19
摘要: 一种方法,包括:提供一个调光电路(301)和与调光电路连接的一个照明设备(103),调光电路(301)被施加一个交流电压;获取照明设备(103)在至少一个交流电周期(P)内的相关数据;处理相关数据,生成处理结果;和根据处理结果,确定照明设备(103)的类型。
-
公开(公告)号:CN113255303B
公开(公告)日:2022-03-25
申请号:CN202110710047.7
申请日:2020-09-14
申请人: 苏州七星天专利运营管理有限责任公司
发明人: 李延
IPC分类号: G06F40/166 , G06F40/14 , G06F40/197 , G06N20/00
摘要: 本说明书的实施例公开了一种文档辅助编辑的方法,应用于客户端,包括:接收并显示服务器基于第一文本获取的第二文本的文本结构;第一文本包括至少一条论述,每条论述包括至少一个关键点;第二文本的文本结构为树形结构,包括与至少一条论述或/和至少一个关键点对应的至少一个结构节点;第二文本还包括与至少一个结构节点对应的至少一个文本单元,至少一个文本单元用于说明第一文本;基于用户的操作,显示文本结构的全部或一部分。
-
公开(公告)号:CN113312884A
公开(公告)日:2021-08-27
申请号:CN202110672721.7
申请日:2020-09-14
申请人: 苏州七星天专利运营管理有限责任公司
发明人: 李延
IPC分类号: G06F40/166 , G06F40/14 , G06F40/197 , G06N20/00
摘要: 本说明书的实施例公开了一种文档辅助编辑的方法,应用于服务器,包括:获取第一文本,第一文本包括一条或多条论述,每条论述包括一个或多个关键点;基于第一文本,获取第二文本的文本结构;第二文本的文本结构为树形结构,包括至少一个结构节点,结构节点通过人工输入生成,或者通过结构节点生成模型生成;结构节点生成模型为机器学习模型;其中,上级结构节点的内容特征或平级结构节点的内容特征包括上级结构节点或平级结构节点的以下一种或多种特征:对应的论述、对应的关键点、对应的关键点的关键点类型特征、对应的文本单元的类型和对对应的文本单元的相关要求;第二文本还包括至少一个文本单元,至少一个文本单元用于说明第一文本。
-
-
-
-
-
-
-
-
-