-
公开(公告)号:CN109690529A
公开(公告)日:2019-04-26
申请号:CN201780054514.7
申请日:2017-08-30
Applicant: 微软技术许可有限责任公司
IPC: G06F16/35 , G06F16/953 , G06Q50/00
CPC classification number: G06F17/24 , G06F16/24578 , G06F16/285 , G06F16/36 , G06F16/93 , G06F17/2211 , G06F17/2235 , G06F17/2775 , G06Q10/1091 , G06Q30/0201 , G06Q50/01 , H04L51/16 , H04L51/32 , H04L67/306
Abstract: 代表性实施例公开了将文档编译成跟踪话题随时间的演变的时间线文档的机制。社交媒体文档可以用于标识链接文档(即,社交媒体在帖子、推文等中分享的文档)的重要性或流行度。分析社交媒体文档的集合,并且将其用来标识一系列n元语法和链接文档的经排名列表。基于与一系列n元语法的相似性来选择经排名列表的子集。然后将子集连同基础支持数据一起汇总和捕获到时间线文档的条目中。可以链接不同时间线文档中的相关条目以创建允许用户从一个时间线跳到另一个时间线的转向点。可以将时间线文档用作由查询系统执行的搜索的一部分。
-
公开(公告)号:CN108694158A
公开(公告)日:2018-10-23
申请号:CN201710226217.8
申请日:2017-04-08
Applicant: 大连万达集团股份有限公司
CPC classification number: G06F17/22 , G06F17/50 , G06F17/2211 , G06F17/5004
Abstract: 本发明公开了一种用于检查BIM模型文件是否变化的方法,至少包括以下步骤:确定待检查的至少两个BIM模型文件中的一个作为基础文件;对待检查的至少两个BIM模型文件进行数据初处理;获得模型文件中各模型构件的几何矢量信息以及属性信息;比较各文件中处于相同位置的各模型构件的几何矢量信息以及属性信息;获得至少两个BIM模型文件的变化对比表。本发明的方法通过对包含海量数据的模型文件中模型构件进行几何矢量信息配对比较,能够快速实现版本对比。而通过配对比较不同版本中相同位置的构件几何信息及所有属性信息,判断构件是否改变及文件中构件是否删除或增加,高效获取版本变化对比表,方便设计人员查看版本变化。
-
公开(公告)号:CN108351901A
公开(公告)日:2018-07-31
申请号:CN201680067228.X
申请日:2016-11-14
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/30598 , G06F17/2211 , G06F17/3012 , G06F17/30525 , G06Q10/101
Abstract: 本公开的各方面涉及统一活动服务。在一个方面,存储在第一存储平台上的第一文件可以渲染在第一用户界面上。可以从活动服务获得与第一文件相关联的一个或多个活动。存储在第二存储平台上的第二文件可以渲染在第二用户界面上。可以从活动服务获得与第二文件相关联的一个或多个活动。在另一方面,对应于与存储在第一存储平台上的第一文件相关联的至少一个活动的活动元数据和对应于与存储在第二存储平台上的第二文件相关联的至少一个活动的活动元数据可以在所述活动服务处被接收并存储在所述活动服务中。
-
公开(公告)号:CN105446957B
公开(公告)日:2018-07-20
申请号:CN201510882468.2
申请日:2015-12-03
Applicant: 小米科技有限责任公司
IPC: G06F17/27
CPC classification number: G06F17/2785 , G06F17/2211 , G06F17/2705
Abstract: 本公开关于一种相似性确定方法、装置及终端,属于自然语言处理领域。包括:分别对第一字符串和第二字符串进行分词,得到分别包括至少一个词的第一序列和第二序列;根据预先定义的编辑距离算法及第一序列和第二序列确定第一字符串和第二字符串时之间的编辑距离;根据编辑距离及由第一序列向第二序列变换所做的各操作的信息确定第一字符串与第二字符串之间的相似性。通过将第一字符串和第二字符串分词为第一序列和第二序列,使在确定编辑距离时,是基于字符串中的词实现的,而并非基于字符串中的字符实现的,而字符串中的各个词可能包括至少一个字符,从而使根据编辑距离确定的相似性结合了字符串中各个字符之间的相关性,使确定的相似性更准确。
-
公开(公告)号:CN107967255A
公开(公告)日:2018-04-27
申请号:CN201711088831.9
申请日:2017-11-08
Applicant: 北京广利核系统工程有限公司 , 中国广核集团有限公司
CPC classification number: G06F17/2775 , G06F17/2211 , G06F17/2785
Abstract: 本发明属于文本分类的技术领域,为了解决现有技术中三种文本相似性判断算法分别存在的不足,本发明提供一种判定文本相似性的方法和系统,所述方法包括:S1、构建向量空间模型,使得文本量化成可处理的对象;S2、使用Siamese网络构建文本语义相似性提取模型,并且在Siamese网络中,语义特征提取网络与相似性判别网络串联在一起,同时在样本训练阶段进行优化;S3、基于训练阶段样本的语义特征表达,构造基于特征向量的夹角余弦的文本相似度计算函数,以及最终的损失函数;S4、输入两个待测文本,基于Siamese网络对待测文本进行语义特征提取之后,计算两个向量的余弦夹角距离,并设置阈值,当两个向量的余弦夹角距离大于阈值时,判定为相似,否则判定为不相似。
-
公开(公告)号:CN107967245A
公开(公告)日:2018-04-27
申请号:CN201711288801.2
申请日:2017-12-07
Applicant: 泰康保险集团股份有限公司
Inventor: 付春玉
IPC: G06F17/22
CPC classification number: G06F17/2217 , G06F17/2211
Abstract: 本发明提供一种数据处理方法、装置、终端和存储介质,该方法包括:根据用户录入的批次号从数据源中获取第一数据;对所述第一数据的每个字符串的移入SI字符和移出SO字符进行配对检测,生成检测结果,所述检测结果用于指示字符串是否出现异常;若所述检测结果指示字符串出现异常,则生成异常报告,所述异常报告中包括异常字符串对应的数据行号和数据特征,能够大大缩短人工比对时间,提高运维效率,节省运维成本。
-
公开(公告)号:CN107784049A
公开(公告)日:2018-03-09
申请号:CN201611104057.1
申请日:2016-12-05
Applicant: 上海壹账通金融科技有限公司
Inventor: 洪光宝
CPC classification number: G06F17/30179 , G06F17/2211
Abstract: 本发明提出了一种多格式文件解析的方法,所述方法包括:获取待解析文件的存储地址;根据所述存储地址确定与所述待解析文件对应的配置标识;根据所述配置标识加载与该配置标识对应的配置信息;根据所述配置信息中的文件格式类型获取与所述文件格式类型对应的解析类;根据所述解析类和所述配置信息对所述待解析文件进行解析。该多格式文件解析方法通过将文件的格式配置信息和实现文件解析的解析类进行了隔离不仅减少了开发工作量,而且有效的降低了后期维护升级的成本。此外,还提出了一种多格式文件解析的装置。
-
公开(公告)号:CN107767924A
公开(公告)日:2018-03-06
申请号:CN201711116028.1
申请日:2017-11-13
Applicant: 医渡云(北京)技术有限公司
CPC classification number: G06F17/2211
Abstract: 本发明的实施例提供了一种原始数据核对方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:基于患者主索引获取原始数据与病例报告表的填写数据中的同一患者的数据;通过预定标准建立原始数据与填写数据中同一患者的数据的统一编码;基于统一编码识别原始数据与填写数据中同一患者的数据的相应字段;通过预定映射规则对所识别的同一患者的数据的相应字段进行对比,并在对比结果不一致时进行提示。本发明实施例的技术方案能够自动进行SDV核查,降低了SDV核查成本,提高了SDV核查效率。
-
公开(公告)号:CN107729489A
公开(公告)日:2018-02-23
申请号:CN201710966609.8
申请日:2017-10-17
Applicant: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
Inventor: 李树海
CPC classification number: G06F17/30705 , G06F17/2211 , G06F17/30867
Abstract: 本发明公开了一种广告文本识别方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取待识别的文本;根据文本之间的关联关系,对所述待识别的文本进行聚类以形成至少一个文本类别;根据所述至少一个文本类别,识别所述待识别文本中的广告文本。该实施方式采用无监督的方法自动识别广告文本,不需要人工参与,降低了成本,提高了识别效率,从而能够快速地在海量文本中识别广告文本。
-
公开(公告)号:CN107729300A
公开(公告)日:2018-02-23
申请号:CN201710841945.X
申请日:2017-09-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/22
CPC classification number: G06F17/2211
Abstract: 本发明提供一种文本相似度的处理方法、装置、设备和计算机存储介质,其中所述文本相似度的处理方法包括:获取由多种相似度确定方法得到的文本对的相似度确定结果;将所述文本对的相似度确定结果进行拼接,得到拼接特征;将所述拼接特征作为相似度确定模型的输入,根据所述相似度确定模型的输出得到所述文本对的文本相似度;其中,所述相似度确定模型是预先训练得到的。通过本发明所提供的技术方案,能够实现对多种相似度确定方法所得到的相似度确定结果进行集成处理,并提高确定文本对的文本相似度的准确性,使得集成处理后的相似度计算准确性高于任何一种单一的相似度计算方式。
-
-
-
-
-
-
-
-
-