-
公开(公告)号:CN105208075B
公开(公告)日:2018-07-31
申请号:CN201510492674.2
申请日:2015-08-12
Abstract: 种基于高分散哈希算法的数据采集策略方法及装置,该装置包括用户行为采集模块、时间种子生成器、哈希回传时间生成器、时间校正器、定时服务模块、数据传输模块、文件缓存模块、后台接收服务模块;该装置将高分散性哈希算法引入,计算合理的回传时间;数据传输模块及数据加密器等用于将数据进行加密后传输;文件缓存、传输计数器、启动计数器等用于测算数据传输成功率。本发明利用高分散性哈希算法的天然特质,在对实时性要求不高的移动互联网数据采集系统中,有效的将大量的设备发送请求进行了分散疏导,合理的利用服务器的资源情况,将其服务能力平均化,同时也可以将数据回传的延时降到最低,实现系统的均衡、稳定的目标。
-
公开(公告)号:CN106021389A
公开(公告)日:2016-10-12
申请号:CN201610312962.X
申请日:2016-05-12
Abstract: 基于模板自动生成新闻的系统和方法,新闻事件日志库、新闻文章模板库、规则库组成该系统的数据库,新闻事件日志库通过选定事件日志与统计数据生成器连接,统计数据生成器分别与模板选择器、自然语言生成进行交互,自然语言生成与年报生成模块进行交互,统计数据生成器与模板选择器相交互,新闻文章模板库、模板选择器与年报生成模块相连接,年报生成模块与数据库进行连接。其实现方法的具体步骤阐述如下,建立年报日志库:建立模板库:建立规则库、选择模板、建立统计数据库、自然语言生成、年报生成;与现有技术相比,在新闻写作行业减轻了双手的劳动量,同时也提高了新闻报道的效率,为新闻发展提供了里程碑性的改革。
-
公开(公告)号:CN103500165B
公开(公告)日:2016-08-31
申请号:CN201310365592.2
申请日:2013-08-21
IPC: G06F17/30
Abstract: 本发明是一种结合聚类和双key值的高维向量检索方法。在本发明中,提出了一种结合聚类的双key值索引结构CDKB?tree,它首先采用聚类算法对高维向量集进行簇划分,然后为各簇数据构建双key值扩展B+?tree,形成CDKB?tree。进行检索时,只需对与查询范围相交的簇数据进行搜索,通过聚类实现第一次过滤,并通过主key和辅key(双key值),实现两次key值过滤,只需对主key和辅key均在搜索范围内的那些高维向量与查询向量间进行相似度匹配计算。本发明提出的索引结构通过聚类及简单的双key值大小比较,大大地减少了相似度匹配的运算量,极大地加快了检索速度。
-
公开(公告)号:CN117235663A
公开(公告)日:2023-12-15
申请号:CN202311164882.0
申请日:2023-09-11
Applicant: 新华通讯社
IPC: G06F18/25 , G06F40/30 , G06F40/289 , G06F40/279 , G06F40/205 , G06F18/241
Abstract: 本申请公开了一种新闻内容的立场信息确定方法、装置、设备及介质,方法包括:获取待识别的新闻内容;运用提取算法对新闻内容的多个段落内容进行提取,得到每个段落内容的立场信息;基于每个段落内容的立场信息,确定新闻内容的全文立场信息。本申请实施例能够基于提取出的多立场新闻稿件内容的多个立场信息,确定出全文立场信息,提高了新闻稿件内容的立场信息提取的准确率。
-
公开(公告)号:CN115204166A
公开(公告)日:2022-10-18
申请号:CN202210311657.4
申请日:2022-03-28
Applicant: 新华通讯社
IPC: G06F40/289 , G06F40/216
Abstract: 本申请公开了一种文本校对方法、装置、设备、介质及程序产品。该方法包括:对目标文本进行断句分词处理,获得至少一个目标单句、以及与该目标单句对应的初始分词序列;针对目标文本对应的每一个初始分词序列,至少根据两种预设词表校正规则进行校正处理,获得与每一初始分词序列对应的多个候选校正序列;至少根据两种概率模型,计算与各候选校正序列对应的置信值,根据置信值对候选校正序列进行筛选;根据置信值对多个筛选得到的候选校正序列进行融合处理,获得与初始分词序列对应的最优校正序列;根据目标单句在目标文本中的位置,组合各最优校正序列,获得校正文本。根据本申请实施例,本申请对文本进行校对的准确率高。
-
公开(公告)号:CN113033201A
公开(公告)日:2021-06-25
申请号:CN202011231567.1
申请日:2020-11-06
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F40/295 , G06F40/289 , G06F40/134 , G06F40/211
Abstract: 本发明提供一种地震新闻信息抽取方法及其系统,方法包括:将实体库中的第一实体链接到新闻文本上,对链接有第一实体的新闻文本识别得到第二实体,并对识别后的新闻文本进行分句,以得到包括新闻原句的第二处理文本;对第二处理文本识别和分词后得到第二数字类社会属性新闻数组,转化得到第二数字类社会属性新闻数组中的阿拉伯数字,将元素、阿拉伯数字和新闻原句输出;根据第二处理文本的时间要素对新闻原句设置时刻信息,对新闻原句识别得到新闻原句中的第三实体和关系动词列表,根据优先级顺序获取关系动词列表中的关系动词,并将第三实体、关系动词、时刻信息和新闻原句输出。本发明的有益效果:实现了基于时间线形成全面的新闻事件脉络。
-
公开(公告)号:CN112307761A
公开(公告)日:2021-02-02
申请号:CN202011301062.8
申请日:2020-11-19
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F40/289 , G06F40/216 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于注意力机制的事件抽取方法及系统,其中抽取方法包括以下步骤:获取待处理文本及其事件类型,提取所述待处理文本中各字的向量,获得文本向量数据,提取所述事件类型中各字的向量,生成事件类型向量数据;将所述文本向量数据和所述事件类型向量数据输入预先构建的抽取词预测模型,获得所述待处理文本中每个字所对应的标签所形成的标签序列;基于所述标签序列对所述待处理文本进行事件抽取,获得相应的事件触发词和事件论元。本发明中通过引入事件类型,结合事件类型对应的特征数据对事件触发词和事件论元进行联合抽取,有效提升事件抽取的准召率。
-
公开(公告)号:CN112199599A
公开(公告)日:2021-01-08
申请号:CN202011171680.5
申请日:2020-10-28
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F16/9535 , G06F16/9536 , G06F16/35 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明公开了一种媒体画像生成方法和系统,所述方法包括如下步骤:监测目标媒体账号,获取目标媒体的推送数据;根据推送数据可选择地获取目标媒体的公共画像数据;可选择地建立至少一个目标媒体偏好画像分析模型,根据推送数据分析获取目标媒体偏好画像数据;根据公共画像数据、偏好画像数据建立可视化的媒体画像;本发明采用人工智能技术,根据媒体属性建立多个分析模型,根据分析模型生成媒体画像,通过大数据和人工智能可以给每个媒体提供多样化的标签,从而可以自动地在细分属性中体现媒体的画像内容,提高画像内容的解析深度,提高媒体画像的准确性和多样性。
-
公开(公告)号:CN110931001A
公开(公告)日:2020-03-27
申请号:CN201910838418.2
申请日:2019-09-05
Applicant: 新华通讯社
IPC: G10L15/22 , G10L15/26 , G10L21/0208 , G10L21/0216
Abstract: 本发明公开了一种面向语音识别的抗噪音频传输的装置,将音源设备发生的扬声器信号Ss转变成能够被移动设备的TRRS接口识别的麦克风信号Sm。移动设备TRRS端接收驻极体麦克风产生的Sm信号需要使用其内置的放大电路对驻极体咪头进行驱动,因音讯盒子模块进行的工作是模拟麦克风信号,为了消除接收端的驱动电流对Ss的干扰,模块中使用2组有极电容C2、C1过滤掉来自驱动端的驱动电流。移动设备TRRS端会对接入的设备进行检测,以判断设备为TRS型或TRRS型,并且部分移动设备会对接入设备进行阻抗匹配。其实现方式结构简单、使用方便灵活,使原本只能通过手机放置在音箱旁边录音的方式具备抗噪传输的功能。
-
公开(公告)号:CN105049388B
公开(公告)日:2018-02-27
申请号:CN201510389068.8
申请日:2015-07-05
Abstract: 本发明涉及一种基于喷泉码与单载波频域均衡的短波通信系统及其传输方法,属于无线通信系统、通信信号处理及信道编译码等相关技术领域。本发明在短波数据传输系统中引入喷泉码,通过采用信源编码‑信道编码‑调制联合优化技术,有效缩短了短波单向无反馈信道中文件传输时延,增强了通信系统在恶劣信道环境下的可靠性,提高了文件传输的传输效率,对数据可靠性提供了有效的保障。同时本发明中采用了基于时间‑频率混合信道估计的单载波频域均衡技术,能够大幅降低单载波系统接收机的复杂度,大幅提升系统对抗短波信道多径传输造成的频域选择性衰落的能力。
-
-
-
-
-
-
-
-
-