-
公开(公告)号:CN116910195A
公开(公告)日:2023-10-20
申请号:CN202310462381.4
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/35 , G06F40/211 , G06F40/30 , G16H80/00
Abstract: 本发明涉及一种层次化细粒度医疗对话标注方法和系统。该方法选取待标注的文本片段,对待标注的文本片段的话语意图进行标注,并采用层级化语义内容标注体系对待标注的文本片段的语义内容进行标注。所述层级化语义内容标注体系包含三个层级:第一层级是对于话语所处的对话阶段的标注;第二层级是关于话语内容对应的信息类别的标注;第三层级是对具体内容的标注。本发明从句法‑语义、对话级‑句子级多角度构建了逻辑清晰的层次化标注体系,同时设置了更加细粒度的槽位信息,针对医疗对话数据的否定语义和条件语义的特点提出了状态和条件的标注标签,形成了综合、全面的标注规范,能够实现更加完善、更加细粒度的语义内容标注。
-
公开(公告)号:CN116738998A
公开(公告)日:2023-09-12
申请号:CN202310462367.4
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F40/30 , G06F16/332 , G16H80/00
Abstract: 本发明涉及一种基于Web的医疗对话多粒度语义标注系统和方法。该系统包括文件管理模块、对话展示模块、语句模块和标注模块;所述文件管理模块用于进行文件的管理;所述对话展示模块用于展示对话语句和对应说话者的角色信息;所述语句模块用于显示标注者当前选择的待标注语句及其来源;所述标注模块用于根据设计的标注规范进行标注功能的设置,并采用多层次的标注框架进行标注。本发明针对医疗对话领域的数据特征和应用需求设计开发了高效简洁的标注系统,具备多轮多角色数据展示、多粒度文本自由划选、层次化复杂语义数据标注等功能,对于标注具有更强的规范性和完备性。本发明设计的标注流程能够降低数据标注难度,提高标注效率。
-
公开(公告)号:CN117932503A
公开(公告)日:2024-04-26
申请号:CN202211312131.4
申请日:2022-10-25
Applicant: 中国科学院信息工程研究所
IPC: G06F18/2433 , G06F16/2458 , G06N3/045 , G06N3/048 , G06N3/09
Abstract: 本发明涉及一种基于异常段的时间序列异常检测评估方法和系统。本发明通过自动化划分异常段,实现了用异常段作为评估的计算单元,对时间序列异常检测任务进行有效评估,解决了基于点为计算单元的评估方法破坏了异常完整性与连续性的问题,可以更客观的反应模型检测能力。本发明将异常段作为评估计算单元,而不是点,保留了异常的完整性与连续性;通过使用权重曲线,突出了异常段中不同位置的点具有不一样的权重得分,与现有技术的无权重方案相比更加关注实际应用价值;本发明保留了现有方案的计算简易性,不需要过多的额外参数。
-
-