-
公开(公告)号:CN106878668A
公开(公告)日:2017-06-20
申请号:CN201510919394.5
申请日:2015-12-10
Applicant: 微软技术许可有限责任公司
Abstract: 在本文所描述的主题的实现中,将当前获得的视频的帧与相应的参考帧相比较以确定出两者之间的相关度。这个相关度用于指示当前帧的变化程度。如果针对当前帧的相关度小于预定阈值,将不会直接确定出当前帧包括物体的移动,而是还要考虑在当前帧之前或之后的一个或多个帧与相应的参考帧之间的相关度。如果所考虑的帧的相关度也小于预定阈值,则可以检测出当前帧包括物体的移动。通过这种方式,降低了在噪声、误差等因素造成视频的帧的较大变化的情况中对物体移动的不正确检测,提高了检测物体移动的准确度。
-
公开(公告)号:CN118193601A
公开(公告)日:2024-06-14
申请号:CN202211601686.0
申请日:2022-12-13
Applicant: 微软技术许可有限责任公司
IPC: G06F16/2457 , G06F16/248 , G06F16/28 , G06F16/29
Abstract: 根据本公开的实现,提供了用于用户界面导航的模型预训练的方案。根据该方案,获取特征提取模型,特征提取模型被配置用于提取用户界面UI导航相关的特征表示;获取UI集中的多条导航路径,导航路径包括UI集中的多个UI并且与导航任务相对应;获取多条导航路径分别对应的UI描述和任务描述,UI描述用于描述导航路径中的多个UI所包括的UI元素,任务描述用于描述导航路径对应的导航任务;以及基于UI描述和任务描述与多条导航路径之间的对应性,执行对特征提取模型的预训练。通过引入导航路径级别的训练数据来执行模型的预训练,可以使模型能够直接学习到与导航任务相关的知识表征。经预训练的模型能够更容易地泛化到下游的各种实际导航任务中。
-
公开(公告)号:CN117742844A
公开(公告)日:2024-03-22
申请号:CN202211110494.X
申请日:2022-09-13
Applicant: 微软技术许可有限责任公司
IPC: G06F9/451 , G06N3/0464 , G06N3/08
Abstract: 根据本公开的实现,提供了解析图像中元素的层级关系的方案。根据该方案,基于输入图像的特征和输入图像中的第一元素,确定第一元素中的第二元素。基于特征和第二元素,检测第二元素中的第三元素。第一元素、第二元素和第三元素对应于输入图像中的相应区域。基于对第二元素的确定和对第三元素的检测结果,确定指示输入图像中元素之间的关系的层级结构。以此方式,可以在无需后处理的情况下获得图像中元素的层级结构。
-
公开(公告)号:CN118151807A
公开(公告)日:2024-06-07
申请号:CN202211567251.9
申请日:2022-12-07
Applicant: 微软技术许可有限责任公司
IPC: G06F3/04815 , G06F3/04886 , G06F9/451
Abstract: 根据本公开的实现,提供了用于用户界面(UI)自动化导航的方案。根据该方案,针对UI元素,生成表示UI元素的标记。这些UI元素至少包括所呈现的当前UI中的一个或多个UI元素。至少利用对应于当前导航任务的特定信息将这些标记变换成这些UI元素各自的特征表示。基于特征表示,从当前所呈现的UI元素中确定针对当前导航任务的目标元素。执行与目标元素相关联的操作。以此方式,利用导航任务特定的信息,有利于提高针对各种导航任务的性能。
-
公开(公告)号:CN106878668B
公开(公告)日:2020-07-17
申请号:CN201510919394.5
申请日:2015-12-10
Applicant: 微软技术许可有限责任公司
Abstract: 在本文所描述的主题的实现中,将当前获得的视频的帧与相应的参考帧相比较以确定出两者之间的相关度。这个相关度用于指示当前帧的变化程度。如果针对当前帧的相关度小于预定阈值,将不会直接确定出当前帧包括物体的移动,而是还要考虑在当前帧之前或之后的一个或多个帧与相应的参考帧之间的相关度。如果所考虑的帧的相关度也小于预定阈值,则可以检测出当前帧包括物体的移动。通过这种方式,降低了在噪声、误差等因素造成视频的帧的较大变化的情况中对物体移动的不正确检测,提高了检测物体移动的准确度。
-
-
-
-