网页操作方法和装置转让专利

申请号 : CN201710130629.1

文献号 : CN106919260B

文献日 : 2020-03-13

相似专利: 请登录后查看

本申请公开了网页操作方法和装置。该方法的一具体实施方式包括：获取摄像装置拍摄的图像和陀螺仪传感器产生的该移动设备的旋转数据；对该图像进行解析，生成手持该移动设备的用户在三维坐标系中的三维坐标；将该三维坐标转换为二维坐标系中的二维坐标；基于该二维坐标和该旋转数据，对该显示屏幕中所显示的网页进行操作。该实施方式提高了虚拟现实环境下的网页交互的灵活性。

1.一种用于移动设备的网页操作方法，其特征在于，所述移动设备与摄像装置相连接，且所述移动设备安装有陀螺仪传感器，所述方法包括：获取所述摄像装置拍摄的图像和所述陀螺仪传感器产生的所述移动设备的旋转数据；

对所述图像进行解析，生成手持所述移动设备的用户在三维坐标系中的三维坐标，其中，所述三维坐标系为现实空间中以指定点作为原点而预先建立的坐标系；

根据预设的坐标转换关系，将所述三维坐标转换为二维坐标系中的二维坐标，其中，所述二维坐标系是基于所述移动设备的显示屏幕而预先建立的坐标系；

基于所述二维坐标和所述旋转数据，对所述显示屏幕中所显示的网页进行操作。

2.根据权利要求1所述的网页操作方法，其特征在于，所述图像中呈现有手持所述移动设备的用户的人像；以及所述对所述图像进行解析，生成手持所述移动设备的用户在三维坐标系中的三维坐标，包括：将所述图像中的人像与预先获取的上一帧图像中的人像进行比较，确定所述用户的在三维坐标系的位移信息；

基于所述位移信息和预先确定的、所述用户在所述上一帧图像拍摄时位于所述三维坐标系中的原始三维坐标，生成所述用户在所述三维坐标系中的三维坐标。

3.根据权利要求1所述的网页操作方法，其特征在于，所述摄像装置安装在所述移动设备中，所述图像呈现有至少一个物体的影像；以及所述对所述图像进行解析，生成手持所述移动设备的用户在三维坐标系中的三维坐标，包括：从所述图像中提取特征向量，将所述特征向量输入至预先训练的图像识别模型，得到对所述至少一个物体中的各个物体的影像的识别结果，其中，所述图像识别模型用于表征特征向量与识别结果的对应关系；

对于每一个物体的影像，将该影像与预先获取的上一帧图像中的、具有相同识别结果的物体的影像进行比较，确定该物体在所述三维坐标系的位移信息；

基于各个物体的在所述三维坐标系的位移信息和预先确定的、所述上一帧图像拍摄时手持所述移动设备的用户位于所述三维坐标系中的原始三维坐标，生成所述用户在所述三维坐标系中的三维坐标。

4.根据权利要求1所述的网页操作方法，其特征在于，所述基于所述二维坐标和所述旋转数据，对所述显示屏幕中所显示的网页进行操作，包括：将所述显示屏幕所显示的网页中的、所述二维坐标所指示的位置的元素确定为目标元素，确定所述目标元素是否为支持点击的元素；

响应于确定所述目标元素是支持点击的元素，确定是否已呈现预设的、与所述目标元素相关联的悬浮界面；

响应于确定已呈现所述悬浮界面，确定所述悬浮界面的呈现时长；

响应于确定所述呈现时长不小于预设时长阈值，触发对所述目标元素的点击事件，并呈现与所述目标元素相关联的点击界面。

5.根据权利要求4所述的网页操作方法，其特征在于，所述基于所述二维坐标和所述旋转数据，对所述显示屏幕中所显示的网页进行操作，还包括：响应于确定未呈现所述悬浮界面，呈现所述悬浮界面。

6.根据权利要求1所述的网页操作方法，其特征在于，所述基于所述二维坐标和所述旋转数据，对所述显示屏幕中所显示的网页进行操作，包括：对所述旋转数据进行解析，生成四元数数据；

基于所述四元数数据，对所述显示屏幕中所显示的网页进行滚动。

7.一种用于移动设备的网页操作装置，其特征在于，所述移动设备与摄像装置相连接，且所述移动设备安装有陀螺仪传感器，所述装置包括：获取单元，配置用于获取所述摄像装置拍摄的图像和所述陀螺仪传感器产生的所述移动设备的旋转数据；

解析单元，配置用于对所述图像进行解析，生成手持所述移动设备的用户在三维坐标系中的三维坐标，其中，所述三维坐标系为现实空间中以指定点作为原点而预先建立的坐标系；

转换单元，配置用于根据预设的坐标转换关系，将所述三维坐标转换为二维坐标系中的二维坐标，其中，所述二维坐标系是基于所述移动设备的显示屏幕而预先建立的坐标系；

操作单元，配置用于基于所述二维坐标和所述旋转数据，对所述显示屏幕中所显示的网页进行操作。

8.根据权利要求7所述的网页操作装置，其特征在于，所述图像中呈现有手持所述移动设备的用户的人像；以及所述解析单元包括：

第一比较模块，配置用于将所述图像中的人像与预先获取的上一帧图像中的人像进行比较，确定所述用户的在三维坐标系的位移信息；

第一生成模块，配置用于基于所述位移信息和预先确定的、所述用户在所述上一帧图像拍摄时位于所述三维坐标系中的原始三维坐标，生成所述用户在所述三维坐标系中的三维坐标。

9.根据权利要求7所述的网页操作装置，其特征在于，所述摄像装置安装在所述移动设备中，所述图像呈现有至少一个物体的影像；以及所述解析单元包括：

第一提取模块，配置用于从所述图像中提取特征向量，将所述特征向量输入至预先训练的图像识别模型，得到对所述至少一个物体中的各个物体的影像的识别结果，其中，所述图像识别模型用于表征特征向量与识别结果的对应关系；

第二比较模块，配置用于对于每一个物体的影像，将该影像与预先获取的上一帧图像中的、具有相同识别结果的物体的影像进行比较，确定该物体在所述三维坐标系的位移信息；

第二生成模块，配置用于基于各个物体的在所述三维坐标系的位移信息和预先确定的、所述上一帧图像拍摄时手持所述移动设备的用户位于所述三维坐标系中的原始三维坐标，生成所述用户在所述三维坐标系中的三维坐标。

10.根据权利要求7所述的网页操作装置，其特征在于，所述操作单元包括：第二提取模块，配置用于将所述显示屏幕所显示的网页中的、所述二维坐标所指示的位置的元素确定为目标元素，确定所述目标元素是否为支持点击的元素；

第一确定模块，配置用于响应于确定所述目标元素是支持点击的元素，确定是否已呈现预设的、与所述目标元素相关联的悬浮界面；

第二确定模块，配置用于响应于确定已呈现所述悬浮界面，确定所述悬浮界面的呈现时长；

触发模块，配置用于响应于确定所述呈现时长不小于预设时长阈值，触发对所述目标元素的点击事件，并呈现与所述目标元素相关联的点击界面。

11.根据权利要求10所述的网页操作装置，其特征在于，所述操作单元还包括：呈现模块，配置用于响应于确定未呈现所述悬浮界面，呈现所述悬浮界面。

12.根据权利要求7所述的网页操作装置，其特征在于，所述操作单元包括：解析模块，配置用于对所述旋转数据进行解析，生成四元数数据；

滚动模块，配置用于基于所述四元数数据，对所述显示屏幕中所显示的网页进行滚动。

13.一种移动设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

陀螺仪传感器，用于检测方位以及产生旋转数据；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-6中任一所述的方法。

网页操作方法和装置

技术领域

[0001] 本申请涉及计算机技术领域，具体涉及互联网技术领域，尤其涉及网页操作方法和装置。

背景技术

[0002] 虚拟现实技术是一种可以创建和体验虚拟世界的计算机仿真技术，可以利用计算机技术生成一种模拟环境，通过多源信息融合的交互式的三维动态视景和实体行为的系统仿真使用户沉浸到该模拟环境中。目前，虚拟现实技术已经应用于多种场景。

[0003] 然而，在利用虚拟现实环境的网页交互场景中，现有的方式仅支持在虚拟现实环境下对网页的浏览，无法实现对网页的操作(例如光标移动、悬浮、网页滚动等)，导致虚拟现实环境下与网页的交互的灵活性较低。

发明内容

[0004] 本申请实施例的目的在于提出一种改进的网页操作方法和装置，来解决以上背景技术部分提到的技术问题。

[0005] 第一方面，本申请实施例提供了一种网页操作方法，该移动设备与摄像装置相连接，且移动设备安装有陀螺仪传感器，该方法包括：获取摄像装置拍摄的图像和陀螺仪传感器产生的移动设备的旋转数据；对图像进行解析，生成手持移动设备的用户在三维坐标系中的三维坐标，其中，三维坐标系为现实空间中以指定点作为原点而预先建立的坐标系；将三维坐标转换为二维坐标系中的二维坐标，其中，二维坐标系是基于移动设备的显示屏幕而预先建立的坐标系；基于二维坐标和旋转数据，对显示屏幕中所显示的网页进行操作。

[0006] 在一些实施例中，图像中呈现有手持移动设备的用户的人像；以及对图像进行解析，生成手持移动设备的用户在三维坐标系中的三维坐标，包括：将图像中的人像与预先获取的上一帧图像中的人像进行比较，确定用户的在三维坐标系的位移信息；基于位移信息和预先确定的、用户在上一帧图像拍摄时位于三维坐标系中的原始三维坐标，生成用户在三维坐标系中的三维坐标。

[0007] 在一些实施例中，摄像装置安装在移动设备中，图像呈现有至少一个物体的影像；以及对图像进行解析，生成手持移动设备的用户在三维坐标系中的三维坐标，包括：从图像中提取特征向量，将特征向量输入至预先训练的图像识别模型，得到对至少一个物体中的各个物体的影像的识别结果，其中，图像识别模型用于表征特征向量与识别结果的对应关系；对于每一个物体的影像，将该影像与预先获取的上一帧图像中的、具有相同识别结果的物体的影像进行比较，确定该物体在三维坐标系的位移信息；基于各个物体的在三维坐标系的位移信息和预先确定的、上一帧图像拍摄时手持移动设备的用户位于三维坐标系中的原始三维坐标，生成用户在三维坐标系中的三维坐标。

[0008] 在一些实施例中，基于二维坐标和旋转数据，对显示屏幕中所显示的网页进行操作，包括：将显示屏幕所显示的网页中的、二维坐标所指示的位置的元素确定为目标元素，确定目标元素是否为支持点击的元素；响应于确定目标元素是支持点击的元素，确定是否已呈现预设的、与目标元素相关联的悬浮界面；响应于确定已呈现悬浮界面，确定悬浮界面的呈现时长；响应于确定呈现时长不小于预设时长阈值，触发对目标元素的点击事件，并呈现与目标元素相关联的点击界面。

[0009] 在一些实施例中，基于二维坐标和旋转数据，对显示屏幕中所显示的网页进行操作，还包括：响应于确定未呈现悬浮界面，呈现悬浮界面。

[0010] 在一些实施例中，基于二维坐标和旋转数据，对显示屏幕中所显示的网页进行操作，包括：对旋转数据进行解析，生成四元数数据；基于四元数数据，对显示屏幕中所显示的网页进行滚动。

[0011] 第二方面，本申请实施例提供了一种网页操作装置，该移动设备与摄像装置相连接，且该移动设备安装有陀螺仪传感器，该装置包括：获取单元，配置用于获取摄像装置拍摄的图像和陀螺仪传感器产生的移动设备的旋转数据；解析单元，配置用于对图像进行解析，生成手持移动设备的用户在三维坐标系中的三维坐标，其中，三维坐标系为现实空间中以指定点作为原点而预先建立的坐标系；转换单元，配置用于将三维坐标转换为二维坐标系中的二维坐标，其中，二维坐标系是基于移动设备的显示屏幕而预先建立的坐标系；操作单元，配置用于基于二维坐标和旋转数据，对显示屏幕中所显示的网页进行操作。

[0012] 在一些实施例中，图像中呈现有手持移动设备的用户的人像；以及解析单元包括：第一比较模块，配置用于将图像中的人像与预先获取的上一帧图像中的人像进行比较，确定用户的在三维坐标系的位移信息；第一生成模块，配置用于基于位移信息和预先确定的、用户在上一帧图像拍摄时位于三维坐标系中的原始三维坐标，生成用户在三维坐标系中的三维坐标。

[0013] 在一些实施例中，摄像装置安装在移动设备中，图像呈现有至少一个物体的影像；以及解析单元包括：第一提取模块，配置用于从图像中提取特征向量，将特征向量输入至预先训练的图像识别模型，得到对至少一个物体中的各个物体的影像的识别结果，其中，图像识别模型用于表征特征向量与识别结果的对应关系；第二比较模块，配置用于对于每一个物体的影像，将该影像与预先获取的上一帧图像中的、具有相同识别结果的物体的影像进行比较，确定该物体在三维坐标系的位移信息；第二生成模块，配置用于基于各个物体的在三维坐标系的位移信息和预先确定的、上一帧图像拍摄时手持移动设备的用户位于三维坐标系中的原始三维坐标，生成用户在三维坐标系中的三维坐标。

[0014] 在一些实施例中，操作单元包括：第二提取模块，配置用于将显示屏幕所显示的网页中的、二维坐标所指示的位置的元素确定为目标元素，确定目标元素是否为支持点击的元素；第一确定模块，配置用于响应于确定目标元素是支持点击的元素，确定是否已呈现预设的、与目标元素相关联的悬浮界面；第二确定模块，配置用于响应于确定已呈现悬浮界面，确定悬浮界面的呈现时长；触发模块，配置用于响应于确定呈现时长不小于预设时长阈值，触发对目标元素的点击事件，并呈现与目标元素相关联的点击界面。

[0015] 在一些实施例中，操作单元还包括：呈现模块，配置用于响应于确定未呈现悬浮界面，呈现悬浮界面。

[0016] 在一些实施例中，操作单元包括：解析模块，配置用于对旋转数据进行解析，生成四元数数据；滚动模块，配置用于基于四元数数据，对显示屏幕中所显示的网页进行滚动。

[0017] 本申请实施例提供的网页操作方法和装置，通过移动设备对摄像装置拍摄的图像进行解析生成手持上述移动设备的用户在三维坐标系中的三维坐标，而后将三维坐标转换为二维坐标系中的二维坐标，最后基于二维坐标和从陀螺仪传感器获取的旋转数据对显示屏幕中所显示的网页进行操作，从而可以实现在虚拟现实环境下对网页进行交互，提高了虚拟现实环境下的网页交互的灵活性。

附图说明

[0018] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

[0019] 图1是本申请可以应用于其中的示例性系统架构图；

[0020] 图2是根据本申请的网页操作方法的一个实施例的流程图；

[0021] 图3是根据本申请的一个摄像装置的示意图；

[0022] 图4是根据本申请的网页操作方法的一个应用场景的示意图；

[0023] 图5是根据本申请的网页操作方法的又一个实施例的流程图；

[0024] 图6是根据本申请的网页操作装置的一个实施例的结构示意图；

[0025] 图7是适于用来实现本申请实施例的移动设备的计算机系统的结构示意图。

具体实施方式

[0026] 下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

[0027] 需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

[0028] 图1示出了可以应用本申请的网页操作方法或网页操作装置的示例性系统架构100。

[0029] 如图1所示，系统架构100可以包括虚拟现实设备101、网络102和移动设备103。网络102用以在虚拟现实设备101和移动设备103之间提供通信链路的介质。网络102可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

[0030] 移动设备103上可以安装有陀螺仪传感器(图中未示出)，上述陀螺仪传感器可以对上述移动设备103的旋转角度等进行测量，以得到上述移动设备103的旋转数据。上述移动设备103还可以与摄像装置相连接(图中未示出)，以接收上述摄像装置发送的图像。上述移动设备103可以安装有各种通讯客户端应用，例如网页浏览器应用。

[0031] 用户可以通过虚拟现实设备101浏览上述移动设备103中所显示的网页，也可以手持上述移动设备103进行移动、旋转等。上述移动设备103可以对用户产生的移动、旋转等操作进行分析等处理，得到处理结果(例如二维坐标)，并基于得到的处理结果对上述移动设备103中显示的网页进行操作。

[0032] 上述移动设备103可以是具有显示屏且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑等等。

[0033] 需要说明的是，本申请实施例所提供的网页操作方法一般由移动设备103执行，相应地，网页操作装置一般设置于移动设备103中。

[0034] 应该理解，图1中的移动设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的虚拟现实设备、移动设备和网络。

[0035] 继续参考图2，其示出了根据本申请的网页操作方法的一个实施例的流程200。所述的网页操作方法，包括以下步骤：

[0036] 步骤201，获取摄像装置拍摄的图像和陀螺仪传感器产生的旋转数据。

[0037] 在本实施例中，网页操作方法运行于其上的电子设备(例如图1所示的移动设备103)可以与摄像装置相连接，且上述电子设备中可以安装有陀螺仪传感器。其中，上述陀螺仪传感器可以对上述电子设备的旋转情况进行检测，并产生上述电子设备的旋转数据。上述电子设备可以获取上述摄像装置拍摄的图像以及上述陀螺仪传感器产生的旋转数据。通常，用户可以手持上述电子设备进行身体的移动和/或旋转。此时，上述电子设备进行的移动和/或旋转，可以视为用户身体的移动和/或旋转。

[0038] 在本实施例的一些可选的实现方式中，上述摄像装置可以包含预设数量(例如3个)的定位桩，每个定位桩上可以安装有用于拍摄手持上述电子设备的用户的摄像头。上述预设数量的定位桩可以安装在用户所处的空间中，用于定位用户在该空间中的位置，其中，上述空间可以是相对封闭的空间(例如房间)。需要说明的是，每个定位桩上所安装的摄像头可以采用预设帧速率(例如60帧/秒)同时对上述用户所处的空间进行拍摄，所拍摄的照片中呈现有上述用户的人像。各个摄像头每拍摄一次图像，上述电子设备可以获取各个摄像头所拍摄的图像和上述陀螺仪传感器产生的旋转数据，并执行如下步骤202-204的操作。上述摄像装置可以参见图3，图3示出了上述摄像装置的示意图300，上述摄像装置包含3个安装在用户303所处的房间内的定位桩301，每个定位桩301上安装有摄像头302，每个摄像头302用于对上述用户所处的上述房间进行拍摄。

[0039] 在本实施例的一些可选的实现方式中，上述摄像装置可以是安装在上述电子设备中的摄像头。该摄像头可以按照预设时间间隔(例如10ms)对所朝向的空间进行拍摄。该摄像头每拍摄到一次图像，上述电子设备可以获取该图像和上述陀螺仪传感器产生的旋转数据，并执行如下步骤202-204的操作。

[0040] 步骤202，对图像进行解析，生成用户在三维坐标系中的三维坐标。

[0041] 在本实施例中，在获取上述摄像装置拍摄的图像和上述陀螺仪传感器产生的旋转数据后，上述电子设备可以利用各种图像分析方法对步骤201所接收到的图像进行分析，生成手持上述电子设备的用户在三维坐标系中的三维坐标。需要说明的是，上述三维坐标系为上述电子设备所在的现实空间中以指定点作为原点而预先建立的坐标系，上述三维坐标系包含x轴、y轴、z轴。作为示例，若上述电子设备所在的现实空间是一个房间，可以指定手持上述电子设备的用户在该房间中的最初所处位置为上述指定点，上述最初所在位置可以是该房间的各个位置，例如该房间的地面的中心。

[0042] 在本实施例的一些可选的实现方式中，响应于上述摄像装置由上述预设数量的、安装有摄像头的定位桩构成，上述电子设备可以基于各个摄像头拍摄的图像中的上述用户的人像，确定上述用户在上述三维坐标系中的三维坐标。具体的，上述电子设备可以首先将从每一个摄像头获取的上述图像中的人像与预先获取的该摄像头所拍摄的上一帧图像中的人像进行比较，确定上述用户的在上述三维坐标系的位移信息。其中，上述位移信息可以是该用户在上述三维坐标系中各个坐标轴(x轴、y轴、z轴)的位移。需要说明的是，对于每一个摄像头，该摄像头所拍摄的图像中所呈现人像的位移与该用户在上述三维坐标系的实际位移的换算关系可以是技术人员基于大量试验和数据统计而预先确定的并存储于上述电子设备中。之后，上述电子设备可以基于上述位移信息和预先确定的、该用户在该上一帧图像拍摄时位于上述三维坐标系中的原始三维坐标，生成该用户在上述三维坐标系中的三维坐标。实践中，上述电子设备可以将上述原始三维坐标与该用户在上述三维坐标系中对应的坐标轴的位移相加，即将原始三维坐标的x坐标值与x轴方向的位移相加、将原始三维坐标的y坐标值与y轴方向的位移相加、将原始三维坐标的z坐标值与z轴方向的位移相)，得到该用户在上述三维坐标系中的三维坐标。

[0043] 在本实施例的一些可选的实现方式中，响应于上述摄像装置是安装在上述电子设备中的摄像头，且该摄像头所拍摄的图像中可以呈现有至少一个物体的影像。上述电子设备可以基于预先训练的图像识别模型得到上述用户在上述三维坐标系中的三维坐标。具体可以按照如下步骤执行：

[0044] 第一步，上述电子设备可以首先从步骤201接收到的图像中提取特征向量，将该特征向量输入至预先训练的图像识别模型，得到对上述至少一个物体中的各个物体的影像的识别结果。其中，上述图像识别模型可以用于表征特征向量与图像识别结果的对应关系。需要说明的是，在提取特征向量之前，上述电子设备还可以先对上述图像进行预处理(例如去噪处理、图像增强、归一化等)。需要指出的是，上述图像识别模型可以是按照如下步骤预先训练的：首先，可以将从互联网中获取的大量的照片作为训练样本，每个训练样本可以带有预先标记的、用于确定该样本中所呈现的物体的影像的识别标识；之后，采用卷积神经网络，将训练样本作为输入，将相应的识别标识作为输出，训练得到上述图像识别模型。

[0045] 第二步，对于每一个物体的影像，上述电子设备可以将该影像与预先获取的上一帧图像中的、具有相同识别结果的物体的影像进行比较，确定该物体在上述三维坐标系的位移信息。其中，该位移信息可以是该物体在上述三维坐标系中各个坐标轴(x轴、y轴、z轴)的位移。需要说明的是，上述图像中所呈现的物体的影像的位移与物体在上述三维坐标系的实际位移的换算关系可以是技术人员基于大量试验和数据统计而预先确定的并存储于上述电子设备中。

[0046] 第三步，上述电子设备可以基于各个物体在上述三维坐标系的位移信息和预先确定的、上述上一帧图像拍摄时手持上述移动设备的用户位于上述三维坐标系中的原始三维坐标，生成上述用户在上述三维坐标系中的三维坐标。具体的，上述电子设备可以首先基于各个物体在上述三维坐标系的位移信息，计算各个物体在x轴的平均位移、在y轴的平均位移、在z轴的平均位移，并将所确定的上述三个平均位移确定为手持上述电子设备的用户在上述三维坐标系中的位移信息。之后，上述电子设备可以基于所确定的该用户的在上述三维坐标系中的位移信息和预先确定的、该用户在上述上一帧图像拍摄时位于上述三维坐标系中的原始三维坐标，生成该用户在上述三维坐标系中的三维坐标。实践中，上述电子设备可以将上述原始三维坐标与该用户在上述三维坐标系中对应的坐标轴的位移相加，得到该用户在上述三维坐标系中的三维坐标。

[0047] 步骤203，将三维坐标转换为二维坐标系中的二维坐标。

[0048] 在本实施例中，上述电子设备可以根据预设的坐标转换关系，将步骤202得到的上述用户在上述三维坐标系中的三维坐标转换为二维坐标系中的二维坐标。其中，上述二维坐标系可以是基于上述移动设备的显示屏幕而预先建立的坐标系，上述显示屏幕中可以显示有网页，上述二维坐标可以为上述显示屏幕所显示的网页的坐标。实践中，可以将上述显示屏幕的左下角的顶点确定为坐标原点。通常，用户可以在虚拟现实设备(例如图1所示的虚拟现实设备101)中浏览上述网页。需要说明的是，上述坐标转换关系可以是技术人员基于各种坐标转换方法和原理(例如三维几何变换、三维坐标变换、投影理论等)预先设置的并存储于上述电子设备中。

[0049] 需要说明的是，上述坐标转换方法是目前广泛研究和应用的公知技术，在此不再赘述。

[0050] 步骤204，基于二维坐标和旋转数据，对显示屏幕中所显示的网页进行操作。

[0051] 在本实施例中，上述电子设备首先可以基于步骤201获取的旋转数据，确定上述电子设备在上述三维坐标系中的各个坐标轴的旋转角度(例如10°、-15°等)，并将所确定的各个旋转角度确定为上述用户在上述三维坐标系中相应的各个坐标轴的旋转角度。之后，上述电子设备可以基于得到的各个旋转角度以及预设的旋转角度与页面滚动幅度的转换关系，确定对上述电子设备的显示屏幕所显示的网页的滚动幅度(例如以当前网页显示界面的上下距离为基准距离，向上滚动该基准距离的10％，向下滚动该基准距离的15％等)。最后，上述电子设备可以按照所确定的滚动幅度对上述网页进行滚动，呈现滚动后的网页界面。作为示例，上述三维坐标系中的x轴是水平坐标轴，上述用户在以上述x轴为旋转轴进行旋转，可以使上述网页进行上下滚动；上述三维坐标系中的z轴是竖直坐标轴，上述用户在以上述z轴为旋转轴进行旋转，可以使上述网页进行左右滚动。需要说明的是，上述预设的旋转角度与页面滚动幅度的转换关系可以是预先设置的任意转换关系。例如，旋转角度的数值可以与滚动幅度的数值成预设比例等。

[0052] 在本实施例中，在对上述网页进行滚动后，上述电子设备还可以基于上述二维坐标，对上述电子设备的显示屏幕所显示的网页进行其他操作，例如，将光标移动到上述二维坐标所指示的位置、点击该网页中的上述二维坐标所指示的位置等。

[0053] 在本实施例的一些可选的实现方式中，上述电子设备基于上述旋转数据确定上述电子设备在上述三维坐标系中的各个坐标轴的旋转角度可以按照如下方式进行：首先，可以对上述旋转数据进行解析，生成四元数数据。实践中，上述四元数可以用于表示上述电子设备在上述三维坐标系的旋转和定向。之后，可以基于所得到的四元数确定上述电子设备在上述三维坐标系中的各个坐标轴的旋转角度。

[0054] 在本实施例的一些可选的实现方式中，上述电子设备还可以利用上述摄像装置所拍摄的图像对步骤201获取的旋转数据进行修正。具体的，上述电子设备可以将步骤201获取的图像与预先获取的上一帧图像进行比较，对比两图像所产生的针对各个旋转轴的偏差；之后，基于所得到的偏差对上述旋转数据进行修正。

[0055] 继续参见图4，图4是根据本实施例的网页操作方法的应用场景的一个示意图400。在图4的应用场景中，移动设备401与摄像装置402相连接，且上述移动设备401安装有陀螺仪传感器403。首先，上述移动设备401获取上述摄像装置402拍摄的图像404和上述陀螺仪传感器产生的数据405。之后，上述移动设备401对上述图像405进行解析，生成手持上述移动设备401的用户在三维坐标系的三维坐标。而后，上述移动设备将上述三维坐标转换为预先基于上述移动设备的显示屏幕而建立的二维坐标系中的二维坐标。最后，上述移动设备可以基于上述二维坐标和上述旋转数据405对上述显示屏幕中所显示的网页进行操作。

[0056] 本申请的上述实施例提供的方法通过对摄像装置拍摄的图像进行解析生成手持上述移动设备的用户在三维坐标系中的三维坐标，而后将三维坐标转换为二维坐标系中的二维坐标，最后基于二维坐标和陀螺仪传感器获取的旋转数据对显示屏幕中所显示的网页进行操作，从而可以实现在虚拟现实环境下对网页进行交互，提高了虚拟现实环境下的网页交互的灵活性。

[0057] 进一步参考图5，其示出了网页操作方法的又一个实施例的流程500。该网页操作方法的流程500，包括以下步骤：

[0058] 步骤501，获取摄像装置拍摄的图像和陀螺仪传感器产生的旋转数据。

[0059] 在本实施例中，网页操作方法运行于其上的电子设备(例如图1所示的移动设备103)可以与摄像装置相连接，且上述电子设备中可以安装有陀螺仪传感器。其中，上述摄像装置可以是安装在上述电子设备中的摄像头，上述陀螺仪传感器可以对上述电子设备的旋转情况进行检测，并产生上述电子设备的旋转数据。上述电子设备可以获取上述摄像装置拍摄的图像以及上述陀螺仪传感器产生的旋转数据。需要说明的是，上述图像中可以呈现有至少一个物体的影像。通常，用户可以手持上述电子设备进行身体的移动和/或旋转。此时，上述电子设备进行的移动和/或旋转，可以视为用户身体的移动和/或旋转。

[0060] 步骤502，从图像中提取特征向量，将特征向量输入至预先训练的图像识别模型，得到对上述至少一个物体中的各个物体的影像的识别结果。

[0061] 在本实施例中，上述电子设备可以首先从步骤501接收到的图像中提取特征向量，将该特征向量输入至预先训练的图像识别模型，得到对上述至少一个物体中的各个物体的影像的识别结果。其中，上述图像识别模型可以用于表征特征向量与图像识别结果的对应关系。需要说明的是，上述图像识别模型可以是按照如下步骤预先训练的：首先，可以将从互联网中获取的大量的照片作为训练样本，每个训练样本可以带有预先标记的、用于确定该样本中所呈现的物体的影像的识别标识；之后，采用卷积神经网络，将训练样本作为输入，将相应的识别标识作为输出，训练得到上述图像识别模型。

[0062] 步骤503，对于每一个物体的影像，将该影像与预先获取的上一帧图像中的、具有相同识别结果的物体的影像进行比较，确定该物体在三维坐标系的位移信息。

[0063] 在本实施例中，对于每一个物体的影像，上述电子设备可以将该影像与预先获取的上一帧图像中的、具有相同识别结果的物体的影像进行比较，确定该物体在上述三维坐标系的位移信息。其中，该位移信息可以是该物体在上述三维坐标系中各个坐标轴的位移。需要说明的是，上述图像中所呈现的物体的影像的位移与物体在上述三维坐标系的实际位移的换算关系可以是技术人员基于大量试验和数据统计而预先确定的并存储于上述电子设备中。需要指出的是，上述三维坐标系为上述电子设备所在的现实空间中以指定点作为原点而预先建立的坐标系,上述三维坐标系可以包含x轴、y轴、z轴。

[0064] 步骤504，基于各个物体的在三维坐标系的位移信息和预先确定的、上一帧图像拍摄时用户位于三维坐标系中的原始三维坐标，生成用户在三维坐标系中的三维坐标。

[0065] 在本实施例中，上述电子设备可以首先基于各个物体在上述三维坐标系的位移信息，计算各个物体在x轴的平均位移、在y轴的平均位移、在z轴的平均位移，并将所确定的上述三个平均位移确定为手持上述电子设备的用户在上述三维坐标系中的位移信息。之后，上述电子设备可以提取预先确定的、该用户在上述上一帧图像拍摄时位于上述三维坐标系中的原始三维坐标，将上述原始三维坐标与该用户在上述三维坐标系中对应的坐标轴的位移相加，得到该用户在上述三维坐标系中的三维坐标。

[0066] 步骤505，将三维坐标转换为二维坐标系中的二维坐标。

[0067] 在本实施例中，上述电子设备可以根据预设的坐标转换关系，将步骤504得到的上述用户在上述三维坐标系中的三维坐标转换为二维坐标系中的二维坐标。其中，上述二维坐标系可以是基于上述移动设备的显示屏幕而预先建立的坐标系，上述显示屏幕中可以显示有网页，上述二维坐标可以为上述显示屏幕所显示的网页的坐标。

[0068] 步骤506，基于旋转数据，对显示屏幕中所显示的网页进行滚动。

[0069] 在本实施例中，上述电子设备可以首先对上述旋转数据进行解析，生成四元数数据。而后，基于所得到的四元数确定上述电子设备在上述三维坐标系中的各个坐标轴的旋转角度，并将所确定的各个旋转角度确定为上述用户在上述三维坐标系中相应的各个坐标轴的旋转角度。之后，可以基于得到的各个旋转角度以及预设的旋转角度与页面滚动幅度的转换关系，确定对上述电子设备的显示屏幕所显示的网页的滚动幅度。最后，上述电子设备可以按照所确定的滚动幅度对上述网页进行滚动，呈现滚动后的网页界面。

[0070] 需要说明的是，上述步骤501-506的具体操作与步骤201-204的具体操作相同，在此不再赘述。

[0071] 步骤507，将显示屏幕所显示的网页中的、二维坐标所指示的位置的元素确定为目标元素，确定目标元素是否为支持点击的元素。

[0072] 在本实施例中，上述电子设备可以通过DOM(Document Object Model，文档对象模型)接口提取上述显示屏幕所显示的网页的、上述二维坐标所指示的位置的元素，将该元素确定为目标元素，并确定该目标元素是否为支持点击的元素。实践中，DOM是一种用于处理可扩展标志语言的标准编程接口，可以用于表示和修改网页所需的元素、这些元素的行为和属性以及这些元素之间的关系。元素可以用于指示以下的任意一项：导航、网站标志、广告条、装饰物、超级链接、文字、图片、音频、动画、视频等，但不限于以上列举。需要说明的是，确定上述目标元素是否为支持点击的元素可以通过以下方式进行：首先，可以提取上述目标元素中的预设属性的属性值，作为示例，上述预设属性可以是用于指示元素是否支持点击的属性(例如onClick属性)。之后，可以确定该属性值是否非空，若非空，则确定上述目标元素是支持点击的元素。

[0073] 步骤508，响应于确定目标元素是支持点击的元素，确定是否已呈现预设的、与目标元素相关联的悬浮界面。

[0074] 在本实施例中，响应于确定上述目标元素是支持点击的元素，上述电子设备可以确定当前所呈现的界面是否是预设的、与上述目标元素相关联的悬浮界面。上述悬浮界面可以各种样式的界面，作为示例，若上述目标元素指示的一个图片，则上述悬浮界面可以是预设的、在该图片上方呈现该图片的链接地址的界面；若上述目标元素指示一个链接，则上述悬浮界面可以是将该链接所呈现的颜色转换为预设颜色的界面。此处，响应于确定已呈现上述悬浮界面，可以执行步骤509；响应于未呈现上述悬浮界面，可以执行步骤511。

[0075] 步骤509，响应于确定已呈现悬浮界面，确定悬浮界面的呈现时长。

[0076] 在本实施例中，响应于步骤508确定已呈现预设的、与上述目标元素相关联的悬浮界面，上述电子设备可以确定该悬浮界面的呈现时长。

[0077] 步骤510，响应于确定呈现时长不小于预设时长阈值，触发对目标元素的点击事件，并呈现与目标元素相关联的点击界面。

[0078] 在本实施例中，上述电子设备可以确定上述呈现时长是否不小于预设时长阈值(例如3秒、5秒等)；响应于确定上述呈现时长不小于预设时长阈值，可以触发对上述目标元素的点击事件，并呈现与上述目标元素相关联的点击界面。此处，上述点击界面可以各种样式的界面。作为示例，若上述目标元素指示的一个链接，则上述点击界面可以该链接所指示的新的网页；若上述目标元素指示一个图片，则上述点击界面可以是对该图片进行放大或缩小后的界面等。

[0079] 步骤511，响应于确定未呈现悬浮界面，呈现悬浮界面。

[0080] 在本实施例中，响应于步骤508确定未呈现预设的、与上述目标元素相关联的悬浮界面，上述电子设备可以呈现上述悬浮界面。

[0081] 从图5中可以看出，与图2对应的实施例相比，本实施例中的网页操作方法的流程500突出了对基于二维坐标和旋转数据对网页执行滚动操作、点击操作、呈现悬浮界面操作的步骤。由此，本实施例描述的方案可以实现在虚拟现实环境中与网页进行多种交互，进一步提高了虚拟现实环境下的网页交互的灵活性。

[0082] 进一步参考图6，作为对上述各图所示方法的实现，本申请提供了一种网页操作装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于移动设备中，其中，该移动设备可以与摄像装置相连接，且该移动设备可以安装有陀螺仪传感器。

[0083] 如图6所示，本实施例所述的网页操作装置600可以包括：获取单元601，配置用于获取上述摄像装置拍摄的图像和上述陀螺仪传感器产生的上述移动设备的旋转数据；解析单元602，配置用于对上述图像进行解析，生成手持上述移动设备的用户在三维坐标系中的三维坐标，其中，上述三维坐标系为现实空间中以指定点作为原点而预先建立的坐标系；转换单元603，配置用于将上述三维坐标转换为二维坐标系中的二维坐标，其中，上述二维坐标系是基于上述移动设备的显示屏幕而预先建立的坐标系；操作单元604，配置用于基于上述二维坐标和上述旋转数据，对上述显示屏幕中所显示的网页进行操作。

[0084] 在本实施例中，上述网页操作装置600的获取单元601可以获取上述摄像装置拍摄的图像以及上述陀螺仪传感器产生的旋转数据。通常，用户可以手持上述移动设备进行身体的移动和/或旋转。此时，上述移动设备进行的移动和/或旋转，可以视为用户身体的移动和/或旋转。

[0085] 在本实施例中，上述解析单元602可以利用各种图像分析方法对上述图像进行分析，生成手持上述移动设备的用户在三维坐标系中的三维坐标。需要说明的是，上述三维坐标系为上述移动设备所在的现实空间中以指定点作为原点而预先建立的坐标系。

[0086] 在本实施例的一些可选的实现方式中，上述图像中可以呈现有手持上述移动设备的用户的人像；以及上述解析单元602可以包括第一比较模块和第一生成模块(图中未示出)。其中，上述第一比较模块可以配置用于将上述图像中的人像与预先获取的上一帧图像中的人像进行比较，确定上述用户的在上述三维坐标系的位移信息。上述第一生成模块可以配置用于基于上述位移信息和预先确定的、上述用户在上述上一帧图像拍摄时位于上述三维坐标系中的原始三维坐标，生成上述用户在上述三维坐标系中的三维坐标。

[0087] 在本实施例的一些可选的实现方式中，上述摄像装置可以安装在上述移动设备中，上述图像可以呈现有至少一个物体的影像；以及上述解析单元602可以包括第一提取模块、第二比较模块和第二生成模块(图中未示出)。其中，上述第一提取模块可以配置用于从上述图像中提取特征向量，将上述特征向量输入至预先训练的图像识别模型，得到对上述至少一个物体中的各个物体的影像的识别结果，其中，上述图像识别模型用于表征特征向量与识别结果的对应关系。上述第二比较模块可以配置用于对于每一个物体的影像，将该影像与预先获取的上一帧图像中的、具有相同识别结果的物体的影像进行比较，确定该物体在上述三维坐标系的位移信息。上述第二生成模块可以配置用于基于各个物体的在上述三维坐标系的位移信息和预先确定的、上述上一帧图像拍摄时手持上述移动设备的用户位于上述三维坐标系中的原始三维坐标，生成上述用户在上述三维坐标系中的三维坐标。

[0088] 在本实施例中，上述转换单元603可以根据预设的坐标转换关系，将上述用户在上述三维坐标系中的三维坐标转换为二维坐标系中的二维坐标。其中，上述二维坐标系可以是基于上述移动设备的显示屏幕而预先建立的坐标系。

[0089] 在本实施例中，上述操作单元604可以上述旋转数据，确定上述移动设备在上述三维坐标系中的各个坐标轴的旋转角度，并将所确定的各个旋转角度确定为上述用户在上述三维坐标系中相应的各个坐标轴的旋转角度。之后，可以基于得到的各个旋转角度以及预设的旋转角度与页面滚动幅度的转换关系，确定对上述移动设备的显示屏幕所显示的网页的滚动幅度。最后，可以按照所确定的滚动幅度对上述网页进行滚动，呈现滚动后的网页界面。

[0090] 在本实施例中，在对上述网页进行滚动后，上述操作单元604还可以基于上述二维坐标，对上述移动设备的显示屏幕所显示的网页进行其他操作，例如，将光标移动到上述二维坐标所指示的位置、点击该网页中的上述二维坐标所指示的位置等。

[0091] 在本实施例的一些可选的实现方式中，上述操作单元604可以包括第二提取模块、第一确定模块、第二确定模块和触发模块(图中未示出)。其中，上述第二提取模块可以配置用于将上述显示屏幕所显示的网页中的、上述二维坐标所指示的位置的元素确定为目标元素，确定上述目标元素是否为支持点击的元素。上述第一确定模块可以配置用于响应于确定上述目标元素是支持点击的元素，确定是否已呈现预设的、与上述目标元素相关联的悬浮界面。上述第二确定模块可以配置用于响应于确定已呈现上述悬浮界面，确定上述悬浮界面的呈现时长。上述触发模块可以配置用于响应于确定上述呈现时长不小于预设时长阈值，触发对上述目标元素的点击事件，并呈现与上述目标元素相关联的点击界面。

[0092] 在本实施例的一些可选的实现方式中，上述操作单元604可以包括呈现模块(图中未示出)。其中，上述呈现模块可以配置用于响应于确定未呈现上述悬浮界面，呈现上述悬浮界面。

[0093] 在本实施例的一些可选的实现方式中，上述操作单元604可以包括解析模块和滚动模块(图中未示出)。其中，上述解析模块可以配置用于对上述旋转数据进行解析，生成四元数数据。上述滚动模块可以配置用于基于上述四元数数据，对上述显示屏幕中所显示的网页进行滚动。

[0094] 本申请的上述实施例提供的装置，通过解析单元602对获取单元601获取的图像进行解析生成手持上述移动设备的用户在三维坐标系中的三维坐标，而后转换单元603将三维坐标转换为二维坐标系中的二维坐标，最后操作单元604基于二维坐标和获取单元601从陀螺仪传感器获取的旋转数据对显示屏幕中所显示的网页进行操作，从而可以实现在虚拟现实环境下对网页进行交互，提高了虚拟现实环境下的网页交互的灵活性。

[0095] 下面参考图7，其示出了适于用来实现本申请实施例的移动设备的计算机系统700的结构示意图。图7示出的移动设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

[0096] 如图7所示，计算机系统700包括中央处理单元(CPU)701，其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中，还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

[0097] 以下部件连接至I/O接口705：包括触摸屏、触摸板等的输入部分706；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707；包括硬盘等的存储部分708；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器710上，以便于从其上读出的计算机程序根据需要被安装入存储部分708。

[0098] 特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分709从网络上被下载和安装，和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时，执行本申请的方法中限定的上述功能。需要说明的是，本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。
计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

[0099] 附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

[0100] 描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括获取单元、解析单元、转换单元和操作单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，获取单元还可以被描述为“获取图像和旋转数据的单元”。

[0101] 作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该装置执行时，使得该装置：获取摄像装置拍摄的图像和陀螺仪传感器产生的该移动设备的旋转数据；对该图像进行解析，生成手持该移动设备的用户在三维坐标系中的三维坐标；将该三维坐标转换为二维坐标系中的二维坐标；基于该二维坐标和该旋转数据，对该显示屏幕中所显示的网页进行操作。

[0102] 以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

网页操作方法和装置转让专利

申请号 : CN201710130629.1

文献号 : CN106919260B

文献日 : 2020-03-13

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 李晓男 , 王阳

申请人 : 百度在线网络技术(北京)有限公司

摘要 :

权利要求 :

说明书 :