一种旅游数据分析系统及方法转让专利

申请号 : CN201811452341.7

文献号 : CN109697214B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈晓雨荣雪芳王思亮刘畅

申请人 : 武汉烽火众智数字技术有限责任公司

摘要 :

本发明提供了一种旅游数据分析系统及方法,系统包括:数据采集模块,用于采集各类景区数据;数据存储模块,用于对各类景区数据进行分类存储;数据分析模块,用于建立游客身份信息库、车辆信息库和游客消费信息库;生成游客轨迹数据、景区区域热度分布数据、景区口碑指数和游客评论数据;对游客身份信息库、游客轨迹数据、游客评论数据以及游客消费信息库进行多源数据融合,得到游客画像数据;用景区口碑指数、景区区域热度分布数据和游客画像数据生成景区决策数据;对外接口模块,用于采用接口访问方式对外提供所获取的各类数据。应用本发明实施例,提高了旅游数据分析的效率和准确率。

权利要求 :

1.一种旅游数据分析系统,其特征在于,系统包括数据采集模块、数据存储模块、数据分析模块和对外接口模块,其中,数据采集模块,用于采集各类景区数据,将各类景区数据发送给数据存储模块,其中,各类景区数据包括环境数据、天气数据、舆情数据、在线旅行社数据、车辆数据、视频数据和游客数据;

数据存储模块,用于接收各类景区数据,对各类景区数据进行分类存储;

数据分析模块,用于从数据存储模块获取游客数据、视频数据、车辆数据、舆情数据和在线旅行社数据;从游客数据中提取预设身份字段的字段值,用所提取预设身份字段的字段值建立游客身份信息库;基于视频数据生成游客轨迹数据和景区区域热度分布数据;基于车辆数据建立车辆信息库;基于舆情数据生成景区口碑指数和游客评论数据;并从在线旅行社数据中提取预设消费字段的字段值,用所提取预设消费字段的字段值建立游客消费信息库;对游客身份信息库、游客轨迹数据、游客评论数据以及游客消费信息库进行多源数据融合,得到游客画像数据;用景区口碑指数、景区区域热度分布数据和游客画像数据生成景区决策数据;

对外接口模块,用于从数据存储模块获取环境数据和天气数据,从数据分析模块获取游客身份信息库、车辆信息库、游客轨迹数据、景区区域热度分布数据、景区口碑指数、游客消费信息库、游客画像数据和景区决策数据,采用接口访问方式对外提供所获取的各类数据。

2.根据权利要求1的系统,其特征在于,系统还包括日志监控模块;

日志监控模块,用于获得数据采集模块、数据存储模块、数据分析模块和对外接口模块的运行数据;并用所获得的运行数据生成运行报表,每隔预设时长或每到达预设时间点将运行报表发送给管理终端;运行数据包括运行时长、存储容量、运行状况以及用户操作记录中的至少一种。

3.根据权利要求1的系统,其特征在于,数据采集模块包括:

停车场卡口,用于采集车辆数据;车辆数据包括空余车位总数及已使用车位总数、进出车辆的车辆图像、进出时间、进出通道、停车区域和停车费用;

第一摄像头,用于采集景区入口的视频数据;

第二摄像头,用于采集景区内的视频数据;

票务闸机,用于采集进出景区的游客数据;游客数据包括游客总数、游客进出时间、入园认证方式、游客身份证信息;

环境监测器,用于采集景区内的环境数据,环境数据包括温度、湿度、PM2.5、气压、噪音、风向、风力中的至少一种;

互联网数据采集子模块,用于从互联网抓取天气数据、舆情数据和在线旅行社数据;天气数据包括实时天气数据、未来24小时天气预报数据和未来15日天气预报数据,舆情数据包括从互联网抓取的包含预设景区关键字的内容;在线旅行社数据包括购票消费数据、住宿消费数据、出行消费数据。

4.根据权利要求3的系统,其特征在于,数据存储模块对各类景区数据进行分类存储,具体为:将空余车位总数存储至停车场统计信息表、将进出车辆的车辆图像、进出时间、进出通道、停车区域和停车费用存储至停车场出入信息表;将已使用车位总数存储至停车场实时使用表;

将视频数据标准化处理成预设格式,将标准化处理后的视频数据存储至视频数据表;

将游客数据存储至游客画像表;将环境数据存储至环境数据采集表;将从互联网抓取的天气数据存储至天气预测分析表;将在线旅行社数据存储至景区运营分析表;将舆情数据存储至舆情分析表。

5.根据权利要求3的系统,其特征在于,

票务闸机,还用于采集自身的设备信息,将所采集的设备信息发送给数据存储模块;

数据存储模块,还用于接收票务闸机的设备信息,并将其存储至票务闸机状态表。

6.根据权利要求4的系统,其特征在于,系统还包括数据管理模块,

数据管理模块,用于接收用户操作指令,按照用户操作指令对数据存储模块中数据库表数据进行管理。

7.根据权利要求1的系统,其特征在于,预设身份字段包括游客来源地、性别、年龄中的至少一种。

8.根据权利要求1的系统,其特征在于,数据采集模块包括设置在景区入口的第一摄像头、票务闸机,设置在景区内的各第二摄像头;数据分析模块基于视频数据生成游客轨迹数据和景区区域热度分布数据,具体为:识别第一摄像头所采集的视频数据中的入园游客图像,将入园游客图像与票务闸机采集的游客数据一一对应;

针对每一入园游客图像,提取该入园游客图像在各第二摄像头所采集的视频数据中所出现的时间和地点,将该入园游客图像所对应的游客数据与所提取的时间和地点合并,得到该入园游客图像所表征的游客在景区内的游客轨迹数据;

利用各第二摄像头所采集的视频数据,统计景区内各区域的总人数,生成景区区域热度分布数据。

9.根据权利要求1的系统,其特征在于,数据分析模块基于舆情数据生成景区口碑指数,具体为:用预先设定的关键字词典对舆情数据中的每条数据进行评价;

获得每条数据的评价结果;评价结果包括正面舆情数据、负面舆情数据和中性舆情数据;

计算每个评价结果对应的评分值之和,作为景区口碑指数;其中,正面舆情数据、负面舆情数据和中性舆情数据所属评价结果所对应的评分值分别为第一预设值、第二预设值和第三预设值。

10.一种旅游数据分析方法,其特征在于,方法包括:

采集各类景区数据,其中,各类景区数据包括环境数据、天气数据、舆情数据、在线旅行社数据、车辆数据、视频数据和游客数据;

对各类景区数据进行分类存储;

获取已存储的游客数据、视频数据、车辆数据、舆情数据和在线旅行社数据;从游客数据中提取预设身份字段的字段值,用所提取预设身份字段的字段值建立游客身份信息库;

基于视频数据生成游客轨迹数据和景区区域热度分布数据;基于车辆数据建立车辆信息库;基于舆情数据生成景区口碑指数和游客评论数据;并从在线旅行社数据中提取预设消费字段的字段值,用所提取预设消费字段的字段值建立游客消费信息库;对游客身份信息库、游客轨迹数据、游客评论数据以及游客消费信息库进行多源数据融合,得到游客画像数据;用景区口碑指数、景区区域热度分布数据和游客画像数据生成景区决策数据;

获取已存储的环境数据和天气数据,并获取分析所得的游客身份信息库、车辆信息库、游客轨迹数据、景区区域热度分布数据、景区口碑指数、游客消费信息库、游客画像数据和景区决策数据,采用接口访问方式对外提供所获取的各类数据。

说明书 :

一种旅游数据分析系统及方法

技术领域

[0001] 本发明涉及智慧旅游技术领域,尤其涉及一种旅游数据分析系统及方法。

背景技术

[0002] 随着大众旅游时代的到来,越来越多的人选择出门旅游来放松心情。为了旅游产业的发展及提升,需要对旅游数据进行分析。旅游数据可以包括游客属性(例如游客出行方式、来源地分布等)、游客行为(旅游消费占比、出游时间等)、游客评论、住宿、餐饮等方面。传统分析方法,往往是采用人工统计、问卷调查等方式分析旅游数据,导致分析效率不高,并且由于旅游数据的获取往往存在较大难度和误差,导致分析结果准确率不高。
[0003] 因此有必要设计一种新的旅游数据分析系统及方法,以克服上述问题。

发明内容

[0004] 本发明的目的在于克服现有技术之缺陷,提供了一种旅游数据分析系统及方法,以实现提高旅游数据分析的效率和准确率。
[0005] 本发明是这样实现的:
[0006] 第一方面,本发明提供一种旅游数据分析系统,系统包括数据采集模块、数据存储模块、数据分析模块和对外接口模块,其中,
[0007] 数据采集模块,用于采集各类景区数据,将各类景区数据发送给数据存储模块,其中,各类景区数据包括环境数据、天气数据、舆情数据、在线旅行社数据、车辆数据、视频数据和游客数据;
[0008] 数据存储模块,用于接收各类景区数据,对各类景区数据进行分类存储;
[0009] 数据分析模块,用于从数据存储模块获取游客数据、视频数据、车辆数据、舆情数据和在线旅行社数据;从游客数据中提取预设身份字段的字段值,用所提取预设身份字段的字段值建立游客身份信息库;基于视频数据生成游客轨迹数据和景区区域热度分布数据;基于车辆数据建立车辆信息库;基于舆情数据生成景区口碑指数和游客评论数据;并从在线旅行社数据中提取预设消费字段的字段值,用所提取预设消费字段的字段值建立游客消费信息库;对游客身份信息库、游客轨迹数据、游客评论数据以及游客消费信息库进行多源数据融合,得到游客画像数据;用景区口碑指数、景区区域热度分布数据和游客画像数据生成景区决策数据;
[0010] 对外接口模块,用于从数据存储模块获取环境数据和天气数据,从数据分析模块获取游客身份信息库、车辆信息库、游客轨迹数据、景区区域热度分布数据、景区口碑指数、游客消费信息库、游客画像数据和景区决策数据,采用接口访问方式对外提供所获取的各类数据。
[0011] 可选的,系统还包括日志监控模块;
[0012] 日志监控模块,用于获得数据采集模块、数据存储模块、数据分析模块和对外接口模块的运行数据;并用所获得的运行数据生成运行报表,每隔预设时长或每到达预设时间点将运行报表发送给管理终端;运行数据包括运行时长、存储容量、运行状况以及用户操作记录中的至少一种。
[0013] 可选的,数据采集模块包括:
[0014] 停车场卡口,用于采集车辆数据;车辆数据包括空余车位总数及已使用车位总数、进出车辆的车辆图像、进出时间、进出通道、停车区域和停车费用;
[0015] 第一摄像头,用于采集景区入口的视频数据;
[0016] 第二摄像头,用于采集景区内的视频数据;
[0017] 票务闸机,用于采集进出景区的游客数据;游客数据包括游客总数、游客进出时间、入园认证方式、游客身份证信息;
[0018] 环境监测器,用于采集景区内的环境数据,环境数据包括温度、湿度、PM2.5、气压、噪音、风向、风力中的至少一种;
[0019] 互联网数据采集子模块,用于从互联网抓取天气数据、舆情数据和在线旅行社数据;天气数据包括实时天气数据、未来24小时天气预报数据和未来15日天气预报数据,舆情数据包括从互联网抓取的包含预设景区关键字的内容;在线旅行社数据包括购票消费数据、住宿消费数据、出行消费数据。
[0020] 可选的,数据存储模块对各类景区数据进行分类存储,具体为:
[0021] 将空余车位总数存储至停车场统计信息表、将进出车辆的车辆图像、进出时间、进出通道、停车区域和停车费用存储至停车场出入信息表;将已使用车位总数存储至停车场实时使用表;
[0022] 将视频数据标准化处理成预设格式,将标准化处理后的视频数据存储至视频数据表;
[0023] 将游客数据存储至游客画像表;将环境数据存储至环境数据采集表;将从互联网抓取的天气数据存储至天气预测分析表;将在线旅行社数据存储至景区运营分析表;将舆情数据存储至舆情分析表。
[0024] 可选的,票务闸机,还用于采集自身的设备信息,将所采集的设备信息发送给数据存储模块;
[0025] 数据存储模块,还用于接收票务闸机的设备信息,并将其存储至票务闸机状态表。
[0026] 可选的,系统还包括数据管理模块,
[0027] 数据管理模块,用于接收用户操作指令,按照用户操作指令对数据存储模块中数据库表数据进行管理。
[0028] 可选的,预设身份字段包括游客来源地、性别、年龄中的至少一种。
[0029] 可选的,数据采集模块包括设置在景区入口的第一摄像头、票务闸机,设置在景区内的各第二摄像头;数据分析模块基于视频数据生成游客轨迹数据和景区区域热度分布数据,具体为:
[0030] 识别第一摄像头所采集的视频数据中的入园游客图像,将入园游客图像与票务闸机采集的游客数据一一对应;
[0031] 针对每一入园游客图像,提取该入园游客图像在各第二摄像头所采集的视频数据中所出现的时间和地点,将该入园游客图像所对应的游客数据与所提取的时间和地点合并,得到该入园游客图像所表征的游客在景区内的游客轨迹数据;
[0032] 利用各第二摄像头所采集的视频数据,统计景区内各区域的总人数,生成景区区域热度分布数据。
[0033] 可选的,数据分析模块基于舆情数据生成景区口碑指数,具体为:
[0034] 用预先设定的关键字词典对舆情数据中的每条数据进行评价;
[0035] 获得每条数据的评价结果;评价结果包括正面舆情数据、负面舆情数据和中性舆情数据;
[0036] 计算每个评价结果对应的评分值之和,作为景区口碑指数;其中,正面舆情数据、负面舆情数据和中性舆情数据所属评价结果所对应的评分值分别为第一预设值、第二预设值和第三预设值。
[0037] 第二方面,本发明提供一种旅游数据分析方法,方法包括:
[0038] 采集各类景区数据,其中,各类景区数据包括环境数据、天气数据、舆情数据、在线旅行社数据、车辆数据、视频数据和游客数据;
[0039] 对各类景区数据进行分类存储;
[0040] 获取已存储的游客数据、视频数据、车辆数据、舆情数据和在线旅行社数据;从游客数据中提取预设身份字段的字段值,用所提取预设身份字段的字段值建立游客身份信息库;基于视频数据生成游客轨迹数据和景区区域热度分布数据;基于车辆数据建立车辆信息库;基于舆情数据生成景区口碑指数和游客评论数据;并从在线旅行社数据中提取预设消费字段的字段值,用所提取预设消费字段的字段值建立游客消费信息库;对游客身份信息库、游客轨迹数据、游客评论数据以及游客消费信息库进行多源数据融合,得到游客画像数据;用景区口碑指数、景区区域热度分布数据和游客画像数据生成景区决策数据;
[0041] 获取已存储的环境数据和天气数据,并获取分析所得的游客身份信息库、车辆信息库、游客轨迹数据、景区区域热度分布数据、景区口碑指数、游客消费信息库、游客画像数据和景区决策数据,采用接口访问方式对外提供所获取的各类数据。
[0042] 本发明具有以下有益效果:应用本发明实施例提供的技术方案,可以采集各类景区数据,并对各类景区数据进行分类存储,进而可以统一从数据存储模块获取各类景区数据,保证了原始数据的完整性和持久性,通过对游客身份信息库、游客轨迹数据、游客评论数据以及游客消费信息库进行多源数据融合,可以得到游客画像数据,并可以用景区口碑指数、景区区域热度分布数据和游客画像数据生成景区决策数据,实现了对景区数据的融合分析,获得了对景区发展有利的景区决策数据,并且整个过程无需人工获取数据,提高了旅游数据分析的效率和准确率,通过对外提供数据访问接口,便于其他系统获取所需的数据,提高了分析结果的利用率。

附图说明

[0043] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0044] 图1为本发明实施例提供的一种旅游数据分析系统的结构示意图;
[0045] 图2为本发明实施例提供的一种旅游数据分析方法的流程示意图。

具体实施方式

[0046] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0047] 为解决现有技术问题,本发明实施例提供了一种旅游数据分析系统及方法。下面首先对本发明所提供的一种旅游数据分析系统进行说明。
[0048] 参见图1,图1为本发明实施例提供的一种基于旅游数据分析系统的结构示意图,系统包括数据采集模块、数据存储模块、数据分析模块和对外接口模块,其中,
[0049] 数据采集模块,用于采集各类景区数据,将各类景区数据发送给数据存储模块,其中,各类景区数据包括环境数据、天气数据、舆情数据、在线旅行社数据、车辆数据、视频数据和游客数据;
[0050] 数据存储模块,用于接收各类景区数据,对各类景区数据进行分类存储;
[0051] 数据分析模块,用于从数据存储模块获取游客数据、视频数据、车辆数据、舆情数据和在线旅行社数据;从游客数据中提取预设身份字段的字段值,用所提取预设身份字段的字段值建立游客身份信息库;基于视频数据生成游客轨迹数据和景区区域热度分布数据;基于车辆数据建立车辆信息库;基于舆情数据生成景区口碑指数和游客评论数据;并从在线旅行社数据中提取预设消费字段的字段值,用所提取预设消费字段的字段值建立游客消费信息库;对游客身份信息库、游客轨迹数据、游客评论数据以及游客消费信息库进行多源数据融合,得到游客画像数据;用景区口碑指数、景区区域热度分布数据和游客画像数据生成景区决策数据;
[0052] 对外接口模块,用于从数据存储模块获取环境数据和天气数据,从数据分析模块获取游客身份信息库、车辆信息库、游客轨迹数据、景区区域热度分布数据、景区口碑指数、游客消费信息库、游客画像数据和景区决策数据,采用接口访问方式对外提供所获取的各类数据。
[0053] 一种实现方式中,数据采集模块包括:
[0054] 停车场卡口,用于采集车辆数据;车辆数据包括空余车位总数及已使用车位总数、进出车辆的车辆图像、进出时间、进出通道、停车区域和停车费用;
[0055] 第一摄像头,用于采集景区入口的视频数据;
[0056] 第二摄像头,用于采集景区内的视频数据;
[0057] 票务闸机,用于采集进出景区的游客数据;游客数据包括游客总数、游客进出时间、入园认证方式、游客身份证信息;
[0058] 环境监测器,用于采集景区内的环境数据,环境数据包括温度、湿度、PM2.5、气压、噪音、风向、风力中的至少一种;
[0059] 互联网数据采集子模块,用于从互联网抓取天气数据、舆情数据和在线旅行社数据;天气数据包括实时天气数据、未来24小时天气预报数据和未来15日天气预报数据,舆情数据包括从互联网抓取的包含预设景区关键字的内容;在线旅行社数据包括购票消费数据、住宿消费数据、出行消费数据。
[0060] 停车场卡口可以有一个或多个,设置于停车场出入口和停车场内部,每一停车场卡口可以包括摄像头、检测线圈、车辆检测器、摄像机和计算服务终端等设备,对于经过停车场卡口的每台车辆,设置于停车场出入口的停车场卡口可以采集该车辆的车辆图像和进出时间,并可以统计空余车位总数及已使用车位总数,计算各车辆的停车费用;设置于停车场内部的停车场卡口可以采集进出通道和停车区域。
[0061] 第一摄像头和第二摄像头均可以有多个,各第一摄像头可以设置于景区入口,各第二摄像头可以高点监控景区内的情况,采集景区内的视频数据。本发明对第一摄像头和第二摄像头的型号不做限定,可以为单目或双目摄像头。
[0062] 票务闸机设置于景区入口和出口,每个待进入/待出景区的游客都可以通过票务闸机验证购票信息,通过验证的游客可以进入/离开景区,进入景区的入园认证方式包括票据二维码认证、人脸认证、身份证认证、指纹认证等等。票务闸机可以采集通过验证的每个游客的游客进出时间、入园认证方式、游客身份证信息,并可以统计进入景区的游客总数等等,用所得的信息组成游客数据。
[0063] 环境监测器设置于景区内,可以采集景区内的环境数据。本发明对环境监测器的型号不做限定,可以为任何具有环境监测功能的装置,环境数据包括温度、湿度、PM2.5、气压、噪音、风向、风力等中的至少一种。
[0064] 互联网数据采集子模块可以是具有数据抓取功能的服务器或安装有数据抓取软件的数据抓取终端;互联网数据采集子模块可以从提供天气预测的网页中抓取天气数据,天气数据包括实时天气数据、未来24小时天气预报数据和未来7日/15日/30日天气预报数据等,可以从多个网页抓取天气数据,使天气数据更加全面。舆情数据可以来自于百度、新浪等提供数据搜索功能的搜索引擎,也可以来自于各具有用户评论功能的网页。预设景区关键字可以根据需求事先设定,可以为景区名字、景区内的景点名字和/或景区内的特色景致等等。在线旅行社(Online Travel Agency,简称OTA)可以提供在线旅行社数据,可以从各个在线旅行社抓取在线旅行社数据。在线旅行社数据包括购票消费数据、住宿消费数据、出行消费数据、旅行方式、游玩路线数据等等。
[0065] 数据采集模块在采集到各类景区数据后,可以将各类景区数据发送给数据存储模块,数据存储模块对各类景区数据进行分类存储,具体可以为:
[0066] 将空余车位总数存储至停车场统计信息表、将进出车辆的车辆图像、进出时间、进出通道、停车区域和停车费用存储至停车场出入信息表;将已使用车位总数存储至停车场实时使用表;
[0067] 将视频数据标准化处理成预设格式,将标准化处理后的视频数据存储至视频数据表;
[0068] 将游客数据存储至游客画像表;将环境数据存储至环境数据采集表;将从互联网抓取的天气数据存储至天气预测分析表;将在线旅行社数据存储至景区运营分析表;将舆情数据存储至舆情分析表。
[0069] 数据存储模块可以为具有数据存储功能的服务器或服务器集群,数据存储模块内部署有一个或多个数据库,各数据库的类型可以相同也可以不同,可以在数据库内可以事先构建停车场统计信息表、停车场出入信息表、停车场实时使用表、视频数据表、游客画像表、环境数据采集表、天气预测分析表、景区运营分析表和舆情分析表等数据表,分别用于不同类型的景区数据,实现对景区数据的分类存储。
[0070] 可以将不同厂家、不同型号的第一摄像头和第二摄像头所采集的视频数据均标准化处理成统一的视频格式,然后进行存储,从而便于其他模块的读取。预设格式可以根据需求事先设定,可以为AVI(Audio Video Interleaved,音频视频交错)格式、ASF(Advanced Streaming format,高级流格式),FLV(FLASH VIDEO)等等。
[0071] 又一种实现方式中,票务闸机,还用于采集自身的设备信息,将所采集的设备信息发送给数据存储模块;
[0072] 数据存储模块,还用于接收票务闸机的设备信息,并将其存储至票务闸机状态表。
[0073] 票务闸机的设备信息可以包括票务闸机的运行数据、设备型号、设备编号和设备位置等信息。票务闸机状态表是事先构建的一张数据表,主要用于存储各票务闸机的设备信息。
[0074] 预设身份字段包括游客来源地、性别、年龄中的至少一种。数据分析模块可以从游客数据中提取游客来源地、性别、年龄等字段的字段值,用所提取各字段的字段值建立游客身份信息库;并可以对车辆数据中的车辆图像进行识别,得到来访车辆的车牌号和车型信息,并根据车牌号确定车辆来源地,用车牌号、车型信息和车辆来源地建立车辆信息库。
[0075] 预设消费字段可以包括购票、酒店、出行等消费字段中的至少一种,数据分析模块可以从在线旅行社数据中提取购票、酒店、出行等消费字段的字段值,用所提取各消费字段的字段值建立游客消费信息库;
[0076] 游客身份信息库、车辆信息库和游客消费数据库均可以是数据库,三者分别用于存储游客身份相关信息、车辆相关信息和游客消费相关信息。另外,三者的数据库类型可以相同,也可以不同。
[0077] 数据采集模块包括设置在景区入口的第一摄像头、票务闸机,设置在景区内的各第二摄像头;数据分析模块基于视频数据生成游客轨迹数据和景区区域热度分布数据,具体为:
[0078] 识别第一摄像头所采集的视频数据中的入园游客图像,将入园游客图像与票务闸机采集的游客数据一一对应;
[0079] 针对每一入园游客图像,提取该入园游客图像在各第二摄像头所采集的视频数据中所出现的时间和地点,将该入园游客图像所对应的游客数据与所提取的时间和地点合并,得到该入园游客图像所表征的游客在景区内的游客轨迹数据;
[0080] 利用各第二摄像头所采集的视频数据,统计景区内各区域的总人数,生成景区区域热度分布数据。
[0081] 游客轨迹数据可以包含时间、地点和游客数据,表明该游客数据所标识的游客在景区内出现的时间的地点。景区区域热度分布数据可以反映景区各区域的人气热度,某个区域内出现过的人越多,表明该区域的人气热度越高。利用各第二摄像头所采集的视频数据,统计景区内各区域的总人数,具体可以为:每个固定时间段,针对每一区域,获得设置于该区域的第二摄像头采集的视频数据,统计该视频数据内不同的人脸图像的总数,作为该区域该时间段的总人数。固定时间段可以事先设置,例如可以是每间隔两小时、三小时等等。
[0082] 各第二摄像头可以设置于景区内的不同区域,并可以将第二摄像头设置于景区内的高点,以实现高点监控,便于更全面的采集区域内的情况。另外第一摄像头和第二摄像头均可以是高清摄像头,以使采集所得的视频数据的画面更加清晰。
[0083] 票务闸机可以在游客每次验证通过后,启动第一摄像头采集该游客的入园游客图像,或者第一摄像头可以一直处于采集状态,从而得到视频数据,对视频数据进行人脸识别,可以得到入园游客图像;或者,可以是游客数据分析模块对视频数据进行人脸识别,可以得到入园游客图像,并可以获得各游客进入景区的时间,从而可以将该时间内同步采集到的入园游客图像与该游客的游客数据对应,实现了游客的人脸图像与身份证信息的绑定。
[0084] 各第二摄像头可以采集视频数据,将所采集的视频数据与各入园游客图像进行人脸比对,从而提取该入园游客图像在各第二摄像头所采集的视频数据中所出现的时间和地点,形成游客轨迹,并可以统计比对成功的入园游客图像的总数作为景区内各区域的总人数,从而生成区域热度分布。
[0085] 数据分析模块基于舆情数据生成景区口碑指数,具体可以为:
[0086] 用预先设定的关键字词典对舆情数据中的每条数据进行评价;
[0087] 获得每条数据的评价结果;评价结果包括正面舆情数据、负面舆情数据和中性舆情数据;
[0088] 计算每个评价结果对应的评分值之和,作为景区口碑指数;其中,正面舆情数据、负面舆情数据和中性舆情数据所属评价结果所对应的评分值分别为第一预设值、第二预设值和第三预设值。
[0089] 关键字词典可以是预先设置的关键字列表或关键词数据库,用于存储关键字,关键字词典可以包括预设正面关键字集合、预设负面关键字集合和预设中性关键字集合。预设正面关键字集合用于存储能够表达赞扬景区的关键字;预设负面关键字集合用于存储能够表达贬低景区的关键字;预设中性关键字集合用于存储能够表达既不赞扬也不贬低景区的关键字。
[0090] 针于舆情数据中的每条数据,均可以用预先设定的关键字词典对其进行评价,得到该条数据属于正面舆情数据、负面舆情数据或中性舆情数据的评价结果,具体过程可以为:分别用预设正面关键字集合、预设负面关键字集合和预设中性关键字集合匹配该条数据,得到该条数据分别成功匹配预设正面关键字集合、预设负面关键字集合的次数;用最大次数所属的集合所对应的评价结果作为该条数据的评价结果。预设正面关键字集合、预设负面关键字集合和预设中性关键字集合对应的评价结果分别为正面舆情数据、负面舆情数据或中性舆情数据。
[0091] 第一预设值、第二预设值和第三预设值可以事先设定,第一预设值可以大于第三预设值,第三预设值可以大于第二预设值,例如,第一预设值可以为正数,第二预设值可以为负数,第三预设值可以为零。
[0092] 数据分析模块基于舆情数据生成游客评论数据可以为:确定舆情数据中每条数据的发布者,判断发布者中是否存在游客数据所标识的游客,若存在,将该发布者的数据作为游客评论数据。
[0093] 游客画像数据是指通过大数据分析处理所得的游客属性。游客画像数据能够形象地描述出游客的“性别”、“年龄”、“来源地”、“出行方式”、“新老客户”、“爱好”等属性,能够通过游客画像数据更生动形象的描述出游客特点,完成对旅游数据的分析处理,为景区所营销、服务等决策提供数据支撑。
[0094] 另外,数据分析模块可以用景区口碑指数、景区区域热度分布数据和游客画像数据生成景区决策数据,景区决策数据可以为旅游路线提示信息、最佳游览路线等等。例如,生成景区决策数据,可以包括:
[0095] 对景区口碑指数、景区区域热度分布数据和游客画像数据进行智能分析处理,统计游客数据中各年龄段的游客数量,以及各年龄段的消费总数和旅行方式以及景区内各区域各年龄段出现的人数,生成旅游区域提示信息,该旅游区域提示信息用于提示各年龄段游客可参观的景区内优选区域,并可以统计不同性别、不同年龄、不同区域的游客游玩路线,生成旅游路线提示信息,该旅游路线提示信息用于分性别的提示各年龄段的游客达到待参观区域的旅游路线,为景区运营决策提供了数据支撑。
[0096] 或者,还可以包括:从舆情数据的游客评论数据中提取游客对景区内景点的评价;从OTA数据中分析游客对景区内景点的游记,提取游客对景点的评价及游客推荐路线;结合景区的视频数据生成的游客轨迹及区域热度,生成最佳游览路线及在区域人流量过大时的备选游客分流游览路线。
[0097] 应用本发明实施例,能够了解不同性别、不同年龄、不同区域的游客游玩路线、消费、旅行方式等习惯,实现了分析出对景区运营、管理、营销有价值的数据。
[0098] 对外接口模块可以通过HTTP REST API方式对外提供访问接口,以使其他系统(例如数据视觉化展现系统)或第三方开发者提供访问所获取的各类数据的途径。HTTP REST API是一种接口方式,REST(Representational State Transfer)用来描述创建HTTP API的标准方法的,HTTP(HyperText Transfer Protocol,超文本传输协议)是互联网上应用最为广泛的一种网络协议,API(Application Programming Interface,应用程序界面)是用来描述一个类库的特征或是如何运用类库的方法,对外接口模块可以包括:
[0099] 游客信息接口子模块,用于对外提供游客身份信息库,游客身份信息库包括游客身份证号、游客来源地、性别、年龄等;
[0100] 游客轨迹接口子模块,用于对外提供景区内的游客轨迹数据以及景区区域热度分布数据;
[0101] 车辆接口子模块,用于对外提供车辆信息库,车辆信息库包括来访车辆的车牌、车辆来源地及车型信息;
[0102] 舆情接口子模块,用于对外提供景区口碑指数;
[0103] OTA接口子模块,用于对外提供游客消费信息库,游客消费信息库包括游客的购票、酒店、出行等消费数据;
[0104] 游客画像接口子模块,用于提供游客画像数据和景区决策数据,游客画像数据包括游客身份信息、游客轨迹数据、游客评论数据以及游客消费数据。
[0105] 可见,应用本发明实施例提供的技术方案,可以采集景区自有数据与互联网数据,有效解决了现有旅游数据分析方法的数据量不足、需要多年积累才能形成可供分析的数据量的问题;并对各类景区数据进行分类存储,进而可以统一从数据存储模块获取各类景区数据,保证了原始数据的完整性和持久性,通过对游客身份信息库、游客轨迹数据、游客评论数据以及游客消费信息库进行多源数据融合,可以得到游客画像数据,并可以用景区口碑指数、景区区域热度分布数据和游客画像数据生成景区决策数据,实现了对景区数据的融合分析,获得了对景区发展有利的景区决策数据,并且整个过程无需人工获取数据,提高了旅游数据分析的效率和准确率,通过对外提供数据访问接口,便于其他系统获取所需的数据,提高了分析结果的利用率。
[0106] 一种实现方式中,系统还包括日志监控模块;
[0107] 日志监控模块,用于获得数据采集模块、数据存储模块、数据分析模块和对外接口模块的运行数据;并用所获得的运行数据生成运行报表,每隔预设时长或每到达预设时间点将运行报表发送给管理终端;运行数据包括运行时长、存储容量、运行状况以及用户操作记录中的至少一种。
[0108] 数据采集模块、数据存储模块、数据分析模块和对外接口模块均可以分别向日志监控模块发送自身的运行数据。各模块可以预先设置不同或相同的发送时间点。运行时长可以发送运行数据的模块自启动后已运行的总时长,存储容量可以包括发送运行数据的模块当前剩余容量和已使用容量;运行状况包括正常运行状态或预警状态或异常状态,用户操作记录包括发送运行数据的模块已接收的用户操作指令,例如,用于指示调取摄像头数据的指令、针对数据存储模块中数据的添加指令、删除指令、修改指令等等。
[0109] 日志监控模块可以每隔预设时长或每到达预设时间点将运行报表发送给管理终端。运行报表可以是数据表或者是Excel表格或是其他图表,用于描述各模块的运行数据。管理终端可以是管理者固定所使用的终端设备,或者是管理者用已注册的邮箱账号或管理账号登录的设备。预设时长和预设时间点可以根据需求事先设定,例如,预设时长可以为2小时、3小时、4小时等等,预设时间点可以为每天的8:00、9:00、10:00等等。
[0110] 应用本发明实施例,实现了对系统内各模块的监控。
[0111] 又一种实现方式中,系统还包括数据管理模块,
[0112] 数据管理模块,用于接收用户操作指令,按照用户操作指令对数据存储模块中数据库表数据进行管理。
[0113] 用户操作指令可以包括添加指令、删除指令、修改指令、检索指令、备份指令、迁移指令等基本操作指令,分别用于对数据存储模块中数据库表数据进行添加、删除、修改、检索、备份、迁移等操作。数据库表数据是指数据库中的表结构数据。
[0114] 应用本发明实施例,便于用户对数据存储模块的管理。
[0115] 相应于上述旅游数据分析系统实施例,本发明实施例提供了一种旅游数据分析方法,参见图2所示,该方法具体包括:
[0116] S101、采集各类景区数据,其中,各类景区数据包括环境数据、天气数据、舆情数据、在线旅行社数据、车辆数据、视频数据和游客数据;
[0117] S102、对各类景区数据进行分类存储;
[0118] S103、获取已存储的游客数据、视频数据、车辆数据、舆情数据和在线旅行社数据;从游客数据中提取预设身份字段的字段值,用所提取预设身份字段的字段值建立游客身份信息库;基于视频数据生成游客轨迹数据和景区区域热度分布数据;基于车辆数据建立车辆信息库;基于舆情数据生成景区口碑指数和游客评论数据;并从在线旅行社数据中提取预设消费字段的字段值,用所提取预设消费字段的字段值建立游客消费信息库;对游客身份信息库、游客轨迹数据、游客评论数据以及游客消费信息库进行多源数据融合,得到游客画像数据;用景区口碑指数、景区区域热度分布数据和游客画像数据生成景区决策数据;
[0119] S104、获取已存储的环境数据和天气数据,并获取分析所得的游客身份信息库、车辆信息库、游客轨迹数据、景区区域热度分布数据、景区口碑指数、游客消费信息库、游客画像数据和景区决策数据,采用接口访问方式对外提供所获取的各类数据。
[0120] 应用本发明实施例提供的技术方案,可以采集景区自有数据与互联网数据,有效解决了现有旅游数据分析方法的数据量不足、需要多年积累才能形成可供分析的数据量的问题;并对各类景区数据进行分类存储,进而可以统一从数据存储模块获取各类景区数据,保证了原始数据的完整性和持久性,通过对游客身份信息库、游客轨迹数据、游客评论数据以及游客消费信息库进行多源数据融合,可以得到游客画像数据,并可以用景区口碑指数、景区区域热度分布数据和游客画像数据生成景区决策数据,实现了对景区数据的融合分析,获得了对景区发展有利的景区决策数据,并且整个过程无需人工获取数据,提高了旅游数据分析的效率和准确率,通过对外提供数据访问接口,便于其他系统获取所需的数据,提高了分析结果的利用率。
[0121] 本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于方法实施例而言,由于其基本相似于系统实施例,所以描述的比较简单,相关之处参见系统实施例的部分说明即可。
[0122] 以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。