利用手机轨迹追踪传染源和预测传染病流行趋势的方法转让专利

申请号 : CN201610060508.X

文献号 : CN105740615B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陆家海刘荣飞杜依蔓宋征张珂艺李泽纯

申请人 : 中山大学

摘要 :

本发明公开了利用手机轨迹追踪传染源和预测传染病流行趋势的方法,包括步骤:从疾控中心获得新发感染者数据,确定新发感染者;获得所述新发感染者发病前和发病后一段时间内的手机话务数据及其相关基站数据;对所述手机话务数据和相关基站数据在地理信息系统平台上进行新发感染者的轨迹可视化分析;和分析传染病流行的高危区域和人群,预测传染病流行趋势。本发明通过新发感染者的手机轨迹结合地理信息系统,可快速、准确地判断传染源经过的地区和环境状况,有利于确定高危区域和人群,及时采取防控措施。

权利要求 :

1.利用手机轨迹预测传染病流行趋势的方法,其特征在于,包括步骤:S1:从疾控中心获得新发感染者数据,确定所述新发感染者为传染源;

S2:获得所述新发感染者发病前和发病后一段时间内的手机话务数据及其相关基站数据;

S3:对所述手机话务数据和相关基站数据在地理信息系统平台上进行新发感染者的轨迹可视化分析;具体的,S31:轨迹特征提取,对手机话务数据和相关基站数据进行预处理,得出新发感染者的出行特点及其驻留点;

S32:可视化分析,将预处理后的数据输入所述地理信息系统平台,进行新发感染者出行轨迹数据的可视化分析;

S4:分析传染病流行的高危区域和人群,预测传染病流行趋势;具体的,根据单个新发感染者的手机轨迹推断其感染时间和地点,并通过不同新发感染者的手机轨迹相似点得知可能的疫源地及最初传染源;根据疫源地及最初传染源预测传染病流行趋势。

2.如权利要求1所述的利用手机轨迹预测传染病流行趋势的方法,其特征在于,步骤S2中所述一段时间为一周到两周。

3.如权利要求1所述的利用手机轨迹预测传染病流行趋势的方法,其特征在于,步骤S2中所述新发感染者的手机话务数据包括用户触发话务的时间、用户通信业务类型和用户ID号;所述相关基站数据包括与所述手机话务数据相关的基站位置区域识别号码和基站扇区位置标识号码。

4.如权利要求1所述的利用手机轨迹预测传染病流行趋势的方法,其特征在于,步骤S3中所述地理信息系统平台为ArcGIS可视化平台。

5.如权利要求4所述的利用手机轨迹预测传染病流行趋势的方法,其特征在于,步骤S3包括步骤:采用Apriori算法对所述手机话务数据和相关基站数据在ArcGIS可视化平台上进行新发感染者的轨迹可视化分析。

6.如权利要求1所述的利用手机轨迹预测传染病流行趋势的方法,其特征在于,步骤S32包括定位数据的语义化,定位数据的语义化包括步骤:S321:轨迹数据所在地理位置的语义化;

S322:驻留点提取及轨迹语义化。

7.如权利要求1所述的利用手机轨迹预测传染病流行趋势的方法,其特征在于,所述步骤S4中所述预测传染病的流行趋势,其方法包括但不限于单一群体方法、复合群体方法和微观个体方法中的一种或其组合。

说明书 :

利用手机轨迹追踪传染源和预测传染病流行趋势的方法

技术领域

[0001] 本发明涉及传染病预防和控制领域,尤其涉及一种利用手机轨迹追踪传染源和预测传染病流行趋势的方法。

背景技术

[0002] 目前,我国对于新发传染病的“补救性”措施主要着眼于对患病者的控制和高危人群的隔离等,但有些疾病因为传染方式的特点,潜在高危人群分布广泛,传染病的病源确定和流行趋势的预测较为困难。以往对于传染病传播方式的判断,通过临床症状和流行病学调查,视野狭窄、过程复杂、用时较长,而且很可能研究不出结果。
[0003] 地理信息系统(GIS)是一种特定的系统,指计算机在硬、软件支持下,对整个或部分地球表面(包括大气层)空间中的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述以及辅助决策的技术系统。地理信息系统的处理、管理的对象是多种地理空间实体数据及其关系,包括空间定位数据、图形数据、遥感图像数据、属性数据等,用于分析和处理在一定地理区域内分布的各种现象和过程,解决复杂的规划、决策和管理问题。
[0004] GIS由于其强大的功能而被广泛应用于多个领域的研究,并收获颇丰。GIS在国外很早就应用于公共卫生领域,近几年在我国公共卫生领域也开始得到广泛的运用如杭州和济南等CDC都安装了GIS用于疾病防控。目前GIS已经应用于流行病预防控制、疾病监测、卫生资源配置、卫生服务研究、卫生教育、社区卫生评价、环境监测与评价等多个方面并取得了很好的效果。
[0005] ArcGIS(美国环境系统研究所研发的商用地理信息系统平台):ArcGIS产品线为用户提供一个可伸缩的,全面的GIS平台。ArcObjects包含了大量的可编程组件,从细粒度的对象(例如单个的几何对象)到粗粒度的对象(例如与现有ArcMap文档交互的地图对象)涉及面极广,这些对象为开发者集成了全面的GIS功能。每一个使用ArcObjects建成的ArcGIS产品都为开发者提供了一个应用开发的容器,包括桌面GIS(ArcGIS Desktop),嵌入式GIS(ArcGIS Engine)以及服务端GIS(ArcGIS Server)。
[0006] Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。
[0007] 目前,我国移动电话用户已达九亿之多,手机通信的普及和现代手机定位技术的发达,为我们收集手机信号从而分析出有用的信息,将轨迹可视化,为我们将手机信号作为定位工具应用于传染病领域,把用户的位置信息与用户的健康信息联系起来,为传染病预防和控制提供了一种新的方法。

发明内容

[0008] 本发明结合手机通信普及的现状和现代手机定位技术,利用地理信息系统对传染源以及传染病的传播进行快速的定位和追踪,将现代手机通讯首次应用到对传染病的追踪和控制上。
[0009] 本发明提出一种利用手机轨迹追踪传染源和预测传染病流行趋势的方法,包括步骤:
[0010] S1:从疾控中心获得新发感染者数据,确定所述新发感染者为传染源;
[0011] S2:获得所述新发感染者发病前和发病后一段时间内的手机话务数据及其相关基站数据;
[0012] S3:对所述手机话务数据和相关基站数据在地理信息系统平台上进行新发感染者的轨迹可视化分析;
[0013] S4:分析传染病流行的高危区域和人群,预测传染病流行趋势。
[0014] 进一步地,步骤S2中所述一段时间为一周到两周。
[0015] 进一步地,步骤S2中所述新发感染者的手机话务数据包括用户触发话务的时间、用户通信业务类型和用户ID号;所述相关基站数据包括与所述手机话务数据相关的基站位置区域识别号码和基站扇区位置标识号码。
[0016] 进一步地,步骤S3中所述地理信息系统平台为ArcGIS可视化平台。
[0017] 更进一步地,步骤S3包括步骤:采用Apriori算法对所述手机话务数据和相关基站数据在ArcGIS可视化平台上进行新发感染者的轨迹可视化分析。
[0018] 进一步地,步骤S3包括步骤:
[0019] S31:轨迹特征提取,对手机话务数据和相关基站数据进行预处理,得出新发感染者的出行特点及其驻留点;
[0020] S32:可视化分析,将预处理后的数据输入所述地理信息系统平台,进行新发感染者出行轨迹数据的可视化分析。
[0021] 更近一步地,步骤S32包括定位数据的语义化,定位数据的语义化包括步骤:
[0022] S321:轨迹数据所在地理位置的语义化;
[0023] S322:驻留点提取及轨迹语义化。
[0024] 进一步地,步骤S4包括步骤:根据单个新发感染者的手机轨迹推断其感染时间和地点,通过不同新发感染者的手机轨迹相似点得知可能的疫源地及最初传染源。
[0025] 进一步地,所述步骤S4中所述预测传染病的流行趋势,其方法包括但不限于单一群体方法,复合群体方法和微观个体方法中的一种或其组合。
[0026] 本发明的有益效果在于,本发明利用手机轨迹追踪传染源和预测传染病流行趋势的方法,通过新发感染者的手机轨迹结合地理信息系统,可快速、准确地判断传染源经过的地区和环境状况,有利于确定高危区域和人群,及时采取防控措施。

附图说明

[0027] 图1是本发明的方法流程图。

具体实施方式

[0028] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0029] 请参见图1,本发明利用手机轨迹追踪传染源和预测传染病流行趋势的方法,包括步骤:
[0030] S1:从疾控中心获得新发感染者数据,确定所述新发感染者为传染源;
[0031] S2:获得所述新发感染者发病前和发病后一段时间内的的手机话务数据及其相关基站数据;
[0032] S3:对所述手机话务数据和相关基站数据在地理信息系统平台上进行新发感染者的轨迹可视化分析;
[0033] S4:分析传染病流行的高危区域和人群,预测传染病流行趋势。
[0034] 在步骤S2中,通过通信运营商如中国移动、中国联通和中国电信等沟通,可获得新发感染者发病前和发病后一段时间如一周到两周内的手机话务数据,所述新发感染者的手机话务数据包括用户触发话务的时间、用户通信业务类型和用户ID号;所述相关基站数据包括与所述手机话务数据相关的基站位置区域识别号码和基站扇区位置标识号码。
[0035] 在步骤S3中,所述地理信息系统平台可采用ArcGIS可视化平台,并采用Apriori算法对所述手机话务数据和相关基站数据在ArcGIS可视化平台上进行新发感染者的轨迹可视化分析。
[0036] 步骤S3包括步骤S31和步骤S32.
[0037] 步骤S31:轨迹特征提取,对手机话务数据及其相关基站数据进行预处理,得出新发感染者的出行特点及其驻留点。使用空间和时间的聚类算法,对手机话务数据及其相关基站数据进行预处理,可以提取出对新发感染者有特殊意义的驻留点,驻留通常指用户在一定地理空间范围停留超过一定时间的区域,这样的区域对新发感染者往往有特殊的意义,所以也称为兴趣点或兴趣区域。
[0038] 步骤S32:可视化分析,将预处理后的数据输入所述地理信息系统平台,进行新发感染者出行轨迹数据的可视化分析。以ArcGIS可视化分析平台为例,把预处理后的数据统一输入Access数据库统一管理,实现新发感染者出行轨迹数据的可视化分析。然后进行定位数据的语义化(语义轨迹:包含人移动原因和移动途径相关信息),为进一步挖掘用户轨迹提供了丰富的信息基础
[0039] 其中,步骤S32包括定位数据的语义化,定位数据的语义化包括步骤S321和步骤S322。
[0040] 步骤S321:轨迹数据所在地理位置的语义化。基于POI数据地理位置进行语义化:从地图数据生产商,如高德地图等,直接通过购买获取POI关键字。挑选区域内所有与传染病传染源及传播模型有关的地理位置,如禽类交易市场、屠宰场、动物园、农牧场等,与具有现实意义的应用领域数据(社会经济水平、人口流动性、风俗习惯特征等)以及环境地理背景数据(气候特征、动物分布、水源分布等)通过空间联合显示,实现地理位置语义化使得标签内容与传染病密切相关。
[0041] 步骤S322:驻留点提取及轨迹语义化。提取轨迹驻留点,突出新发感染者出行的起始点和目的地,获取新发感染者的常驻位置,实现数据压缩,减少无用数据量。设置时间阈值和空间阈值提取驻留点,再提取得到定位中心的地理语义信息,推断该新发感染者的出行规律。
[0042] 在步骤S4中,可根据单个新发感染者的手机轨迹推断其经过的地区和环境状况,通过不同新发感染者的手机轨迹相似点得知可能的疫源地及最初的传染源。针对不同类型的传染病进行预测传染病的流行趋势的方法包括但不限于单一群体方法,复合群体方法和微观个体方法中的一种或其组合。利用这些现有的研究成果,可建立传播模型,预测其流行趋势。
[0043] 通过手机轨迹数据的可视化分析结果,可以对传染源做到早发现、早隔离、早治疗,切断传播途径,保护易感人群,控制传染病的暴发。控制传染病的爆发可以采取的方法包括对环境ArcMap(ArcMap:ArcGIS中提供地理信息数据可视化界面和数据分析方法)上的驻留地点进行消杀,扑杀消灭存在传播疾病风险的动物;确定易感人群,进行早期干预(接种疫苗、健康监测、宣传教育等方式);分析新发传染病的传染源和传播途径,为疫情防控提供指导意见。
[0044] 传染病流行是在人群中发生的一个复杂扩散的过程,从发现疾病、确定病原体、确定传播途径与传染方式,到对疾病进行控制,目前来说是一个漫长的过程,传统方法在发现传染源后,通常进行问卷调查,来分析患者去过的地方,这样耗费大量人力、用时长、结果不准确,这一阶段往往错失了许多控制疾病的良机。而本发明的技术方式是通过手机出行的数据,可以快速有效地了解到初次感染者的出行特点与路线,特殊情况下还可以对传染源进行实时动态追踪,及时有效地对其所接触的人和地进行疾病干预,不仅准确方便,也节省了大量的大量人力物力财力。
[0045] 现有技术中对传染源的的追踪采用的人工数据采集,在被调查对象的采访描述中可能会掺杂个人的主观判断或记忆遗忘等,使得采集的数据不够准确,不够全面,不够主观。而本发明的技术方案可以直接从数据提供者第三方获得数据,进而对数据进行分析,这样大大提高了数据的可信度。同时,传统方法中工作人员在采集数据时往往需要到疾病现场去实时调查,暴露在疾病环境下,近距离接触传染源而增加了染病风险。而本发明的技术方案使得工作人员可以直接在合作的数据提供第三方截得数据,这保障了工作人员的安全。
[0046] 以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。