一种出行方式选择预测与分析方法和系统转让专利

申请号 : CN202310240074.1

文献号 : CN116227714B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 唐立唐传丽

申请人 : 西华大学

摘要 :

本发明公开了一种出行方式选择预测与分析方法和系统。包括:数据预处理、数据再处理和知识‑数据驱动自动融合模块。数据预处理模块对数据进行常规数据处理及数据集划分;数据再处理模块用于筛选主输入变量和辅助输入变量;知识‑数据驱动自动融合模块通过将随机效用理论中效用函数的可观测效用拆分为知识驱动和数据驱动两部分,知识驱动部分用于保留离散选择模型的可解释性;数据驱动部分用于提升预测性能。通过调用基于Python的深度学习框架工具训练模型并作预测,通过调用TensorBoard平台对训练过程及预测结果进行可视化分析。本发明的优点是:降低错误估计的风险,缓解神经网络因网络加深而导致的网络退化问题,提升使用者的工作效率。

权利要求 :

1.一种出行方式选择预测与分析方法,该方法需要在出行方式选择预测与分析系统的基础上实现;

所述选择预测与分析系统包括:数据预处理模块、数据再处理模块、知识‑数据驱动自动融合模块和TensorBoard服务器;

所述数据预处理模块用于对出行数据进行数据清洗、数据编码、特征提取、数据标准化和样本抽样;

所述数据再处理模块由XGBoost和随机森林两个并行的机器学习模型融合构成,用于对出行数据进行数据再处理,得到主输入变量和辅助输入变量,用于分别输入到知识‑数据驱动自动融合模块的知识驱动子模块和数据驱动子模块;

所述知识‑数据驱动自动融合模块包括:知识驱动子模块、数据驱动子模块、融合子模块和输出层;

所述知识驱动子模块的主体为单层卷积神经网络,由基于随机效用理论的多项Logit转换而来,用于建立效用函数可观测部分的知识驱动部分效用,从而保留预测模型的可解释;

数据驱动子模块主体为可调节的残差网络,用于建立效用函数可观测部分的数据驱动部分效用,提升预测模型的预测性能,同时防止因网络加深而导致的网络退化问题;

融合子模块用于将效用函数可观测部分的知识驱动部分和数据驱动部分进行加和;

输出层用于将融合子模块的融合结果转换为概率并输出;

出行方式选择预测与分析方法,包括以下步骤:

步骤1,获取居民出行的特征数据和社会经济属性数据,明确备选集,利用数据预处理模块初步对其进行数据预处理;得到可用于离散选择模型求解的出行数据,并按照一定比例将出行数据划分训练集和测试集;

步骤2,利用数据再处理模块对经过数据预处理的出行数据进行数据再处理,分别得到主输入变量和辅助输入变量;

步骤3,将经过数据再处理模块得到的出行数据输入到知识‑数据驱动自动融合模块中进行计算并输出结果;

步骤4,设置损失函数为分类交叉熵(CE),并通过调用Tensorflow或Pytorch自带的优化器进行模型训练及预测;

步骤5,启动TensorBoard服务器,对知识‑数据驱动自动融合模块的运行过程及模型结果进行可视化分析。

2.根据权利要求1所述的一种出行方式选择预测与分析方法,其特征在于:步骤1中出行数据的预处理包括:数据清洗:删除缺失值、异常值的不合理数据;

数据编码:将文本型数据转换为数值型数据;

特征提取:从原始数据中提取可输入到机器学习模型及离散选择模型的特征变量;

数据标准化:将不同量纲的数据进行标准化处理;

样本抽样:如果数据集不平衡,采用过采样或欠采样方法来平衡数据集。

3.根据权利要求1所述的一种出行方式选择预测与分析方法,其特征在于:所述步骤2中,数据再处理模块中对XGBoost的模型结果赋予权重δ,对随机森林的模型结果赋予权重(1‑δ),输出结果包括融合模型的预测结果、特征重要性、可视化结果;数据再处理模块的模型参数采用默认参数,可单独根据数据再处理模块的可视化结果对相应的模型进行适当调整;权重δ为可以手动调节的超参数,δ可以根据知识‑数据驱动自动融合模块输出结果进行调节,通过设置δ,提升了数据再处理模块处理数据的灵活性;通过数据再处理模块的处理,让程序自动根据数据的实际情况选择主输入变量和辅助输入变量,降低因人为设定错误而引起先验误差的风险。

4.根据权利要求1所述的一种出行方式选择预测与分析方法,其特征在于:在步骤3中,知识‑数据驱动自动融合模块通过引入多输入宽深神经网络架构,将步骤2中得到的主输入变量和辅助输入变量输入到知识驱动子模块,辅助输入变量数据输入到数据驱动子模块;

然后在融合子模块将效用函数可观测部分的知识驱动部分和数据驱动部分进行加和,假设效用函数的不可观测部分服从I类极值分布,并利用Softmax激活函数将效用转换为预测的选择概率结果输出。

5.根据权利要求4所述的一种出行方式选择预测与分析方法,其特征在于:Softmax激活函数的定义如下式:其中,(σ(Vn))i表示个体n选择方式i的概率,Vin表示个体n选择方式i的效用,Cn是所有备选方式的集合,i,j∈Cn且i≠j。

6.根据权利要求1所述的一种出行方式选择预测与分析方法,其特征在于:步骤4中,分类交叉熵的定义如下式:其中,Hn(σ,yn)为分类交叉熵,用于衡量预测概率和真实概率之间相似性,yin为个体n选择方式i的真实概率,Cn是所有备选方式的集合,σi(Vn)表示个体n选择方式i的概率。

说明书 :

一种出行方式选择预测与分析方法和系统

技术领域

[0001] 本发明涉及人工智能交通行为分析技术领域,特别涉及一种基于知识‑数据驱动自动融合模型的出行方式选择预测与分析方法和系统。

背景技术

[0002] 出行方式选择是交通规划和交通需求管理中的一项经典问题。通过研究个体出行选择背后的行为决策机理,有助于规划部门或管理部门理解出行者的出行需求,从而为出行者提供更好的出行服务。业界和学界常用于出行方式选择预测的传统模型是基于随机效用理论的计量经济离散选择模型,它具有良好的可解释性,但是在处理复杂变量和获得较高预测准确度方面存在较大的局限性。此外,离散选择模型效用函数的可观测部分通常假设先验已知,大多需要依赖于建模者的先验知识,然而错误的先验假设会导致错误的模型估计。近年来,随着人工智能技术的不断发展,基于机器学习的出行方式选择建模研究受到了全世界相关领域研究者的高度关注。其中经济学领域的学者认为基于神经网络的出行方式选择建模虽然提高了预测能力,但是“黑箱”模型的不可解释性使模型的可信度大打折扣;而基于一般可解释机器学习方式的出行方式选择建模虽然可解释,但是模型容易过拟合且由于一些极端值或异常值的出现,模型鲁棒性可能不好。
[0003] 如何在提升出行方式选择模型预测能力的同时让模型具有可解释性这一问题是两年出行方式选择领域的研究热点之一。最近有学者提出将传统的离散选择模型——多项Logit转换为人工神经网络(知识驱动部分)并与深度学习方法(数据驱动部分)结合起来用于出行方法选择预测具有很大的潜力,但是目前的研究尚处于初步探索阶段,且具有两个明显的局限性:第一,现有研究的知识驱动部分仍然依靠的是建模者的先验知识,只是在模型中增加了一个数据驱动的部分以提高模型的整体预测性能,但仍然可能存在较大先验假设错误的风险;第二,现有研究的模型求解与分析方法多依靠研究者根据自己提出的模型自行设计的代码,一般而言研究员自定义的函数较多,代码量较大,初学者很难快速理解研究者的思路,且受限于所使用的求解工具不同,复现工作也有较大阻碍,不利于研究成果的分享和研究者之间的交流。
[0004] 可用于求解传统离散选择模型的工具有Nlogit,Stata和Python等。其中,Nlogit是一个专门用于处理离散选择模型的软件,其主要优点是支持广泛的离散选择模型类型,包括Logit、Probit、Nested Logit、Mixed Logit等,并且能够进行相关参数估计和模型选择,具有较高的精度和稳定性。Stata是一款专业的统计分析软件,内置了许多统计模型和方法,包括离散选择模型。但是,Nlogit和Stata的使用均需要付费,且Nlogit对于离散选择以外的其他数据分析和建模任务的支持相对较弱,Stata则在一些复杂的模型估计和数据处理任务中可能存在一定的限制。Python提供了大量的数据分析和建模库,如NumPy、Pandas、Matplotlib、Scikit‑learn等,可以实现从数据清洗到模型评估的完整数据分析流程。Python的语法简单灵活,拥有庞大的社区和资源支持,同时免费开源。随着深度学习的不断发展,当前有许多可用于研究深度学习的框架,以帮助深度学习研究者们提高工作效率。当前全世界最为流行的深度学习框架有Tensorflow,Pytorch,PaddlePaddle、Caffe等。其中,Tensorflow和Pytorch框架都是基于Python进行使用的,也提供了Python API接口。
由于Python具有易学易用、生态丰富和社区支持等优点,因此成为了当前深度学习领域主流的编程语言之一。TensorBoard是Tensorflow和Pytorch框架都可安装调用的可视化工具,可用于直观地展示训练过程中的各种信息,包括模型的架构、训练过程中的损失和准确率、权重和梯度的分布情况等。

发明内容

[0005] 本发明针对现有技术的缺陷,提供了一种出行方式选择预测与分析方法和系统。提出以通用性较高的基于Python深度学习框架Tensorflow和Pytorch作为模型建立和求解工具,以及提出使用Tensorboard对模型结果进行可视化分析。降低出行方式选择预测中由人为错误设定的先验假设导致模型错误估计的风险;同时利用基于Python开源通用的求解和分析工具来降低相关问题学习和交流的门槛;通过构造知识‑数据驱动自动融合模块,探索将深度学习应用于表格数据分析的方法,并通过使用可调节残差网络一定程度缓解神经网络因网络加深而导致的网络退化问题。
[0006] 为了实现以上发明目的,本发明采取的技术方案如下:
[0007] 一种出行方式选择预测与分析方法,该方法需要在出行方式选择预测与分析系统的基础上实现;
[0008] 所述选择预测与分析系统包括:数据预处理模块、数据再处理模块、知识‑数据驱动自动融合模块和TensorBoard服务器;
[0009] 所述数据预处理模块用于对出行数据进行数据清洗、数据编码、特征提取、数据标准化和样本抽样;
[0010] 所述数据再处理模块由XGBoost和随机森林两个并行的机器学习模型融合构成,用于对出行数据进行数据再处理,得到主输入变量和辅助输入变量,用于分别输入到知识‑数据驱动自动融合模块的知识驱动子模块和数据驱动子模块;
[0011] 所述知识‑数据驱动自动融合模块包括:知识驱动子模块、数据驱动子模块、融合子模块和输出层;
[0012] 所述知识驱动子模块的主体为单层卷积神经网络,由基于随机效用理论的多项Logit转换而来,用于建立效用函数可观测部分的知识驱动部分效用,从而保留预测模型的可解释;
[0013] 数据驱动子模块主体为可调节的残差网络,用于建立效用函数可观测部分的数据驱动部分效用,提升预测模型的预测性能,同时防止因网络加深而导致的网络退化问题。
[0014] 融合子模块用于将效用函数可观测部分的知识驱动部分和数据驱动部分进行加和。
[0015] 输出层用于将融合子模块的融合结果转换为概率并输出。
[0016] 出行方式选择预测与分析方法,包括以下步骤:
[0017] 步骤1,获取居民出行的特征数据和社会经济属性数据,明确备选集,利用数据预处理模块初步对其进行数据预处理;得到可用于离散选择模型求解的出行数据,并按照一定比例将出行数据划分训练集和测试集;
[0018] 步骤2,利用数据再处理模块对经过数据预处理的出行数据进行数据再处理,分别得到主输入变量和辅助输入变量;
[0019] 步骤3,将经过数据再处理模块得到的出行数据输入到知识‑数据驱动自动融合模块中进行计算并输出结果;
[0020] 步骤4,设置损失函数为分类交叉熵(CE),并通过调用Tensorflow或Pytorch自带的优化器进行模型训练及预测;
[0021] 步骤5,启动TensorBoard服务器,对知识‑数据驱动自动融合模块的运行过程及模型结果进行可视化分析。
[0022] 进一步地,步骤1中出行数据的预处理包括:
[0023] 数据清洗:删除缺失值、异常值的不合理数据。
[0024] 数据编码:将文本型数据转换为数值型数据。
[0025] 特征提取:从原始数据中提取可输入到机器学习模型及离散选择模型的特征变量。
[0026] 数据标准化:将不同量纲的数据进行标准化处理。
[0027] 样本抽样:如果数据集不平衡,采用过采样或欠采样方法来平衡数据集。
[0028] 进一步地,所述步骤2中,数据再处理模块中对XGBoost的模型结果赋予权重δ,对随机森林的模型结果赋予权重(1‑δ),输出结果包括融合模型的预测结果、特征重要性、可视化结果。数据再处理模块的模型参数采用默认参数,可单独根据数据再处理模块的可视化结果对相应的模型进行适当调整。权重δ为可以手动调节的超参数,δ可以根据知识‑数据驱动自动融合模块输出结果进行调节,通过设置δ,提升了数据再处理模块处理数据的灵活性。通过数据再处理模块的处理,让程序自动根据数据的实际情况选择主输入变量和辅助输入变量,降低因人为设定错误而引起先验误差的风险。
[0029] 进一步地,在步骤3中,知识‑数据驱动自动融合模块通过引入多输入宽深神经网络架构,将步骤2中得到的主输入变量和辅助输入变量输入到知识驱动子模块,辅助输入变量数据输入到数据驱动子模块。然后在融合子模块将效用函数可观测部分的知识驱动部分和数据驱动部分进行加和,假设效用函数的不可观测部分服从I类极值分布,并利用Softmax激活函数将效用转换为预测的选择概率结果输出。
[0030] 进一步地,Softmax激活函数的定义如下式:
[0031]
[0032] 其中,(σ(Vn))i表示个体n选择方式i的概率,Vin表示个体n选择方式i的效用,Cn是所有备选方式的集合,i,j∈Cn且i≠j。
[0033] 进一步地,步骤4中,分类交叉熵的定义如下式:
[0034]
[0035] 其中,Hn(σ,yn)为分类交叉熵,用于衡量预测概率和真实概率之间相似性,yin为个体n选择方式i的真实概率,Cn是所有备选方式的集合,σi(Vn)表示个体n选择方式i的概率。
[0036] 与现有技术相比,本发明的优点在于:
[0037] 降低出行方式选择预测中由人为错误设定的先验假设导致模型错误估计的风险;同时利用基于Python开源通用的求解和分析工具来降低相关问题学习和交流的门槛,有助于初学者学习和复现其他人的研究成果,提升使用者的工作效率;通过构造知识‑数据驱动自动融合模块,探索将深度学习应用于表格数据分析的方法,并通过使用可调节残差网络一定程度缓解神经网络因网络加深而导致的网络退化问题。

附图说明

[0038] 图1是本发明实施例多输入宽深神经网络架构;
[0039] 图2是本发明实施例出行方式选择预测与分析系统整体框架;
[0040] 图3是本发明实施例的数据再处理模块输出的特征重要度;
[0041] 图4是本发明实施例知识‑数据驱动自动融合模块的框架图;
[0042] 图5是本发明实施例的TensorBoard可视化界面。

具体实施方式

[0043] 为使本发明的目的、技术方案及优点更加清楚明白,以下根据附图并列举实施例,对本发明做进一步详细说明。
[0044] 一种出行方式选择预测与分析方法,该方法包括如下步骤:
[0045] 步骤1,获取居民出行的特征数据和社会经济属性数据,明确备选集,利用数据预处理模块初步对其进行数据预处理,得到可用于离散选择模型求解的出行数据,并按照一定比例(一般为7:3或8:2,可视实际数据情况进行灵活设定)划分训练集和测试集。
[0046] 其中,可用于离散选择模型求解的数据主要是指对出行数据进行以下预处理:
[0047] 数据清洗:删除缺失值、异常值等不合理数据。
[0048] 数据编码:将文本型数据转换为数值型数据。
[0049] 特征提取:从原始数据中提取可输入到机器学习模型及离散选择模型的特征变量。
[0050] 数据标准化:将不同量纲的数据(如出行时间和出行距离)进行标准化处理。
[0051] 样本抽样:如果数据集不平衡,可以考虑采用过采样或欠采样等方法来平衡数据集,以避免模型过于关注某些类别。
[0052] 步骤2,利用数据再处理模块对经过数据预处理的出行数据进行数据再处理,分别得到主输入变量和辅助输入变量。
[0053] 其中,数据再处理模块由XGBoost和随机森林两个并行的机器学习模型融合构成,对XGBoost的模型结果赋予权重δ,对随机森林的模型结果赋予权重(1‑δ),输出结果包括融合模型的预测结果、特征重要性、可视化结果。数据再处理模块的模型参数采用默认参数,可单独根据数据再处理模块的可视化结果对相应的模型进行适当调整。权重δ为可手动调节的超参数,δ可根据后面的知识‑数据驱动自动融合模块输出结果进行调节,通过设置δ,一定程度上提升了数据再处理模块处理数据的灵活性。
[0054] 主输入变量指数据再处理模块输出特征重要性排名靠前的特征变量;辅助输入变量指从数据再处理模块输出的其它特征变量。
[0055] 通过数据再处理模块的处理,可以让程序自动根据数据的实际情况选择主输入变量和辅助输入变量,降低因人为设定错误而引起先验误差的风险。
[0056] 步骤3,将经过数据再处理模块得到的出行数据输入到知识‑数据驱动自动融合模块,该模块引入多输入宽深神经网络架构(多输入宽深神经网络架构见图1)。其中,主输入变量数据输入到知识驱动子模块,辅助输入变量数据输入到数据驱动子模块。然后在融合子模块将效用函数可观测部分的知识驱动部分和数据驱动部分进行加和,假设效用函数的不可观测部分服从I类极值分布,并利用Softmax激活函数将效用转换为预测的选择概率结果输出。
[0057] 其中,知识驱动子模块的主体为单层卷积神经网络,由基于随机效用理论的多项Logit转换而来;数据驱动子模块主体为由可调节的残差网络,可用于防止因网络加深而导致的网络退化问题。可调节的残差网络指网络的残差块大小,残差块数量及连接方式可任意调节。
[0058] 随机效用理论假设个体是理性决策者,其决策目标为通过做出选择决策实现个体效用最大化。令Uin表示个体n认为出行方式i具有的效用。Uin由两个部分组成:一是效用的可观测部分Vin,二是效用的不可观测部分εin(误差项),用于表征某个选择情境下,建模者未完全考虑所有的影响因素所带来的不确定性。
[0059] Uin=Vin+εin     (1)
[0060] 已有学者论证过其中的可观测部分可分解为公式(2)的形式:
[0061]
[0062] 其中,fi(χn;β)是知识驱动部分,假设可解释。函数f的定义使得其未知模型参数β是解释变量(或输入特征)χn的可解释组合。 是数据驱动部分,是从一组解释变量(或输入特征) 中学习的表示,不假设先验关系。
[0063] 公式(2)给出的新表达式替换公式(1)中的可观测效用,可以得到以下效用表达式:
[0064]
[0065] 在多项logit假设误差项独立且相同分布(i.i.d.),且误差项遵循I类极值分布的情况下,个体n选择出行方式i的概率由下式给出:
[0066]
[0067] 偏好参数β通常通过最大化对数似然函数来估计,该对数似然函数由下式给出:
[0068]
[0069] 步骤4,设置损失函数为分类交叉熵(CE),并通过调用Tensorflow或Pytorch自带的优化器进行模型训练及预测。
[0070] 其中,Softmax激活函数的定义如公式(6)。对于个体n选择每一种出行方式的概率,公式(4)可转换为公式(6)。
[0071]
[0072] 分类交叉熵的定义如公式(7):
[0073]
[0074] 当对所有个体n求和时,最小化公式(7)等于最大化公式(5)。
[0075] 步骤5,启动TensorBoard服务器,对知识‑数据驱动自动融合模块的运行过程及模型结果进行可视化分析。
[0076] 下面根据上述出行方式选择预测与分析方法进行实验,实验步骤如下:
[0077] 步骤1,假设过某项陈述性调查获取居民出行数据共计20000条记录,原始记录样本描述如表1所示。
[0078] 表1原始记录样本描述性
[0079]
[0080] 明确备选集为(小汽车,轨道交通,公交车)。利用数据预处理模块初步对其进行数据预处理,并按照8:2划分训练集和测试集。
[0081] 其中,数据预处理主要包括:
[0082] 数据清洗:删除缺失值、异常值等不合理数据。删除年龄、性别、收入缺失或极端异常的数据记录,并将出行方式选择为其他的记录删除。
[0083] 数据编码:将出行目的、交通方式、性别转换为数值型数据并进行编码,如出行目的为上班/上学编码为100000,出行目的为回家(处理事务)编码为000001;出行方式为小汽车编码为100,出行方式为公交车编码为001;性别男编码为1,性别女编码为0。
[0084] 原始数据特征提取:提取特征为:每种出行方式的出行时间TT_CAR,TT_RAIL,TT_BUS;每种出行方式的出行费用TC_CAR,TC_RAIL,TC_BUS;出行距离DIST;性别SEX;年龄AGE;收入INC。共计7个出行特征,3个个体经济特征。出行目的MODE为标签。
[0085] 数据标准化:将不同量纲的数据(如出行时间和出行距离)进行标准化处理。
[0086] 样本抽样:如果数据集不平衡,可以考虑采用过采样或欠采样等方法来平衡数据集,以避免模型过于关注某些类别。
[0087] 步骤2,利用数据再处理模块对经过数据预处理的出行数据进行数据再处理,分别得到主输入变量和辅助输入变量。设置δ的时候采取的策略如下:先将δ设置为很接近于0的数(如设置δ=0.00001),再将δ设置为很接近于1的数(如设置德尔塔=0.99999),然后根据数据再处理模块的可视化输出判断该模块对数据的处理情况,判断超参数δ取值,假设本次δ=0.5时可视化输出表明该模块处理效果较好。
[0088] 假设得到的特征重要度输出如图3所示。因此选择TT_CAR,TT_RAIL,TT_BUS,TC_CAR,TC_RAIL,TC_BUS,DIST为主输入变量;SEX,AGE和INC为辅助输入变量。
[0089] 步骤3,将经过数据再处理模块得到的出行数据输入到知识‑数据驱动自动融合模块,实施例知识‑数据驱动自动融合模块的框架图见图4。
[0090] 步骤4,设置损失函数为分类交叉熵(CE),本次通过调用Tensorflow自带的优化器Adam进行模型训练及预测,评价指标设置为Accuracy,为防止训练时过拟合采取提前终止训练的策略。
[0091] 步骤5,启动TensorBoard服务器,对知识‑数据驱动自动融合模块的运行过程及模型结果进行可视化分析。实施例TensorBoard运行界面见图5。
[0092] 整个过程可通过调用基于Python的深度学习框架对融合模型进行训练求解及对出行方式选择行为进行预测,并可通过启动TensorBoard服务器对模型的训练过程及预测结果进行可视化分析。通过利用开源通用的求解和分析工具来降低相关问题学习和交流的门槛,有助于初学者学习和复现其他人的研究成果,提升方法使用者的工作效率。
[0093] 本发明再一个实施例中,提供了一种选择预测与分析系统,该系统能够用于实施上述的一种选择预测与分析方法,具体包括:数据预处理模块、数据再处理模块、知识‑数据驱动自动融合模块和TensorBoard服务器;
[0094] 所述数据预处理模块用于对出行数据进行数据清洗、数据编码、特征提取、数据标准化和样本抽样;
[0095] 所述数据再处理模块由XGBoost和随机森林两个并行的机器学习模型融合构成,用于对出行数据进行数据再处理,得到主输入变量和辅助输入变量,用于分别输入到知识‑数据驱动自动融合模块的知识驱动子模块和数据驱动子模块;
[0096] 所述知识‑数据驱动自动融合模块包括:知识驱动子模块、数据驱动子模块、融合子模块和输出层;
[0097] 所述知识驱动子模块的主体为单层卷积神经网络,由基于随机效用理论的多项Logit转换而来,用于建立效用函数可观测部分的知识驱动部分效用,从而保留预测模型的可解释;
[0098] 数据驱动子模块主体为可调节的残差网络,用于建立效用函数可观测部分的数据驱动部分效用,提升预测模型的预测性能,同时防止因网络加深而导致的网络退化问题。
[0099] 融合子模块用于将效用函数可观测部分的知识驱动部分和数据驱动部分进行加和。
[0100] 输出层用于将融合子模块的融合结果转换为概率并输出。
[0101] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产品的形式。
[0102] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0103] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0104] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0105] 本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的实施方法,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本发明不仅适用于交通行为分析领域,还适用于表格数据中与选择分析相关的应用领域。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。