文章编号:1007-757X(2021)03-0166-03
基于手机信令大数据的轨道交通短时流量预测
周剑明1,黄杉
(1.中国联通广州市分公司,广东广州510000;  2.智慧足迹数据科技有限公司,北京100023)
摘要:针对轨道交通短时流量预测存在流量波动预测精度较低、运行时间较长等问题,提出了基于手机信令大数据的轨道交通短时流量预测方法。获取用户手机信令数据和轨道交通路线信息,并将发出手机信令大数据的手机拟合至轨道交 通路线上,根据手机信令数据切换确定手机切换序列与轨道交通路线切换序列间的相似度,确定轨道交通路线上的手机用户,构建轨道交通路线上的大量手机用户信令样本数据库。根据预测当B交通轨道流量数据特征,在已构建的数据库内采用欧氏距离作为距离度量方式确定特征近a,依照确定的k组近am数据预测下一时刻轨道交通流量%结果显示k取值为4时,该方法预测精度最高,预测B全天平均绝对百分比误差低于5%%
关键词:手机信令;大数据;轨道交通;短时;流量预测;;k m
中图分类号:U491文献标志码:A
Short Term Traffic Flow Prediction of Rail Transit Based on
Mobile Phone Signaling Big Data
ZHOU Jianming1,HUANG Shan2*
(1.China Unicom GuangzhouBranch,Guangzhou510000,China%
2.Smartsteps Data Technology Co.,Ltd.,Beijing100023,China)
Abstract:Aiming at the problems of low prediction accuracy and long running time of short-term traffic flow prediction of rail transit,ashort-termtra f icforecastingmethodbasedonbigdataofmobilephonesignalingisproposed.Themobilephonesig-nalingdataandrailtransitrouteinformationofusersareobtained,andthemobilebasestationsthatsend mobilephonesigna-ingbigdataarefi t edtotherailtransitroute.Accordingtothemobilephonesignalingdataswitching,thesimilaritybetween the mobile phone base station switching sequence and the rail transit line base station switching sequence is determined,and the mobilephoneusersontherailtransitlinearedetermined,andalargenumberofmobilephoneusersontherailtransitlineare constructed,and user signaling sample database is established.According to the characteristics of rail tra f ic flow data on the dayofprediction,theEuclideandistanceisusedasthemeasurementmethodtodeter
minethecharacteristicnearestneighborin the constructed database,and the rail transit flow at the next moment is predicted according to the K group of nearest neighbor data.The results show that when K value is4,the prediction accuracy is the highest,and the average absolute percentage er-rorofth4whol4dayisl4ssthan5%.
Key words:mobile phone signaling;big data;rail transit;short term;traffic prediction;base station;K value
0引言
轨道交通方式成为我国大中型城市的主要交通方式之一,但巨大的客流量为轨道交通的运营管理带来新的挑战(1)。短时流量预测是轨道交通运营管理的基础,流量预测是以时间序列为基础预测未来时间段的客流量(),一般情况下,短时流量预测的时间粒度小于20min o短时流量预测可以为轨道交通客运管理与组织安排提供有力参考并缓解轨道交通拥堵概率,提升交通服务质量&手机发出的信令数据具有数据量大、客观真实和易获取等优势,随着手机用户数量的提升,手机定位技术的信令数据重要性日渐增强。同时与基于交通大数据⑷或基于组合模型的流量预测方法相比手机信令数据还具有低成本,高覆盖区域等优势&因此,在轨道交通短时流量预测过程中融入手机信令,
基手机信大数据的轨通流量预测方
预测轨道交通短时流量&
1基于手机信令大数据的轨道交通短时流量预测
基于手机信令大数据的轨道交通短时流量预测方法的整体架构,如图1所示&
预测过程主要分为以下几个环节:由手机网络运营商处和轨道交通运营商处分别获取用户手机信令数据和轨道交通路线信息;依照道路匹配算法确定轨道交通路线上移动的手机用户;搭建轨道交通流量大数据库,实时更新轨道交通路线上手机用户的手机信令数据;分析轨道交通流量特性;基于K值自适应算法预测轨道交通短时流量&
作者简介:周剑明(1982-),男,硕士,工程师,研究方向:大数据交通出行识别。
通信作者:黄杉(1983-),男,硕士,高级工程师,研究方向:交通运输规划、出行决策&
|用户手机蕾令数剎|轨道交通’路线信爲]
|2站与轨道餐通路线拟专|
|确定轨道交通路线》移动的手机用户|
|轨道交通路线上用户牛机信令样本数据库|
|轨道交通;流量特性|
|历史数*人流卸|当前时专人流卸
|基于K值2适应的轨善交通短时梢量预测|3000元手机推荐2021
|输出轨道交通爲流量预测结果|
图1预测方法整体架构
1.1手机信令与轨道交通路线的获取
基于手机网络运营商的BSS(Business Support System,业务支撑系统)域数据管理系统设定手机信令数据采集时间阈值,根据设定阈值实时采集城市范围内手机用户的信令数据。所采集手机信令数据为从某运营商处获得的脱敏数据,可以在不违反系统规则条件下,改造真实数据并提供测试使用。所采集手机信令数据结构,如表1所示&
表1所采集手机信令数据
ID经度纬度到达时间停留时间/s 195.651115.63342019/8/167:4415
295.163415.26732019/8/169143656
395.680415.30372019/8/1615:26210
496.116216.34612019/8/1611:3056
595.424016.22352019/8/1617:5223815
在采集的手机信令数据内,各用户具备唯一的身份识别ID,经纬度维数为手机的所在位置,当用户手机达到服务范围内自动生成时间戳,并记录用户手机在该范围内停留时间,再获取城市轨道交通路线信息&
1.2道路匹配与用户判定
选取GIS缓冲分析方法对与轨道交通路线实施叠加,根据手机信令数据将手机拟合至轨道交通路线上&由于城市内服务范围通常为500m。因此设定缓冲半径为500m,与交通轨道路线拟合结果,如图2所示&
基GIS分析方对基与轨通线的合,确定不同轨道交通路线上的分布序列,用Q= {”],”2,…,”f}表示,Q和”f分别表示第L条轨道交通路线和序列内第f个,将Q={”1,”2,,6,”f}作为轨道交通路线的切换序列。依据时间维度整理排列用户手机信令切换数据,能够确定不同用户经过的切换顺序,用P o={”1,”2,6,”一}表示用户手机切换序列,P j和”-分别表示第J个手机用户和其经过的第一个。计算Pj={”1,”2,…,”一}和Q={”1,”2,…,”,}之间的相似度(欧氏距离),如式(1)。
d$Jg—P j)T q—P j)(1)
基于式(1)确定手机用户移动轨迹与轨道交通路线匹配的信息,当相似度高于设定值时,即可判定该手机用户为轨道交通路线上的手机用户&
1.3轨道交通短时人流量特性分析
利用以上获得的手机用户和Oacle Database关系数据库管理系统,构建手机信令样本数据库,手机信令数据采集时间阈值实时更新数据库信息并分析轨道交通流量特性,可知城市轨道交通短时人流量时间序列存在显著的周期性变化特征&由于交通流量及具体运行模式不同时,其预测的精度和动态特征也不同,为了以最低计算量获取相关的交通短时流量参数,本文采用基于K值自适应的轨道交通短时流量预测算预测城市轨通流量。
1.4K值自适应的轨道交通短时流量预测算法
利用轨道交通路线上用户手机信令样本数据库,依照轨道交通人流量特性生成K近邻模型的状态向量。依照距离度量方式与自适应K值计算确定近邻搜索机制&根据当前时刻轨道交通流量数据预测下一时刻轨道交通流量&状态向量是对比交通轨道流量历史状态与当前状态的标准,如式(2)。
E"$(K71,K72,・6,K7)(2)式中,7和K6分别表示预测日前7天和预测日前7天6时刻轨道交通流量&根据预测当日交通轨道流量数据的流量特征在已构建的数据库内依照距离度量方式确定其近邻以预测下一时刻轨道交通流量。将欧氏距离作为距离度量指标,用K?=(K z, K z,-6, K z)T和Sj=(Sj,S j,-••,Sj)T分别为预测日用户手机信令向量和历史用户手机信令向量&根据已知的预测日部分用户手机信令向量K=(K, K l,6, K)T,确定
K l与S j之间的距离V j,如式(3)。
;(k z,Sj)$(+\k z—S J2)1(3)
8$1
K近邻模型中,K值表示数据库内选取近邻数量的参数,该值直接影响预测精度&因此选取基于平均绝对百分比误差最小的K值自适应计算模型计算K值&计算模型,如
(4)。
k$$⑷式中,$和.分别表示自适应搜索边界值和预测值数量;g,和Q分别表示预测值与实际值&K值计算,如式(5)、式(6)。
K$min{,1, k2, k3,0(5)
k(+1)$;一1s(T(6)
+;-1
L$1
照定的K值数据预测下轨通流量可得式(6),s(+1)和;分别为数据库内获取的第j个近邻所对应的6+1时刻轨道交通流量和当前时刻数据与第j个的距。
2应用分析
采用本文方法对某市轨道交通二号线进行短时流量预测以测试性能。预测过程中使用的手机信令大数据来源于同三大营销商的合作项目,轨道交通路线信息来自研究对象在城市轨通运营。
2.1预测结果
2.1.1K值
采用本文方法进行研究对象短时流量预测,基于数据库内已有数据得到不同K值下的预测结果平均绝对百分比误差,其中曲线表示平均绝对百分比误差值,如图3所示&
K=16—Q_K=2
图3不同K值下的平均绝对百分比误差
分析图3能够得到,随着K取值的提升,短时流量预测结果的平均绝对百分比误差整体表现出先下降后提升的趋势。当K取值在1—4时,预测结果平均绝对百分比误差从0.056下降至0.038;当K取值在4—16时,预测结果平均绝对百分比误差从0.038上升至0.076,这是因为当K取值过大或过小时,均会提升研究对象短时流量预测结果的平均绝对百分比误差,而4恰巧在取值过大或过小的中间节点上,因此此取值为预测精度最高。实验结果表明采用本文方法预测研究对象短时流量时,K取值为4时,本文方法预测精度最高。
2.1.2流量预测
以2020年5月1日(法定节假日)和5月6日(非节假日)为预测日,采用本文方法进行研究对象短时流量预测,设定预测时间粒度为20mm0取值为4。预测结果,如图4所示&
(a)2020年5月1日(b)2020年5月6日
图4流量预测结果
综合图4(a)与图4(b)的数据能够得到本文方法针对节假日条件下研究对象流量预测结果较好。整体预测过程中本文方法对于研究对象流量的变化趋势感知较为敏感,可依照实时流量波动快速修正预测趋势&本文方法在节假日条件下针对研究对象行流量预测过程中,平对分比误差低于5%,满足实际预测需求。且本文方法针对非节假日条件下研究对象流量预测结果与实际流量基本一致,预测过程中,平对分误差3%。本方法可准确预测研究对象短时流量,并根据实际流量,实施修正预测趋势,提升后续预测精度&
2.2预测性能对比分析
选取均方根误差(其值越小误差越小)和运行时间(其值越大方法复杂度越高)作为预测性能评价指标&针对研究对象5月6日流量预测结果的评价指标,以文献[4]和文献[5)中方对本方,2。
分析表2可得,本文方法在均方根误差上的评价结果与基于交通大数据的预测方法差距较小,但显著优于基于组合模型的预测方法;在运行时间方面的评价结果与基于组合模型的预测方法差距较小,但显著优于基于交通大数据的预测方。综合本方预测对方。
表2不同预测方法的评价
运营
时间
本文方法文献M方法文献方法均方根
误差
运行
时间/s
方根
误差
运行
时间/s
方根
误差
运行
时间/s 5:000.960.93  1.02  4.65  1.54  1.58 6:00  1.030.96  1.02  4.26  1.46  1.32 7:000.980.99  1.03  4.3  1.38  1.44 8:000.990.980.98  3.98  1.29  1.53 9:00  1.020.960.99  4.15  1.41  1.41 10:00  1.000.920.99  4.22  1.59  1.39 11:00  1.040.94  1.00  3.99  1.42  1.45 12:000.990.95  1.02  3.85
1.4+
1.48 13:00  1.060.96
0.9+
4.03  1.39  1.50 14:000.980.93  1.01  4.11  1.35  1.42 15:00
0.9+
0.920.99
3.8+
1.40
1.3+
16:000.960.930.99  4.24  1.44  1.44
1+:00
1.04
0.9+
1.04  4.15  1.43
1.4+ 18:00  1.020.99  1.05  4.00  1.38  1.50 19:00  1.02
0.9+
1.01  3.93  1.40  1.39
20:00
0.9+
0.950.99  3.86
1.3+
1.40
21:000.960.930.96
3.+
1.39  1.38
22:000.960.91
0.9+
3.95  1.40  1.35
3总结
本文提出基于手机信令大数据的轨道交通短时流量预测方法,拟合手机与交通轨道路线,根据手机信令数据判断交通轨道路线上的用户,采用基于0值自适应的轨道交通短时流量预测算法进行实时准确的短时流量预测&但本文方法在研究过程未考虑天气异常与突发事件等条件,因,在后续过程中基对方
施。
参考文献
[1(Derrmann T,Frank R,Viti F,et78.How road and mobile networks correlate:estimating urban traffic u­sing handovers[J(.IEEE Transactions on Intelligent Transportation Systems,2020,21(2):521-530.
[2(林培,雷永巍,张孜,等.面向手机信令数据的交通
枢纽人流量短时预测算法[J(.哈尔滨工业大学学报,
2018,50(9)89-952
[3(谢栋灿,王德,钟炜菁,等.上海市建成环境的评价与分析:基于手机信令数据的探索[J(.城市规划,2018,
4210)97-1082
[4(蔡晓禹,谭宇婷,雷财林,等.交通大数据环境下短时交通流量预测研究[J(.铁道运输与经济,2018,40
(8)88-93.
[5(杨静,朱经纬,刘博,等.基于组合模型的城市轨道交
通短时客流预测[J(.交通运输系统工程与信息,
2019,19(3)119-1252
[6(Zhong G,Yin T T,Zhang J,et78.Characteristics a-nalysisfortravelbehavioroftransportation hub pas-sengersusing mobilephonedata[J(2Transportation,
2019,46(5):1713-17362
[7(方珊珊,陈艳艳,刘小明,等.基于手机信令数据的快
递人员辨识方法[J(.北京工业大学学报,2017,43
(3):413-4212
(收稿日期:2020.07.20)