大数据类有关论文范文例文 和基于大数据的共享单车移动趋势分析和预测方面论文范文文献

关于免费大数据论文范文在这里免费下载与阅读,为您的大数据相关论文写作提供资料。

基于大数据的共享单车移动趋势分析和预测

[摘 要]在大数据环境下,采用Python语言编写网络爬虫程序,实现了对共享单车位置信息进行实时获取,针对海量的共享单车实时位置信息,进行了数据采集、处理、分析和可视化展示,得出了不同地段、不同时段共享单车移动趋势和骑行偏好的研究结论,及时掌控城市享单车的数量、位置和移动规律,智能预测未来的用车高峰地点与时段,对于做好共享单车的高效管理与便捷服务,具有很好的现实意义与实用价值.

[关键词]大数据;共享单车;网络爬虫;GIS;JSON

doi:10.3969/j.issn.1673-0194.2018.09.065

[中图分类号]F572;TP311.13[文献标识码]A[文章编号]1673-0194(2018)09-0150-03

0引言

近年来,很多城市的共享单车数量快速达到饱和状态,共享单车的存量非常大且处于流动变化状态,在为市民提供骑行便利的同时,也对城市管理提出了新的要求和挑战.如何及时掌握和分析城市中海量共享单车的数量、实时位置和移动规律,是值得研究的课题.共享单车的骑行数据也是分析城市人群出行爱好与规律的最佳数据,通过大数据分析可以预测单车使用的高峰时段和地点,为城市管理者等提供及时可靠的决策依据.

1共享单车位置数据的获取

共享单车应用程序所使用的数据包是采用JSON(JavaScriptObjectNotation,Java脚本对象标记)格式,这是一种轻量级的数据交换格式,因其易阅读和编写,也易于机器解析和生成,可以有效提升网络传输效率,故在网络软件中广泛应用.通过对原始数据包进行研究,可以得出以下的数据格式:

`

对本地POST发送数据包进行分析,获得共享单车服务器API接口,采用Python语言编写网络爬虫类程序,将API中发送数据中的位置坐标数据分别写入两层的嵌套循环,在城市范围内,以适当的步长对城市范围内单车进行快速扫描,得到全部共享单车GPS信息当前数据,写入文件.

对于车辆类型,JSON数据中的BikeType有1和2两种可能,经过对比分析,可以看出1代表新型车、2代表旧款车.

2数据处理与编程实现

在得到原始数据后,不能直接将其输入GIS系统进行图形展示和分析.某些数据因GPS波动的原因会造成车辆频繁或大幅度移动,故需要对数据进行进一步筛选.

根据研究目的,选择以下筛选方法:

(1)保留:车辆ID相同且位置变化适中的车辆

(2)去除:车辆ID不同或者位置变化极大(小)的车辆

根据所选研究的时间区段,移动经纬度超过0.4可能性不大,于是选择0.4作为数据的上限;同时车辆的小规模移动(GPS波动)可能性亦存在,于是选择经纬度变化0.0002作为下限.数据经过处理后,分别将同一ID单车的前后位置存于Excel表中(如表1所示).`

数据处理部分的编程实现核心代码如下:

数据处理后的结果文件集中包含了按日期和时间排序的共享单车实时位置信息.

3数据分析

3.1车辆类型分析

首先,需要对车辆ID进行去重处理.

在完成对车辆ID的去重处理后,可以分别统计车辆类型1和类型2的共享单车数量.统计结果为:车辆类型为2的共享单车为10486辆,车辆类型为1的共享单车为35403辆.共享单车在城市的总投放量的公布数据为37万辆,则可对城市中不同类型共享单车数量估算如下:

(1)类型1的共享单车数据约为236284辆.

(2)类型2的共享单车数据约为69985辆.

可以看出,在车辆改进后,数据显示有大量投放新型车的现象,原旧款车的单车成本高达5000元而新型车成本为3000元,大数据分析所反映的规律符合客观事实.

3.2车辆移动分析

根据数据统计,有近四成车辆在研究时间内从未发生移动.对于此现象分析有两种可能:

(1)由于时间是冬天,骑行人较少.

(2)车辆处在小区内、偏僻位置或无法开始骑行(损坏,上锁).

3.3移动趋势分析

首先,通过百度地图开放平台获取城市内主要地铁站的坐标,并将其输入GIS系统,并在其周围200米建立缓冲区,便于统计车辆移动信息.

然后,将处理后文件输入GIS系统,由起点向终点连线.同时将起点和终点坐标输入GIS系统,与缓冲区做相交处理,将起点设为红色,终点为绿色.

以下将对大数据做具体分析.

3.4宏观分析

从宏观总体上看,用车集中区不在城市中心城区,而是呈现围绕地铁沿线的条带状或是在郊区的聚集区域(如图1所示).

其中,在地图的左下方的聚集区均围绕地铁;而位于地图左上的聚集区经百度地图查询,为三个科技产业园所在处,青年人居多,骑行行为多,故出现了聚集现象.中心城区骑行次数并不多,分析原因:

(1)中心城区小区成熟,部分居民在冬季选择乘私家车出行.

(2)中心城区公共交通便利、路网发达,多数居民在冬季选择公交出行.

3.5不同时段和地段分析

(1)0~9时:

在0~9时的时间段内,在郊区的地铁站附近多呈现为绿色点聚集,说明大量居民选择地铁站作为终点(如图2所示).

在对北京市东北五环外马泉营地铁站附近的数据分析显示,在上班高峰期,居民多乘坐地铁向城市中心移动,几乎没有人从地铁站出发向外骑行.

在市中心城区的情况就与之相反,多呈现红色聚集,说明多数地铁乘客下车后,骑行共享单车前往上班的地点,在中心城区的地铁站,大多数骑行方向均呈现向外的发散状.

(2)9~16时:

对于9~16时段,中心城市和郊区的地铁区域并无大的差别,而相比于早高峰,产业园附近车辆移动则更密集,且出发点与终点大多重合,经使用百度地图查询确认,上述地点附近大多有麦当劳、肯德基等餐饮业,反映了骑行者用餐等需求的行为规律.

4结语

经过本次对城市共享单车位置大数据的研究工作,提出了一套数据采集、数据处理、数据分析和可视化展示的实现方法,数据处理过程均采用计算机编程实现,计算结果经过实践证明正确可行,通过对上述大数据规律的探索,能够对共享单车的使用高峰时段与地段有正确的认识,验证了大数据技术方法的实用性,为我们的城市管理更加高效提供实时可靠的数据支撑,具有良好的推广应用价值.

大数据论文范文结:

关于大数据方面的的相关大学硕士和相关本科毕业论文以及相关大数据论文开题报告范文和职称论文写作参考文献资料下载。

1、大数据时代论文

2、关于大数据的论文

3、大数据杂志

4、有关大数据的论文

5、健康大视野杂志

6、毕业论文题目大全集