交通事故成因的关联分析【字数:11282】
目录
摘要1
关键词1
Abstract1
Key words1
引言1
1 绪论1
1.1 研究的背景以及意义1
1.2 研究目的1
1.3国内外研究现状2
1.4 文章的结构和主要工作2
2 交通事故成因的分类和分析方法3
2.1 交通事故成因的分类3
2.1.1 人的因素3
2.1.2 车辆因素4
2.1.3 道路因素4
2.1.4 天气因素4
2.1.5 管理因素5
2.2 交通事故成因的分析方法5
2.2.1 单因素分析法5
2.2.2 多因素分析法5
2.2.3 分类分析法5
3 研究方法 6
3.1 关联规则及其测度6
3.1.1 事务和项集以及简单的关联规则6
3.1.2 简单关联规则的有效性和实用性6
3.1.3 关联规则主要的步骤6
3.2 Apriori算法7
3.3 Eclat算法8
4 实例分析 8
4.1 数据集的选取和分析8
4.2 数据集的预处理8
4.3 基于Apriori的分析9
4.4基于Eclat的分析11
4.5小结12
总结与展望13
致谢13
参考文献13
附录14
交通事故成因的关联分析
摘要
随着科技与生产力的发展,现代交通系统变得越来越复杂。随着快速的发展和人们对出行的需求,各种类型的车辆的生产和交易都越来越多,为了保证如此大量数目的车辆运行,现在道路建设也正在频繁的进行,如公路、铁路等随着发展越来越多,这些道路网在有限的土地空间里从横交错,更需要精细化的管理。同时,为了约束巨大的车流量,对于行车规范的规定也变得多且复杂。更有人为、天气、设备等多种因素,这些都可能导致交通事故发生概率提高。因此需要对交通事故深度挖掘,以便找到交通系统中的弊 *51今日免费论文网|www.51jrft.com +Q: ^351916072^
端,降低交通事故发生的几率。本文将介绍有关交通事故成因的分析及分类,并着重研究交通事故中多个因素之间的关联分析。针对交通事故的多因素分析,本文选择关联规则的Apriori算法和Eclat方法。将前述两个方法应用于芝加哥交通事故真实数据建立模型,根据实验结果找出各个影响因素之间的关联规则,从而可以知道年龄、天气等因素对哪种交通事故类型有更高的关联性,并更好地改善交通系统。
引言
1 绪论
1.1 研究的背景以及意义
现在多项新兴事业蓬勃发展,对高效的交通运输越来越依赖,城市道路扩张和各村道路的不断新修,慢慢增大道路的流量。由图11可以看出,从2010年到2018年,我国私人汽车拥有量和民用汽车拥有量都呈现不断增长的趋势[1]。
/
图11 20102018年私人汽车和民用汽车拥有量
随着互联网时代的到来,各项新兴行业应运而生,共享单车、网上打车、外卖以及快递行业以及迅速发展,路面上自行车、摩托车等非机动车辆数量迅速增加。由于人们在驾驶非机动车辆时交通意识淡薄,不是很清楚地知道非机动车交通规则;再加上外卖配送一般都处于道路上车流量的高峰期,外卖配送员为了按时送达外卖也会加速行驶,这些因素导致自行车和摩托车交通事故发生的数量在近年来增多。
综上所述,城市交通系统从密度和构成相较以往都发生了变化。道路上的车辆增多,在以汽车和行人为主的城市道路上又涌入了许多自行车和摩托车,路面交通变得更加复杂,这也提高了交通事故发生的风险,所以有必要对交通事故发生成因进行更深入的研究。
1.2 研究目的
基于上述研究的背景,可以知道交通事故的数量虽然相比之前有所减少,但是诱发交通事故的原因变得愈加复杂。新兴的交通工具、新的道路的设计以及应用于道路交通系统的新的设备和技术手段等,都会对交通事故发生产生一定的影响。所以需要从现在已知发生的交通事故的数据中挖掘出在种种因素下的发生率。通过对交通事故数据信息各个特征的不同属性分析,可以找到引发交通事故的热点因素。通过多因素关联分析法,寻找到各种因素之间的关联规则,发现交通事故致因的某几种特征组合是否会更高概率的引发交通事故。在数字模型建立后,可以应用到实际情况中,建立一些保障的措施。
1.3 国内外研究现状
国内的研究状况主要是以下几个方面。早期,关于交通事故成因的多因素分析方法大多使用灰色关联分析,例如,周伟根据已知的交通事故影响因素,用灰色关联分析法对西安的交通事故进行全面的分析[2];柴涛等人选取了灰色系统理论中的灰色预测、关联分析法,对太原市1996至1998年3年中交通事故数值进行了计算预测,确定了机动车、非机动车、机动车驾驶员、非机动车驾驶员、行人、乘客、道路等众多因素之间的主次关系,以便管理部门抓住重点[3]。最近多用数据挖掘中关联规则的Apriori算法研究交通事故因素的关联分析,江山、宋柯等提出把灰色关联分析与关联规则的Apriori算法相结合起来,运用到交通事故的数据分析,找到了天气、车辆制动、路面状况对交通事故的影响[4];赵妍通过研究交通违法信息数据,说明了对交通事故数据挖掘分析的必要性。在分析Apriori的基本思想、实现步骤时,发在现算法过程中,寻找频繁项集时会产生大量候选项集,并且会重复多次执行扫描指令,这大大降低了算法的速度。针对此算法运行中的缺点,删除数据库中无意义的数据项、压缩数据集大小、对频繁项集进行剪枝等方法可以有效地减少候选集的数量,并且提出了改进Apriori算法,最后得到了路段、交通方式、年龄及性别等对交通违法行为的影响[5]。因为交通事故的原因呈现出多样性的特点,叶颖婕提出了经典Apriori算法只适用于单一维度的关联挖掘,并且在运算过程中需要多次重复执行任务的缺点,由此提出了相关的改进方法,得出在江苏和浙江9月份交通事故发生的概率提升且江苏和广东交通事故发生率通常较高[6]。
原文链接:http://www.jxszl.com/jsj/sxtj/606719.html