交通行业运营车辆能耗计量设备检测大数据平台的设计与实现
《北京市2013-2017年清洁空气行动计划》中指出“2017年车用燃油总量较2012年下降5%, 污染物排放下降25%”, 因此北京市交通领域节能减排统计与监测工作任重而道远。为了实现上述目标, 首先需要在公交、轨道、出租、旅游、货运、省际、郊区、社会车辆等行业建立标准化、信息化的运营车辆能耗计量监测体系, 全面、准确、实时掌握运营行业车辆能耗计量数据。因此, 车辆能耗计量设备的计量性能和产品质量就成为运营车辆能耗计量监测工作的基础和关键。在北京市交通委、北京市质监局的支持下, 北京市交通行业节能减排中心与北京市计量检测科学研究院联合攻关, 共同研究, 启动了交通行业运营车辆能耗计量设备检测大数据平台的建设。
一、引言
交通行业营运客车的车型构成复杂, 车辆技术状态参差不齐, 包括城市公交车辆、出租车、郊区客运、旅游车辆、省际车辆、货运和社会车辆等7个行业、上千种车型。而且交通行业运营车辆的更新年限一般为8~10年, 车辆技术状态较为复杂。不同交通行业管理需求和技术手段参差不齐, 不同行业的政府管理部门和企业的管理工作及政策制定需求不同。但是, 作为“运营装备-用能企业-政府管理部门”三级能源排放计量监测体系建设都需要精细化的底层数据作为支撑。图1为北京市交通领域节能减排统计与监测平台。
基于交通行业运营车辆能耗和排放数据监测和统计的需求, 北京市交通行业节能减排中心在2014年承担了北京市“百项节能标准———营运车辆能耗计量器具功能及数据采集规范”的研究任务, 经示范应用, 并不断完善, 通过北京市交通委、北京市质监局的审查、批准, 颁布了DB11/T1269-2015《营运客车能源计量器具功能及数据采集规范》, 成为全国交通营运客车领域第一部能源计量标准规范。北京市计量检测科学研究院于2016年在承担市交通委下达的相关课题研究中, 形成《营运客车能源计量器具检测规范》, 并开展相
图1 北京市交通领域节能减排统计与监测平台
表1 无线数据采集检测
表2 现场采集检测
应的检测业务。
为保证营运车辆能耗计量监测数据的科学性和准确性, 更好地支撑“北京市交通领域节能减排统计与监测平台”建设, 需要运用先进的信息处理技术, 开发交通行业营运车辆能耗计量设备检测软件系统。
二、检测主要项目内容
项目检测内容主要包含:各项数据系统自动采集, 结合车辆类型分别运行不同的功能检测项, 如表1和表2所示。检测平台的检测结果, 系统自动记录并存储检测过程的历史数据。
现场采集装置示意图如图2所示。装置的实验室性能检测结果如表3所示。检测依据如表4所示。
三、系统需求
1. 实现检测工作现代化
该系统集合无线通信、数据库等一系列先进的信息技术, 使检测工作由传统的经验式逐步向以高科技手段为依托的现代化检测转变, 由传统的手动模式逐步向以信息化、数字化、网络化、智能化为主的现代检测模式转变, 进一步提高检测工作的准确度, 以实现检测工作现代化。
2. 实现检测效率高效化
检测人员通过登录系统, 自动收到检测的任务信息, 会将被检查企业信息引入系统, 将充分检测系统工作效率, 提升工作质量, 实现无纸化办公, 节能减排, 节省人力、物力资源, 缩短业务流转周期, 提高工作效率。
图2 现场采集检测 (装置示意图)
表3 实验室性能检测
表4 检测依据规范
3. 实现检测管理规范化
检测明确了检测职责, 为检测提供便捷的手段, 从而方便检测、规范检测、便于对检测的监督, 由粗放型向集约定量型转变, 提供规范的业务管理模式, 将大大提高政府行政效能和管理水平。
四、大数据平台架构 (见图3)
大数据处理平台主要由大数据实时计算平台、大数据离线存储平台和能耗计量决策支持平台组成, 相互作用、协调动作, 构成面向海量能耗检测数据的综合计量平台。该平台的建立, 可以解决能耗检测数据存储成本高、检索速度慢、实时处理等问题, 减少海量数据存储成本, 提高实时处理速度, 为实时能耗检测做足准备。
1. 大数据实时计算平台
大数据实时计算平台主要负责对在线数据的挖掘和分析, 比如实时地图匹配, 高性能、复杂车辆位置查询, 高性能、精准轨迹回放的支持。计算存储框架采用Hadoop, 分布式计算存储框架采用Storm, 利用噪声数据和平滑数据处理技术, 包括分箱、聚类、同归等, 结合统计分析, 特征向量提取, 主坐标/主成分分析, 模糊知识表示和发现等方法, 对不同检测环境下采集的数据进行特征提取。在降低数据维度的情况下, 不丢失重要特征信息。
2. 计量大数据离线存储平台
计量大数据离线存储平台主要负责计量数据预处理、计量数据压缩与存储、计量数据分段与分类匹配、计量分析模型与特征提取、计量聚类与相似性等。平台采用多层数据分析存储模式, 引入粒计算理论, 采用基于粒计算的关联规则挖掘算法Grc-AR, 在MC-Apriori算法的基础上结合数据的语义分析, 引入粒计算的思想把海量数据集划分成若干个语义点 (区域) , 然后对各个语义点进行操作并对结果进行整合得到最终结果, 以进一步减少数据规模, 提高海量数据处理和挖掘能力。根据不同数据格式设计合理的存储模型和压缩机制, 使得查询速度基本不受限于数据量的大小。
图3 大数据平台基础架构
3. 能耗决策平台
能耗决策平台, 是针对“计量大数据”在云计算环境下的基于Map Reduce并行处理技术的高性能并行处理方法和技术, 为高效能耗决策提供算法层面的支持。平台主要采用了基于距离的分类、决策树分类、贝叶斯分类、遗传算法、神经网络、SVM, 以及基于深度学习 (Deep Learning) 的机器学习分类方法。
五、总结
为了实现《北京市2013-2017年清洁空气行动计划》目标, 北京市交通委启动了交通行业营运车辆能耗计量设备检测软件系统的建设。为了解决交通行业营运客车的车型构成复杂、车辆技术状态参差不齐等问题, 系统采用了先进的Hadoop和Storm大数据存储和实时运算技术, 对检测数据进行深入挖掘、实时处理和智能计算, 并且采用多层移动数据分析平台, 提供高性能的时空运算支持, 提供了基于语义匹配的查询支持。该系统运行效果良好, 为北京市交通领域节能减排作出了重要贡献, 研究成果对其他城市交通领域提升能耗和排放监测技术水平具有重要的推广应用价值。
作者:刘莹 张克 徐龙
北京市交通行业节能减排中心 北京市计量检测科学研究院