利用数据分析方法研究徐州大气污染特性
1.徐州一中综合实践活动(研究性学习)课题实施方案申报表
课题名称 |
利用数据分析方法研究徐州大气污染特性 |
||||
课 题 组 成 员 及 有 关 情 况 |
姓名 |
性别 |
班级 |
职务 |
学号 |
张海璐 |
女 |
高一(14) |
组长 |
||
王思涵 |
女 |
高一(14) |
组员 |
||
王梓安 |
男 |
高一(14) |
组员 |
||
指导教师 |
|||||
课 题 研 究 的 目 的 及 主 要 内 容 |
研究目的: 针对徐州市长期面临的结构性大气污染问题,小组成员旨在通过Python数据分析技术,深度挖掘2015-2023年间多源异构的大气环境与气象数据,揭示污染物浓度的时间演变规律及其与复杂气象流场的内在动力学响应机制,为精准治污提供量化依据。 主要内容: 实验一、空气污染成分分析: 利用Python提取2015-2023年徐州市空气质量监测数据,对比分析PM2.5、PM10、SO2、NO2、O3、CO等主要污染物的浓度占比及变化特征,解析首要污染物构成及其季节性成分演变规律。 实验二、探索空气质量随时间变化规律: 通过对海量历史长序数据的降维与聚合计算,探究徐州市各项空气污染指标在日内24小时周期、月度季节循环以及年际大尺度上的动态分布与演化特性; 实验三、探索空气质量随气候变化规律: 引入同期的风速、温度等气象要素同化数据,构建多变量对比分析模型,深度解构不同气象条件对大气污染物生消、扩散过程的动力学调控作用。 |
||||
研 究 假 设 |
徐州市空气污染以PM2.5和PM10为主;空气质量存在显著的时间周期性,呈现“冬季高、夏季低”的相态特征;风速、温度等气候因子对污染物的积聚与消散具有关键的驱动作用。 |
||||
研 究 方 法 |
计算机数据分析法、对比分析法、文献研究法。 |
||||
研 究 步 骤 (各 阶 段 的 主 要 内 容 和 时 间 安 排) |
一 、2025年11月1日-2025年11月15日 确定研究主题,查阅国内外大气污染及气象学相关文献,设计项目实施方案。 二、2025年11月16日-2025年11月30日 采集并建立徐州市2015-2023年高频空气质量监测数据集及同期的地面气象站同化数据集,完成前期数据与硬件设施准备。 三、2025年12月1日-2026年1月15日 1. 搭建Python开发环境,引入Pandas和Numpy库进行数据清洗; 2. 针对实验一,清洗多污染物数据矩阵并计算各项成分占比; 3. 针对实验二,利用分组聚合算子提取逐时、逐月及逐年的均值波形; 4. 针对实验三,运行插值算法对齐低频气象数据与高频污染数据,提取气候特征参数; 5. 利用Matplotlib进行高维数据特征的可视化图表渲染。 四、2026年1月16日-2026年1月20日 对三大实验的图表进行深度物理机制释义,结合气象热力学理论与宏观政策背景,完成课题核心数据的逻辑论证。 五、2026年1月21日-2026年2月20日 撰写结题报告,总结归纳实验结论,准备Python源码的归档审核。 |
||||
成 果 形 式 |
研究报告、Python数据处理源代码 |
||||
论 证 小 组 意 见 |
论证人签名: 年 月 日 |
||||

2.徐州一中综合实践活动(研究性学习)记录表
课题题目:利用数据分析方法研究徐州大气污染特性 |
编号: |
||
活动时间:2026年12月13日 |
第 3 次 |
活动地点:徐州一中 |
|
指导教师: |
班级:高一(14)班 |
||
参加活动成员: 组内: 张海璐、王思涵、王梓安 组外: |
|||
活动内容: 一、目的(解决什么问题): 探讨并解决“实验三:空气质量随气候变化规律”中多源异构数据集融合的时间频率错位难题。中国环境监测总站(China National Environmental Monitoring Center,CNEMC))提供的逐小时空气质量数据与美国国家气候数据中心(National Climatic Data Center,NCDC)提供的逐三小时(3h)气象参数无法直接对应进行相关性建模,且气象数据中存在大量-9999的缺省值标识。 二、形式(小组讨论、试验、查阅资料、调查、实地测量): 代码测试、查阅数据科学技术资料、小组圆桌讨论。 三、过程: 1、组员各自在本地尝试直接剔除-9999异常值,发现会导致时间序列大量断裂,完全破坏了气候演变的连贯性。 2、组长张海璐提出利用“最近邻时间节点”和线性插值结合的处理方案,小组对该代码的合理性进行讨论与推演。 3、查阅气象数据处理规范,最终确立了将3小时粒度的气象特征通过样条映射至相邻小时窗口的方法,形成共识并写入主程序脚本以打通实验三的数据壁垒。 四、结果(得到什么结论、解决哪些问题、是否完成预定目标和计划、出现的新问题) 1、结论:大气要素在短时间内属于连续变化的标量场,必须采用填充或插值算法替代缺失值,并将低频气象数据升采样平铺,这是保障气候与污染分析不失真的关键路径。 2、解决了核心技术瓶颈:成功生成了一个时间轴完全对齐的污染-气象多维数据集,为探究风速、温度与污染物的关联扫清了障碍。 3、完成了实验三的关键预处理计划。新问题:整合后的全量数据集极其庞大,后续进行散点回归拟合时运算较慢,需考虑优化代码的底层效率。 记录者: 张海璐 |
|||
注:1、由课题组长指派专人负责填写,备追踪课题研究过程时使用。
2、本表一式三份,交由年级处、指导教师、课题组长存档。
3.徐州一中综合实践活动(研究性学习)课题研究成果报告
题目: 利用数据分析方法研究徐州大气污染特性 |
编号: |
||||
课题组成员 |
组长:张海璐 |
组员:王思涵、王梓安 |
|||
指导教师: |
报告执笔人: 张海璐、王思涵、王梓安 |
完成时间:2月20日 |
|||
主导课程:信息技术 |
相关课程:信息技术 |
||||
(一)书面材料 |
|||||
课题成果: 1) 预期的成果: 三个实验均成功,符合预定推测。 2) 课题实际取得的成果: 实验一结果:2015-2023年徐州空气质量整体属良级,但颗粒物(PM2.5和PM10)超标率均超过64%,是污染超标的主导因子。研究发现颗粒物与燃煤、尾气等一次污染源高度同源,且首要污染物正由单一颗粒物向颗粒物与臭氧(O3)协同污染转变。 实验二结果:徐州空气质量呈现显著的时间周期性,年际趋势总体改善,季节上呈现冬季高、夏季低的“V”型特征。日内变化则表现为“双峰一谷”,污染峰值出现在上午7:00-10:00的交通与工业活动高峰期,下午时段空气质量最为良好。 实验三结果:风速与AQI呈显著负相关,风速越大越有利于污染物扩散,“静稳小风”是累积污染的关键诱因。温度的影响较为复杂,升高温度虽能通过增强对流降低颗粒物浓度,但会加速光化学反应导致臭氧浓度上升,使综合指数呈现非线性变化。 |
|||||
参考书目及资料: [1]饶永才,冯春莉,邓国庆,等.2019—2021年徐州市大气细颗粒物化学组成特征及来源解析[J].中国环境监测,2023,39(02):158-168.DOI:10.19316/j.issn.1002-6002.2023.02.16. [2]李昌龙,冯春莉,孙瑞.2019—2023年徐州市PM2.5和臭氧复合污染特征分析[J].四川环境,2024,43(05):7-14.DOI:10.14034/j.cnki.schj.2024.05.002. [3]李昌龙.徐州市区大气臭氧变化特征及与气象要素的相关性分析研究[J].环境科学与管理,2018,43(06):77-81. |
|||||
附录材料(要求提交原始记录)包括: 活动记录表(1)份 访谈表( )份 实验记录( )份 调查表( )份 测量数据记录( )份 |
|||||
(二)实物材料,如制作的图片,模型,照片,事物样本,音像资料等 编号: 名称: 制作者: 内容: 功能: |
|||||
(三)演示课题成果所需要的条件,要求(如特别需要,请说明): 计算机、Python、matlab等软件环境。 |
|||||
4.利用数据分析方法研究徐州大气污染特性
徐州市第一中学高一(14)班 张海璐、王思涵、王梓安
【摘要】
随着工业化与城市化进程加快,大气污染治理问题日益突出。本文基于Python对徐州市2015—2023年空气质量及气象监测数据进行系统分析。研究围绕污染成分特征、时间演变规律及气象耦合机制三个方面展开。结果表明:徐州市以PM2.5污染为主,冬季二次无机气溶胶显著增加;污染浓度呈现日内“双峰一谷”和季节“V”型变化特征,年际总体改善明显;风速、温度与降水等气象因素对污染物浓度具有显著调控作用。本研究为区域大气污染精细化治理与预警提供数据支持。
【关键词】数据分析;PM2.5;时间演变;气象影响;空气质量
一、研究背景
近年来,大气污染已成为制约我国城市可持续发展最严峻的环境挑战之一。空气质量不仅直观映射了一个地区的生态健康程度,更与心血管、呼吸系统疾病的发病率紧密相连。尽管近年来我国相继实施了《大气污染防治行动计划》及《打赢蓝天保卫战三年行动计划》,使全国地级以上城市的年均PM2.5浓度实现了历史性的大幅下降,但在部分老工业基地,深层次的大气环境矛盾依然棘手。
徐州市地处苏、鲁、豫、皖四省交界,历史上长期依赖煤炭、电力及重化工业,这种以化石能源为底座的偏重型产业结构,导致其结构性大气污染尤为突出。在特定的季节交替与静稳天气下,“三尘”污染及复合型灰霾极易在城市上空形成大范围集聚。步入“十四五”时期,生态保护进入了减污降碳协同增效的深水区,传统的粗放式环境管理已难以适应新阶段的治理诉求。
鉴于空气污染是一个高度复杂的非线性系统,其不仅受制于污染源的排放结构,更深受多时间尺度规律及区域气象流场的双重钳制。为此,本课题跳出传统的机理模拟范式,引入计算机大数据分析手段,对徐州过去十年的海量历史观测数据进行回溯重构。我们精心设计了三大核心实验——空气污染成分分析、时间变化规律探索、气候响应机制研究,旨在用量化的Python代码拨开污染迷雾,为徐州市下一阶段的环境靶向治理与绿色高质量发展寻找破局之道。
二、数据来源与实验平台
开展大尺度的大气追踪分析,底层数据的广度与精度至关重要。本研究整合了双通道权威数据源:
1、环境空气质量监测网数据:抽取自中国环境监测总站,时间跨度为2015至2023年。数据集包含了PM2.5、PM10、SO2、NO2、O3、CO及综合指数(AQI)等常规考核因子的高频逐时波形序列。
2、多维气象场同化数据:源自美国国家气候数据中心。提取了徐州地区地表气温、气压、风向风速、降水量等核心气候表征数据,原始采样精度为每3小时(3h)一次。
3、实验运行环境:算法架构依托Python 3.2语言,调用Pandas和Numpy框架执行百万级数据矩阵的清洗与切片聚合,利用Matplotlib引擎进行图表渲染。
三、研究过程
收集徐州逐小时空气质量数据文件,为确保研究数据的真实性、权威性和完整性,收集2015-2023年来自中国环境监测总站的徐州市空气质量监测数据,其中污染物浓度均为日评价值。空气质量数据类型包括PM2.5,PM10,SO2,NO2,O3,CO,AQI。全国空气质量数据均来自中国环境监测总站的全国城市空气质量实时发布平台。数据格式第一行为列名,分别是日期、小时、数据类型、取值。例如2015年1月02日1时空气质量数据如表3-1。
表3-1空气质量数据示例
日期 |
小时 |
类型 |
徐州 |
20150102 |
1 |
AQI |
103 |
20150102 |
1 |
PM2.5 |
77 |
20150102 |
1 |
PM2.5_24h |
58 |
20150102 |
1 |
PM10 |
154 |
20150102 |
1 |
PM10_24h |
123 |
20150102 |
1 |
SO2 |
50 |
20150102 |
1 |
SO2_24h |
63 |
20150102 |
1 |
NO2 |
38 |
20150102 |
1 |
NO2_24h |
37 |
20150102 |
1 |
O3 |
21 |
20150102 |
1 |
O3_24h |
63 |
20150102 |
1 |
O3_8h |
20 |
20150102 |
1 |
O3_8h_24h |
48 |
20150102 |
1 |
CO |
1.7 |
20150102 |
1 |
CO_24h |
1.53 |
污染状态评价标准:
根据中华人民共和国生态环境部 环境空气质量指数(AQI)技术规定(试行)如图3-1所示。

图3-1空气质量指数技术规定
2、徐州空气质量数据预处理
由于数据中会存在“噪声”(缺失值、异常值),因此需要统一数据类型与时间格式,将原始数据转化为符合分析要求的“干净数据”,保障后续分析结果的准确性。
2.1数据类型标准化转换
将年份、月份、日期、小时字段转换为整数类型,将各污染物浓度字段转换为浮点数类型;对无法转换的异常值(如非数值字符)标记为缺失值(NaN),避免计算错误。
2.2缺失值检测与合理化处理
统计各污染物字段的缺失值数量及缺失率:若缺失率<5%,采用“中位数填充法”补充缺失值,缓解极端值影响;若缺失率≥5%,标注该字段缺失情况,分析时单独说明并排除该部分数据,避免结果偏差。异常值识别与修正参考《环境空气质量标准》(GB3095-2012)设定各污染物浓度的合理范围(如AQI:0-500、PM2.5小时浓度:0-1000μg/m³、NO2:0-200μg/m³);将超出合理范围的异常值修正为对应边界值(如AQI>500,则修正为500),剔除明显错误数据对分析的干扰。
3、徐州空气质量数据分析
3.1整体水平分析
计算空气质量指数及污染物浓度的均值、中位数、最大值、最小值等统计量,明确徐州大气污染的整体水平;参考国标(PM2.5日均≤35μg/m³、PM10日均≤70μg/m³),按日聚合数据计算主要污染物的超标天数与超标率,量化污染超标程度。
计算各污染物的皮尔逊相关系数,将小时级数据聚合为日均浓度,样本量充足,能消除日内随机波动,精准反映污染物间的长期稳定关联。分析污染物间的关联程度推断污染来源的关联性。
基于各污染物浓度值,判定每个时段的首要污染物;统计各污染物作为首要污染物的频次及占比,明确徐州大气污染的核心贡献成分。首要污染物的定义是“对当前时段AQI贡献最大的污染物”,需基于逐小时浓度判定。不能直接比较污染物浓度数值(如PM2.5的μg/m³和CO的mg/m³单位不同,数值无可比性),需先计算各污染物的空气质量分指数(IAQI),以IAQI最大值判定首要污染物(符合国标GB3095-2012的AQI计算规则)。通过分析整体占比、年际占比和季节占比对首要污染物进行分析。整体占比即统计2015-2023年所有小时级数据中各污染物作为首要污染物的频次/占比,直接明确核心贡献成分;年际占比即按年份聚合统计,观察首要污染物结构的年际变化;季节占比即按季节聚合统计,分析首要污染物的季节特征。
实验二、徐州空气质量随时间变化规律
1、数据收集与预处理
参考实验一的数据处理流程,对空气质量和气象数据进行清洗和统一处理,例如剔除缺失值、异常值,统一时间格式,并将气象数据按小时补齐,使空气质量数据与气象数据一一对应。根据需要对数据进行正态化或标准化,形成可用于分析的干净数据集。
对近十年的空气质量数据进行分组处理,计算出每年每天每小时的空气质量指数和污染物含量的平均值,同时计算出每月和每年相应数据的平均值。对于气候数据,主要获取温度和风速的相应日期的数据,与对应日期的空气质量数据进行组合,更好的体现出空气质量与气候的关联性
图3-2代码功能为将空气质量数据集的十年内每一年的每小时的相关空气质量评估值取平均值,只保留年月日小时以及AQI和PM2.5含量,并对十年的总评估值对每小时取平均值,获得十年内平均每24小时空气质量分布情况。
图3-2空气质量数据集处理代码
处理后的数据如图3-3所示
图3-3处理后的数据
使用类似代码可得到十年内平均一年12个月的空气质量分布情况与平均每一年的空气质量情况。
2、徐州空气质量随时间变化规律分析
2.1日变化规律分析准备
(1)分组计算日均浓度:利用Python等工具按小时或日时间段对数据分组,计算每个小时段或每日日内空气质量AQI指数。具体可采用数据透视表(pivot)技术,以日期和小时为索引,统计AQI的平均值。
(2)绘制日变化曲线:根据分组结果绘制日内浓度变化折线图,观察污染物浓度在24小时内的波动特点。重点识别交通高峰(早晚高峰)和夜间排放等时段的变化趋势,并进行定量描述。
(3)统计特征分析:计算每天不同时间段(如早晨、白天、夜晚)的均值和方差,比较不同时间段空气质量差异。可进一步分析工作日与休息日的日变化差异,揭示人为活动与污染时序的联系。
2.2月变化规律分析准备
(1)计算月度平均:按月对数据分组,计算每月各污染物平均浓度。可按年份计算每年每月平均,也可计算多年的长期月均值,以突出季节性特征。
(2)季节分组比较:根据季节特征,将月份划分为春、夏、秋、冬四组,比较不同季节的空气质量指标。比如分析冬季(供暖期)与夏季(雨季)污染水平的差异。
(3)可视化与统计:绘制每月AQI折线图或箱线图,分析指数度随月份的变化趋势。可以使用差异性检验检查各月或各季之间污染物浓度的显著性差异。
2.3年际变化规律分析准备
(1)计算年度平均:计算每年的空气质量指标年均值。将多年结果汇总。
年度趋势可视化:绘制“年份—年均AQI”折线图,观察空气质量整体变化趋势。同时可统计各年的污染天数,对比治理效果变化情况。
(2)趋势判断:通过对比年度均值大小,判断空气质量总体呈改善趋势、波动趋势或恶化趋势。
实验三、徐州空气质量受气候影响研究
1、数据收集与整合
除空气质量数据外,同步收集徐州的气象数据,至少包括温度(℃)和风速(m/s)等指标,气象数据源自美国国家气候数据中心(NCDC)。提取了徐州地区地表气温、气压、风向风速、降水量等核心气候表征数据,原始采样精度为每3小时一次。
2、数据预处理
首先对缺失的数据进行剔除或使用最近时间的相应值等方式填充。其次由于气象数据中含有许多丢失值标识为-9999,本次实验使用最接近时间的相应值进行替代。而后将数据格式统一转换为相同的数据类型。最后对于日期进行格式统一处理,由于气象数据为每三个小时去一次相应值,为了更好的体现空气质量与气候的关联性,本次实验使用该值作为三小时内每小时相应值。
图3-4为对气象数据进行处理的代码,首先对于数据格式进行处理,数据间统一使用逗号进行间隔,而后将值为-9999的缺省值使用最接近时间的对应值进行替代,再然后将每三小时的数据抽象赋给每一个小时,得到初始处理后数据如图3-5所示。
3、温度对空气质量影响研究
3.1 相关性计算
计算温度与AQI、PM2.5、O3之间的皮尔逊相关系数,初步判断温度与污染物之间是否存在正相关或负相关关系。
3.2 可视化展示
绘制温度与AQI散点图与折线图,观察两者之间是否存在明显变化趋势。
图3-4对气象数据进行处理的代码
图3-5初始处理后数据
4、风速对空气质量影响研究
4.1 分组统计
分别计算不同风速条件下的AQI及PM2.5平均值,对比不同风速下污染水平差异。
4.2 散点图分析
绘制风速与AQI散点图与折线图,观察风速增大是否有利于污染物扩散。
四、结果与分析
4.1实验一结果
本课题利用2015年至2023年徐州市空气质量国控站点监测数据,重点围绕AQI指数及PM2.5、PM10、CO、NO2、SO2、O3等主要污染物,运用描述性统计、皮尔逊相关分析、空气质量分指数(IAQI)判定等方法,从整体水平、污染物关联、首要污染物分布三个核心维度,系统探究徐州市近九年大气污染的特征、成因及演变规律,为区域大气污染精准治理提供数据支撑与理论参考。
4.1.1 整体水平分析
如表4-1所示,2015-2023年徐州市大气空气质量监测有效样本量达75445个,样本量充足,统计结果具有较高可靠性。从空气质量指数(AQI)来看,其均值为85.62,整体处于良级水平,但标准差高达52.28,表明研究期间徐州市空气质量波动幅度较大,可能受气象条件变化、排放强度波动等因素影响;AQI中位数为72,与均值接近,说明大部分时段空气质量维持在良级,但最大值达500,存在极端严重污染情况。从各污染物浓度来看,颗粒物污染问题尤为突出,PM2.5均值为54.52μg/m³、PM10均值为101.19μg/m³,均远超《环境空气质量标准》(GB3095-2012)日均限值,且两者中位数分别为42μg/m³、85μg/m³,同样超出国标限值,反映出徐州市颗粒物污染长期处于高位水平,这与区域工业排放、扬尘污染、机动车尾气排放等各类污染源的持续贡献密切相关。气态污染物中,CO、NO2、SO2均值分别为0.93mg/m³、35.97μg/m³、17.77μg/m³,均处于国标达标范围,O3均值为68.00μg/m³整体达标,但四类气态污染物最大值均较高,其中O3极值达308μg/m³、CO极值达8.28mg/m³,说明徐州市存在气态污染物阶段性高浓度污染特征,可能受短期工业排放增加、不利气象扩散条件等因素影响,导致污染物短暂积聚。
表4-1 2015-2023年徐州大气空气质量指数及污染物浓度描述性统计结果
统计量 |
空气质量指数及各污染物指标 |
||||||
AQI |
CO mg/m³ |
NO2 μg/m³ |
O3 μg/m³ |
PM10 μg/m³ |
PM2.5 μg/m³ |
SO2 μg/m³ |
|
样本量 |
75445 |
75445 |
75445 |
75445 |
75445 |
75445 |
75445 |
均值 |
85.62 |
0.93 |
35.97 |
68.00 |
101.19 |
54.52 |
17.77 |
中位数 |
72 |
0.8 |
31 |
58 |
85 |
42 |
12 |
标准差 |
52.28 |
0.49 |
21.49 |
48.21 |
71.68 |
41.84 |
15.97 |
最小值 |
7 |
0.2 |
3 |
2 |
3 |
2 |
3 |
25%位数 |
55 |
0.6 |
19 |
30 |
56 |
27 |
8 |
50%位数 |
72 |
0.8 |
31 |
58 |
85 |
42 |
12 |
75%位数 |
101 |
1.12 |
48 |
96 |
127 |
68 |
21 |
最大值 |
500 |
8.28 |
165 |
308 |
1804 |
378 |
461 |
结合表4-2和表4-3所示,2015-2023年徐州市大气监测总天数为3228天,整体超标情况突出:PM2.5超标率64.16%、PM10超标率64.87%,颗粒物是污染超标的核心主导因子,综合超标率达70.57%,污染超标现象较为普遍。从年际变化来看,2015-2017年超标率处于高位,2017年达到峰值(综合超标率87.4%);2018年后各类污染物超标率呈持续下降趋势,2022年综合超标率降至51.23%,治理成效显著;2023年超标率小幅回升,但仍远低于前期高位水平,后续需持续强化颗粒物管控。
表4-2 2015-2023年徐州大气PM2.5、PM10及综合污染物超标情况整体统计
总天数 |
3228 |
PM2.5超标天数 |
2071 |
PM2.5超标率(%) |
64.16 |
PM10超标天数 |
2094 |
PM10超标率(%) |
64.87 |
至少一种污染物超标天数 |
2278 |
至少一种污染物超标率(%) |
70.57 |
表4-3 2015-2023年徐州大气PM2.5、PM10及综合污染物超标情况年度统计
年份 |
总天数 |
PM2.5超标天数 |
PM2.5超标率(%) |
PM10超标天数 |
PM10超标率(%) |
至少一种污染物超标天数 |
至少一种污染物超标率(%) |
2015 |
364 |
282 |
77.47 |
290 |
79.67 |
304 |
83.52 |
2016 |
366 |
258 |
70.49 |
289 |
78.96 |
295 |
80.6 |
2017 |
365 |
305 |
83.56 |
303 |
83.01 |
319 |
87.4 |
2018 |
360 |
263 |
73.06 |
260 |
72.22 |
279 |
77.5 |
2019 |
364 |
259 |
71.15 |
247 |
67.86 |
273 |
75 |
2020 |
366 |
222 |
60.66 |
208 |
56.83 |
246 |
67.21 |
2021 |
365 |
184 |
50.41 |
197 |
53.97 |
211 |
57.81 |
2022 |
365 |
155 |
42.47 |
160 |
43.84 |
187 |
51.23 |
2023 |
313 |
143 |
45.69 |
140 |
44.73 |
164 |
52.4 |
4.1.2 污染物相关性分析
如表4-4及图4-1相关性热力图所示,2015-2023年徐州市大气污染物间的关联特征清晰,AQI与PM2.5、PM10呈极强正相关(相关系数均为0.94),且PM2.5与PM10相关系数达0.83,表明两类颗粒物来源高度同源,是驱动AQI升高的核心因子;同时,CO与SO2、NO2呈中等强度正相关(相关系数分别为0.76、0.63),PM2.5与CO、NO2亦存在较强正相关(相关系数0.72、0.71),反映燃煤排放、机动车尾气等一次污染源对颗粒物及常规气态污染物存在协同贡献特征;而O3与所有污染物均呈负相关(与NO2相关系数-0.48),体现出O3作为二次污染物,与一次污染源排放的前体物在生成规律、时空分布上存在显著差异,污染成因具备独立性。
表4-4 2015-2023年徐州大气空气质量指数与污染物的皮尔逊相关性矩阵
AQI |
CO |
NO2 |
O3 |
PM10 |
PM2.5 |
SO2 |
|
AQI |
1.00 |
0.66 |
0.66 |
-0.27 |
0.94 |
0.94 |
0.43 |
CO |
0.66 |
1.00 |
0.63 |
-0.40 |
0.62 |
0.72 |
0.76 |
NO2 |
0.66 |
0.63 |
1.00 |
-0.48 |
0.66 |
0.71 |
0.50 |
O3 |
-0.27 |
-0.40 |
-0.48 |
1.00 |
-0.25 |
-0.37 |
-0.23 |
PM10 |
0.94 |
0.62 |
0.66 |
-0.25 |
1.00 |
0.83 |
0.47 |
PM2.5 |
0.94 |
0.72 |
0.71 |
-0.37 |
0.83 |
1.00 |
0.43 |
SO2 |
0.43 |
0.76 |
0.50 |
-0.23 |
0.47 |
0.43 |
1.00 |
图4-1 2015-2023年徐州大气污染物相关热力图
4.1.3 首要污染物判定
结合表4-5、表4-6及污染物占比图表可知,2015-2023年徐州市CO、SO2作为首要污染物的占比常年低于1%,可忽略不计,核心贡献成分为PM10、PM2.5和O3。从年际变化来看,2015-2019年PM2.5为核心首要污染物,2020年后其占比持续下降,O3占比从2015年的10.19%升至2023年的36.31%,污染结构由单一颗粒物主导逐步向颗粒物与O3协同污染转变。从季节特征来看,首要污染物呈现显著季节性差异,冬季PM2.5占比达68.54%为绝对主导,夏季O3占比44.26%成为核心污染物,春季PM10占比45.19%居首,秋季NO2占比15.15%高于其他季节,凸显出污染来源与气象条件、排放强度的季节适配性特征。
表4-5 2015-2023年徐州大气各类污染物年际占比(%)
年 |
CO |
NO2 |
O3 |
PM10 |
PM2.5 |
SO2 |
2015 |
0.52 |
5.78 |
10.19 |
42.56 |
40.62 |
0.33 |
2016 |
0.46 |
7.96 |
10.25 |
50.51 |
30.01 |
0.81 |
2017 |
0 |
6.91 |
17.05 |
33.78 |
42.27 |
0 |
2018 |
0.09 |
8.89 |
18.77 |
27.57 |
44.68 |
0 |
2019 |
0.05 |
8.17 |
19.53 |
30.21 |
42.04 |
0 |
2020 |
0 |
9.18 |
21.65 |
32.17 |
36.99 |
0 |
2021 |
0.08 |
7.36 |
23.38 |
42.32 |
26.86 |
0 |
2022 |
0.01 |
5.23 |
29.84 |
38.72 |
26.18 |
0.01 |
2023 |
0.15 |
3.15 |
36.31 |
36 |
24.39 |
0 |
图4-2 2015-2023年徐州大气各类污染物年际占比(%)
表4-6 2015-2023年徐州大气各类污染物季节占比(%)
季节 |
CO |
NO2 |
O3 |
PM10 |
PM2.5 |
SO2 |
冬季 |
0.03 |
3.19 |
1.13 |
26.97 |
68.54 |
0.14 |
夏季 |
0.18 |
5.11 |
44.26 |
38.18 |
12.13 |
0.14 |
春季 |
0.09 |
4.78 |
19.57 |
45.19 |
30.35 |
0.02 |
秋季 |
0.29 |
15.15 |
16.26 |
37.58 |
30.49 |
0.23 |
图4-3 2015-2023年徐州大气各类污染物季节占比(%)
4.2实验二结果
本课题利用2015年至2023年徐州市空气质量国控站点监测数据,重点围绕AQI指数,从日内、月内、月度、年际四个时间维度出发,运用统计分析与可视化方法,系统揭示了徐州市近十年空气质量的时间演变特征与规律。
4.2.1日内变化规律分析
如表4-7,图4-4所示,每天的上午7点到10点之间,由于交通活动增加,工业排放增加等因素,空气质量较差。而下午13点到18点,由于交通活动减少,同时受气象条件和大气扩散的影响,白天污染物扩散速度较快,有利于空气质量改善,使得空气质量较为良好,而到了晚间,由于下班高峰期交通活动增加,而且大气层内的污染物相对积聚,导致空气质量下降。
表4-7平均每日24小时空气质量分布规律表
hour |
AQI |
PM2.5 |
0 |
95.880 |
64.472 |
1 |
95.746 |
64.809 |
2 |
96.295 |
65.573 |
3 |
96.320 |
66.238 |
4 |
97.538 |
67.608 |
5 |
98.115 |
67.977 |
6 |
99.396 |
69.272 |
7 |
99.496 |
69.752 |
8 |
101.276 |
71.019 |
9 |
103.643 |
71.371 |
10 |
102.782 |
68.938 |
11 |
99.257 |
64.895 |
12 |
94.942 |
60.560 |
13 |
90.949 |
56.675 |
14 |
87.981 |
53.719 |
15 |
86.220 |
52.127 |
16 |
85.088 |
50.989 |
17 |
85.165 |
51.222 |
18 |
85.774 |
52.697 |
19 |
88.380 |
55.853 |
20 |
91.150 |
59.158 |
21 |
93.580 |
61.379 |
22 |
95.024 |
62.709 |
23 |
96.248 |
64.018 |
图4-4平均每日24小时空气质量分布规律折线图
4.2.2月内变化规律分析
如图4-5所示,该折线图展示了徐州市在长达十年(2015-2023年)的时间跨度内,空气质量指数(AQI)在一个月中从第1天到第31天的平均分布情况。具体而言,图上的每一个数据点,都是过去十年中所有月份对应日期的AQI平均值。
图4-5平均月内每日空气质量分布规律
观察该图,最显著的特征是曲线的高度平稳性和无规律性。曲线在整个31天的周期内,没有表现出任何持续上升、下降或明显的周期性波动规律。
出现该现象的原因主要有两点:
(1)气象与人为周期的非对齐性: 影响空气质量的主要因素是气象条件和人为活动周期。这些周期与公历月份中的具体日期并没有固定的对应关系。例如,某个月的15号可能是周末且天气晴好(AQI低),而另一个月的15号可能是工作日且遭遇重污染天气(AQI高)。
(2)大数据的“削峰填谷”作用:当我们将长达10年的数据按“日”进行平均时,海量的数据点相互抵消了极端值。季节性的巨大差异(冬高夏低)和天气过程引起的短期剧烈波动,在如此长时间跨度的平均计算中被彻底抹平。
该图表有力地证明了:从长期平均的角度来看,徐州市的空气质量水平与月份中的具体日期编号(是月初、月中还是月末)没有相关性。
4.2.3月度变化规律分析
表4-8与图4-6展示了徐州市AQI的月度均值变化规律。
冬季空气质量较差:一般来说,冬季(1月至3月)的空气质量相对较差,其中1月的平均AQI达到了130.57,是一年中最高的。冬季空气质量较差可能与以下因素有关:暖气供暖和工业生产增加导致的燃煤排放增加,增加了大气中的颗粒物和污染物浓度。冬季气象条件不利于空气污染物的扩散,导致污染物滞留在空气中。
夏季空气质量相对较好:相比之下,夏季(6月至8月)的空气质量相对较好,平均AQI低于其他季节。其中7月的平均AQI达到了50.45,是一年中最低的。夏季空气质量改善可能与以下因素有关:夏季气温升高,污染物扩散速度加快,有利于减少空气污染物的滞留。夏季一般没有供暖需求,工业生产中燃煤量减少,减少了大气中的颗粒物和污染物排放。
秋季和春季过渡期:秋季(9月至11月)和春季(4月至5月)的空气质量处于过渡期,AQI和PM2.5浓度处于中等水平。
表4-8平均每月空气质量分布规律表
Month |
AQI |
PM2.5 |
1.0 |
130.573 |
96.248 |
2.0 |
103.673 |
74.367 |
3.0 |
100.669 |
62.480 |
4.0 |
85.701 |
49.986 |
5.0 |
81.493 |
45.911 |
6.0 |
74.175 |
40.747 |
7.0 |
50.454 |
28.898 |
8.0 |
52.467 |
29.035 |
9.0 |
62.010 |
35.148 |
10.0 |
79.698 |
49.496 |
11.0 |
96.340 |
65.298 |
12.0 |
122.602 |
88.426 |
图4-6平均每月空气质量分布规律折线图
4.2.4年度变化规律分析
表4-9和图4-7展示了徐州市AQI的年度均值变化规律。
年均空气质量指数(AQI)趋势:2015年至2023年,徐州的年均AQI呈现总体下降的趋势。这反映了在这个时期内采取的环保政策和措施的效果。
年均PM2.5浓度趋势:与AQI相似,PM2.5浓度也呈现总体下降的趋势。PM2.5是空气中的细颗粒物,其减少反映了徐州地区在减少工业排放和空气污染方面的努力。
2015年至2017年,AQI和PM2.5浓度均出现了一定程度的波动,其中2017年的数值较高。这受到当时气象条件、工业活动水平以及环保政策执行力度等因素的影响。
从2018年开始,徐州的空气质量呈现出较为稳定的改善趋势。这反映了当地政府和企业在工业生产和环境治理方面的更为积极的行动,以及环保政策的深入实施。
原因分析:
环保政策的实施:政府加大了环保力度,采取了更多的政策和措施来减少工业排放和改善空气质量。
技术升级和产业结构调整:重工业城市进行了技术升级,推动了产业结构的调整,减少了对环境的不良影响。
气象条件的影响:天气状况对空气质量有影响,例如风向、湿度和气温的变化可能会影响空气污染物的扩散和浓度。
总体而言,徐州的空气质量改善可能是多方面因素共同作用的结果,包括政策、技术、产业结构和气象等方面的因素。进一步的详细研究和数据分析可能需要考虑更多的因素,以全面了解影响空气质量的因素。
表4-7平均每年空气质量分布规律表
year |
AQI |
PM2.5 |
2015 |
96.590 |
63.688 |
2016 |
93.295 |
59.824 |
2017 |
102.291 |
68.167 |
2018 |
98.085 |
66.438 |
2019 |
88.014 |
57.876 |
2020 |
77.168 |
50.014 |
2021 |
72.885 |
43.212 |
2022 |
69.932 |
40.140 |
2023 |
71.938 |
40.722 |
图4-7平均每年空气质量分布规律折线图
4.3实验三结果
气象条件是影响区域空气质量的重要自然因素,对污染物的生成、扩散、稀释和清除起着决定性作用。本章重点探讨温度和风速两个关键气象因子与徐州市空气质量之间的关系。
4.3.1温度对空气质量影响研究
温度不仅直接影响大气垂直对流的强弱,还深度参与大气光化学反应过程。通过相关性计算、分组对比及可视化展示,分析温度对不同污染物的影响差异。
(1)温度与污染物相关性及分组特征
首先,计算了温度(T)与AQI、PM2.5和臭氧(O3_8h)之间的皮尔逊相关系数。如表4-10所示,结果显示:
温度与PM2.5呈显著负相关(r≈-0.45):随着温度升高,大气对流增强,混合层高度增加,有利于颗粒物的垂直扩散;反之,低温常伴随逆温层,导致颗粒物累积。
温度与O3呈显著正相关(r≈0.58):高温通常伴随强烈的太阳辐射,是驱动挥发性有机物(VOCs)和氮氧化物(NOx)发生光化学反应生成臭氧的关键条件。
温度与AQI的相关性较弱且复杂(r≈-0.15):由于AQI是多项污染物的综合指数,温度升高虽然有利于降低PM2.5,但同时也促进了O3的生成,两种效应相互抵消,导致整体相关性不强,且呈现非线性关系。
表4-10 皮尔逊相关系数矩阵
指标 |
皮尔逊相关系数 (r) |
相关性强度与方向 |
统计显著性 (描述) |
PM2.5 |
-0.45 |
中等负相关 |
显著 |
O3_8h (臭氧) |
0.58 |
中等偏强正相关 |
显著 |
AQI (综合指数) |
-0.15 |
弱负相关 |
不显著/复杂 |
图4-8 相关性热力图
为了更直观地对比,图4-9与图4-10展示了不同温度区间下AQI的变化情况。
图4-9空气质量与温度关系折线图
图4-10空气质量与温度关系散点图
在较高的温度下,化学反应速率可能会增加,导致一些污染物被转化为较为稳定或较少有害的物质,从而改善空气质量。在较低温度下,易出现逆温层,不利于污染物的扩散。
4.3.2温度对空气质量影响研究
风速是决定污染物水平输送和稀释扩散能力的最直接气象因子。通常情况下,风速越大,大气扩散能力越强,污染物浓度越低。
图4-11空气质量与风速关系折线图
图4-12空气质量与风速关系散点图
为了更直观地对比,图4-11与图4-12展示了不同风速区间下AQI的变化情况。
一般情况下,较高的风速有助于将污染物扩散到更广阔的区域,减少了局部地区的污染浓度,可能有助于改善空气质量。在徐州这样的工业城市,风速较高时,会将工业排放物带离市区,从而降低空气污染程度。然而,在特定情况下,例如在干燥和多尘的天气中,较高的风速可能会携带更多尘土和颗粒物,导致空气质量下降。这种情况可能会在干燥季节或沙尘暴天气下更为显著。
4.3.3 小结
综上所述,温度通过改变大气稳定度和驱动光化学反应,对颗粒物和臭氧产生截然不同的影响,导致AQI随温度呈现复杂的非线性变化。而风速则主要起单一的物理扩散作用,与空气污染水平呈显著的负相关关系,“静稳小风”是导致污染累积的关键气象诱因。
五、结论
5.1研究总结
5.1.1实验一研究总结
(1)整体水平分析结论:2015-2023年徐州市AQI整体处于良级,但波动较大,颗粒物污染长期处于高位,PM2.5、PM10浓度及超标率均远超国标限值,是污染超标的主导因子;气态污染物均值达标,但存在阶段性高浓度污染。2015-2017年污染超标率处于高位,2018年后呈持续下降趋势,大气污染治理成效显著,2023年虽小幅回升,但仍远低于前期水平。
(2)污染物相关性分析结论:AQI与PM2.5、PM10呈极强正相关,两类颗粒物来源高度同源,是驱动AQI升高的核心因子;CO、SO2、NO2与PM2.5间存在较强正相关,反映燃煤排放、机动车尾气等一次污染源对颗粒物及常规气态污染物的协同贡献;O3与所有污染物均呈负相关,其作为二次污染物的生成规律与一次污染源存在显著差异,污染成因具备独立性。
(3)首要污染物判定结论:徐州市大气污染的核心贡献成分为PM10、PM2.5和O3,CO、SO2占比可忽略不计。年际上,污染结构由2015-2019年的PM2.5单一主导,逐步转变为颗粒物与O3协同污染;季节上,冬季以PM2.5为主导,夏季以O3为核心,春季PM10占比最高,秋季NO2占比突出,污染来源与气象条件、排放强度的季节适配性显著。
5.2实验二研究总结
(1)日变化趋势:呈现“双峰一谷”特征。上午7:00-10:00因交通和工业活动增加出现污染峰值;下午13:00-18:00因扩散条件好转空气质量最佳;夜间受下班高峰及静稳天气影响再次积聚。
(2)季节变化显著:呈现典型的“V”型结构。冬季(1月)AQI最高(均值130.57),夏季(7月)AQI最低(均值50.45)。
(3)年际改善明显:2015-2023年,年均AQI和PM2.5浓度总体呈下降趋势,反映出环保政策和产业结构调整的显著成效 。
5.3实验三研究总结
(1)风速的稀释作用:风速与AQI呈显著负相关。风速越大,大气扩散能力越强;“静稳小风”是导致污染物累积的关键诱因。
(2)温度的复杂影响:温度与PM2.5呈显著负相关(有利于扩散),但与O3呈显著正相关(光化学反应增强),导致AQI随温度呈现复杂的非线性变化。
5.4治理建议
结合以上数据分析,空气质量情况与人们的生活规律,工业污染的排放,气候以及政府的相关政策有着密不可分的关系。总的来说,徐州市的空气质量在逐年提高。在此对于空气质量的更加良好提出一些建议:
(1)实施季节性差异化精准治理冬季强化颗粒物管控:针对冬季燃煤供暖和不利扩散条件,应重点加强对工业锅炉、散煤燃烧及建筑扬尘的监管,减少二次无机气溶胶的生成。夏季聚焦O3前体物减排:针对夏季臭氧污染高发期,应加强对挥发性有机物和氮氧化物的协同控制,特别是高温时段的化工生产与油漆喷涂等作业。
(2)优化人为活动排放时段错峰管理交通与工业排放:结合日内“双峰”规律,在早晚高峰时段通过优化路网效率、倡导绿色出行等方式减少尾气排放。
(3)建立基于气象条件的预警机制动态响应气象变化:利用Python数据模型,在预测到“低温逆温”或“静稳小风”等不利气象条件时,提前启动应急减排预案,以对冲自然扩散能力的不足。
(4)持续推进减污降碳协同增效深化产业结构调整:鉴于徐州老工业基地的特性,应继续推动重化工业的技术升级和能源结构转型,从源头降低颗粒物与气态污染物的排放基数。
(5)使用数据分析与预测模型:利用计算机技术和数据分析算法,建立空气质量变化的预测模型。这些模型可以基于历史数据、气象因素和污染源等信息,帮助预测未来空气质量的变化趋势。开发智能化的数据分析工具,帮助政府部门和环境保护机构更好地理解空气质量数据,并及时采取相应的措施。
(6)开发智能监测系统:建立智能化的空气质量监测系统,利用计算机视觉和传感器技术实时监测空气中的污染物浓度。这些系统可以提供精准的数据支持,帮助及时发现空气质量异常情况。结合物联网技术,建立分布式的监测网络,覆盖城市各个区域,实现对空气质量的全面监测和管理。
通过综合考虑政策、技术、产业等多方面因素,并采取综合性的措施,结合计算机科学与技术,进一步改善徐州的空气质量。
参考文献
[1]饶永才,冯春莉,邓国庆,等.2019—2021年徐州市大气细颗粒物化学组成特征及来源解析[J].中国环境监测,2023,39(02):158-168.DOI:10.19316/j.issn.1002-6002.2023.02.16.
[2]李昌龙,冯春莉,孙瑞.2019—2023年徐州市PM2.5和臭氧复合污染特征分析[J].四川环境,2024,43(05):7-14.DOI:10.14034/j.cnki.schj.2024.05.002.
[3]李昌龙.徐州市区大气臭氧变化特征及与气象要素的相关性分析研究[J].环境科学与管理,2018,43(06):77-81.
