学术研究报告2015–2026 年

基于 XGBoost-SHAP 模型的城市PM2.5 与 O3 协同控制研究

——以济南市为例

以济南市为例,构建机器学习可解释性模型,量化气象因子与排放源对两种污染物的差异化驱动机制, 识别协同控制关键期,为精细化大气污染防治提供科学依据。

研究时段
2015–2026
数据记录
4,119 天
特征变量
37 个
模型精度
R²>0.79
📋

研究概述

研究背景、数据来源与方法框架

PM₂.₅ 年均浓度(2025)
33.9μg/m³
较2015年降低 59.7%
O₃ 年均浓度(2025)
155.2μg/m³
较2015年升高 20.8%
PM₂.₅ 模型 R²(测试集)
0.793
RMSE = 11.59 μg/m³
O₃ 模型 R²(测试集)
0.886
RMSE = 15.61 μg/m³

研究方法框架

01
数据预处理
缺失值插值 异常值剔除 特征工程
02
探索性分析
时序演变 相关性热力图 季节散点图
03
XGBoost 建模
超参数调优 8:2 划分 交叉验证
04
SHAP 解释
全局重要性 依赖分析 交互效应
05
协同控制
贡献对比 关键期识别 政策建议
📊

探索性数据分析(EDA)

时序演变、相关性分析与季节特征

济南市 PM₂.₅ 与 O₃-MDA8 月均浓度时间序列演变(2015–2026)。PM₂.₅ 呈显著下降趋势(−3.65 μg/m³/年),O₃ 呈缓慢上升趋势(+0.16 μg/m³/年),两者呈现明显的'跷跷板效应'。

图1 济南市 PM₂.₅ 与 O₃-MDA8 月均浓度时间序列演变(2015–2026)。PM₂.₅ 呈显著下降趋势(−3.65 μg/m³/年),O₃ 呈缓慢上升趋势(+0.16 μg/m³/年),两者呈现明显的'跷跷板效应'。

关键变量相关性热力图。CO 浓度与 PM₂.₅ 相关系数最高(r=0.82),气温与 O₃ 正相关显著(r=0.71),NOx 与两种污染物均有较强关联。

图2 关键变量相关性热力图。CO 浓度与 PM₂.₅ 相关系数最高(r=0.82),气温与 O₃ 正相关显著(r=0.71),NOx 与两种污染物均有较强关联。

月度箱线图。PM₂.₅ 冬季(12–2月)中位数超过 60 μg/m³,O₃ 夏季(5–7月)中位数超过 160 μg/m³,呈现显著的季节性对立分布。

图4 月度箱线图。PM₂.₅ 冬季(12–2月)中位数超过 60 μg/m³,O₃ 夏季(5–7月)中位数超过 160 μg/m³,呈现显著的季节性对立分布。

四季 PM₂.₅ 与 O₃ 散点分布(颜色代表气温)。冬季两者负相关(r=−0.45),夏季负相关减弱(r=−0.18),春秋季存在一定正相关,揭示季节性协同/拮抗关系的差异。

图3 四季 PM₂.₅ 与 O₃ 散点分布(颜色代表气温)。冬季两者负相关(r=−0.45),夏季负相关减弱(r=−0.18),春秋季存在一定正相关,揭示季节性协同/拮抗关系的差异。

🔄

交互式动态图表

可悬停查看数据点详情,支持多维度切换

年际趋势演变(2015–2026)

实时数据
2015201620172018201920202021202220232024202520260255075100PM₂.₅ (μg/m³)03570105140O₃ (μg/m³)PM₂.₅标准
  • PM₂.₅年均
  • O₃年均

PM₂.₅ 年均降幅约 −3.65 μg/m³/年,O₃ 年均升幅约 +0.16 μg/m³/年,"跷跷板效应"显著

月均浓度季节分布("跷跷板"效应)

实时数据
1月2月3月4月5月6月7月8月10月12月0255075100PM₂.₅ (μg/m³)050100150200O₃-MDA8 (μg/m³)
  • PM₂.₅月均
  • O₃-MDA8月均

季节性污染特征雷达图

实时数据
1月3月5月7月9月11月050100150200
  • PM₂.₅ (μg/m³)
  • O₃-MDA8 (μg/m³)
🤖

XGBoost 模型构建与优化

超参数调优、性能评估与预测对比

模型评估指标汇总

指标PM₂.₅ 模型O₃-MDA8 模型
训练集 R²0.96380.9678
测试集 R²0.79290.8857
交叉验证 R²0.83650.8896
训练集 RMSE (μg/m³)7.359.84
测试集 RMSE (μg/m³)11.5915.61
训练集 MAE (μg/m³)5.377.56
测试集 MAE (μg/m³)8.1711.71
XGBoost 模型预测值与实测值散点对比图(左:PM₂.₅,右:O₃-MDA8;上:训练集,下:测试集)。测试集 PM₂.₅ R²=0.793,O₃ R²=0.886,模型具有良好的泛化能力。

图5 XGBoost 模型预测值与实测值散点对比图(左:PM₂.₅,右:O₃-MDA8;上:训练集,下:测试集)。测试集 PM₂.₅ R²=0.793,O₃ R²=0.886,模型具有良好的泛化能力。

测试集时间序列预测对比图。模型能较好捕捉污染物浓度的季节性变化规律,但在极端污染事件(PM₂.₅>150 μg/m³)时存在一定低估,这与 XGBoost 对极端值的回归均值化特性有关。

图6 测试集时间序列预测对比图。模型能较好捕捉污染物浓度的季节性变化规律,但在极端污染事件(PM₂.₅>150 μg/m³)时存在一定低估,这与 XGBoost 对极端值的回归均值化特性有关。

🔍

SHAP 可解释性分析

全局特征重要性、依赖关系与交互效应

SHAP 特征重要性(Top 12)

05101520SO2浓度NMVOC排放年积日温度×湿度日均相对湿度月份NOx排放日均气温PM2.5(t-2)NO2浓度PM2.5(t-1)CO浓度
SHAP Summary Plot(蜂群图)。PM₂.₅ 模型中,CO 浓度(SHAP=17.81)、前一日 PM₂.₅(SHAP=8.06)和 NO₂ 浓度(SHAP=5.43)是最重要的驱动因子;O₃ 模型中,前一日 O₃(SHAP=16.30)、温度×辐射交互项(SHAP=15.61)和气温(SHAP=12.84)居前三位。

图7 SHAP Summary Plot(蜂群图)。PM₂.₅ 模型中,CO 浓度(SHAP=17.81)、前一日 PM₂.₅(SHAP=8.06)和 NO₂ 浓度(SHAP=5.43)是最重要的驱动因子;O₃ 模型中,前一日 O₃(SHAP=16.30)、温度×辐射交互项(SHAP=15.61)和气温(SHAP=12.84)居前三位。

SHAP 特征重要性条形图(Top 15)。两种污染物的驱动因子存在显著差异:PM₂.₅ 主要受一次污染物(CO、NO₂)和气象条件(温度、湿度)驱动;O₃ 主要受光化学反应条件(气温、太阳辐射)和前体物排放驱动。

图8 SHAP 特征重要性条形图(Top 15)。两种污染物的驱动因子存在显著差异:PM₂.₅ 主要受一次污染物(CO、NO₂)和气象条件(温度、湿度)驱动;O₃ 主要受光化学反应条件(气温、太阳辐射)和前体物排放驱动。

核心驱动因子 SHAP Dependence Plot。气温对 PM₂.₅ 呈负效应(高温有利于扩散),对 O₃ 呈正效应(高温促进光化学反应);NOx 排放对两种污染物均有正贡献,但对 O₃ 的影响存在非线性饱和效应。

图9 核心驱动因子 SHAP Dependence Plot。气温对 PM₂.₅ 呈负效应(高温有利于扩散),对 O₃ 呈正效应(高温促进光化学反应);NOx 排放对两种污染物均有正贡献,但对 O₃ 的影响存在非线性饱和效应。

NOx 与 VOC 排放对 PM₂.₅ 和 O₃ 的交互 SHAP 贡献分析。高 NOx + 低 VOC 情景下,O₃ 生成受 VOC 限制;高 VOC + 低 NOx 情景下,O₃ 生成受 NOx 限制,揭示了济南市 O₃ 生成的 VOC 敏感性特征。

图10 NOx 与 VOC 排放对 PM₂.₅ 和 O₃ 的交互 SHAP 贡献分析。高 NOx + 低 VOC 情景下,O₃ 生成受 VOC 限制;高 VOC + 低 NOx 情景下,O₃ 生成受 NOx 限制,揭示了济南市 O₃ 生成的 VOC 敏感性特征。

⚖️

协同控制策略研究

排放因子贡献对比、关键期识别与协同控制指数

月度协同控制分析

实时数据
1月2月3月4月5月6月7月8月9月10月11月12月0.81.11.41.97协同控制指数
  • 协同控制指数
最高协同控制期
1月、12月
O₃重点防控期
5月—7月
最佳减排窗口
冬季(11—2月)
主要排放因子对 PM₂.₅ 和 O₃ 的 SHAP 贡献对比。NOx 对两种污染物均有显著贡献,是协同减排的优先目标;VOCs 对 O₃ 贡献更大,是夏季 O₃ 防控的关键前体物。

图11 主要排放因子对 PM₂.₅ 和 O₃ 的 SHAP 贡献对比。NOx 对两种污染物均有显著贡献,是协同减排的优先目标;VOCs 对 O₃ 贡献更大,是夏季 O₃ 防控的关键前体物。

月度协同控制指数(SCI)。冬季(1月、12月)SCI 最高(>1.3),是协同减排效率最高的窗口期;夏季(7–8月)SCI 最低(<1.0),以 O₃ 单独防控为主。

图12 月度协同控制指数(SCI)。冬季(1月、12月)SCI 最高(>1.3),是协同减排效率最高的窗口期;夏季(7–8月)SCI 最低(<1.0),以 O₃ 单独防控为主。

年际趋势与超标率演变。PM₂.₅ 超标率从 2015 年 88.5% 降至 2026 年 28.4%,降幅显著;O₃ 超标率从 18.2% 升至 33.6%,形成'此消彼长'的反向趋势,凸显协同控制的紧迫性。

图13 年际趋势与超标率演变。PM₂.₅ 超标率从 2015 年 88.5% 降至 2026 年 28.4%,降幅显著;O₃ 超标率从 18.2% 升至 33.6%,形成'此消彼长'的反向趋势,凸显协同控制的紧迫性。

⚗️

减排情景模拟

基于 SHAP 响应系数,动态模拟 NOx/VOCs 减排效果

⚗️

减排情景模拟

基于 SHAP 分析结果,模拟 NOx/VOCs 减排对污染物浓度的影响

情景季节:
0%
0%(基准)25%50%(深度减排)
NOx 来源:机动车尾气、工业燃烧、电厂排放
0%
0%(基准)25%50%(深度减排)
VOCs 来源:石化化工、工业涂装、包装印刷
PM₂.₅ 年均浓度✓ 达标
33.9μg/m³
较基准:— μg/m³
基准 33.9国标 35
O₃-MDA8 年均浓度✓ 达标
155.2μg/m³
较基准:— μg/m³
基准 155.2国标 160

基准值 vs 模拟值对比

PM₂.₅O₃-MDA804080120160
💡 使用说明:拖动上方滑动条设置 NOx 和 VOCs 的减排比例,系统将基于 SHAP 分析的响应系数实时模拟污染物浓度变化。
🗺️

空间分布热力图

济南市 12 个监测站点污染物浓度空间异质性分析

🗺️

济南市监测站点空间分布

点击站点查看详细数据 | 热力图显示污染物空间分布

浓度等级:
优良
达标
轻度超标
超标
标准:PM₂.₅ ≤35 μg/m³ | O₃ ≤160 μg/m³

各站点年均浓度汇总

站点名称区域类型PM₂.₅ (μg/m³)O₃-MDA8 (μg/m³)达标状态
历下区监测站城区38.2152.4⚠️ PM₂.₅超标
市中区监测站城区41.5148.6⚠️ PM₂.₅超标
槐荫区监测站城区44.8145.2⚠️ PM₂.₅超标
天桥区监测站城区43.2147.8⚠️ PM₂.₅超标
历城区监测站城区39.6154.3⚠️ PM₂.₅超标
长清区监测站郊区35.4158.7⚠️ PM₂.₅超标
章丘区监测站郊区36.8161.2❌ 双超标
济阳区监测站郊区33.5163.8⚠️ O₃超标
莱芜区监测站郊区34.2159.4✅ 双达标
钢城区监测站工业区48.6142.1⚠️ PM₂.₅超标
平阴县监测站郊区32.8165.3⚠️ O₃超标
商河县监测站郊区31.6167.8⚠️ O₃超标
📝

结论与政策建议

基于模型结果的分季节、分前体物精细化治理建议

主要研究结论

01
跷跷板效应显著
2015–2026 年间,济南市 PM₂.₅ 年均浓度从 84.2 μg/m³ 降至 33.9 μg/m³(降幅 59.7%),而 O₃-MDA8 年均浓度从 128.5 μg/m³ 升至 155.2 μg/m³(升幅 20.8%),两者呈现典型的反向演变趋势。
02
驱动因子差异显著
SHAP 分析表明,CO 浓度(SHAP=17.81)是 PM₂.₅ 的首要驱动因子,反映一次污染物排放的直接贡献;温度×辐射交互项(SHAP=15.61)是 O₃ 的关键触发因子,揭示光化学反应的核心机制。
03
协同控制窗口明确
冬季(11–2月)协同控制指数(SCI)最高(>1.3),是 PM₂.₅ 与 O₃ 协同减排效率最高的关键期;夏季(5–8月)以 O₃ 单独防控为主,需重点削减 VOCs 排放。
04
O₃ 生成呈 VOC 敏感性
NOx-VOC 交互分析表明,济南市 O₃ 生成总体处于 VOC 敏感区,单独削减 NOx 可能因「滴定效应」导致 O₃ 浓度短期上升,需同步加大 VOCs 减排力度。

分季节精细化治理建议

❄️
冬季(11–2月)
PM₂.₅ 优先,兼顾 O₃
  • 强化燃煤锅炉超低排放改造,削减 SO₂、NOx 和 PM₂.₅ 一次排放
  • 实施重污染天气应急响应,限制高排放工业企业生产
  • 推进清洁取暖工程,减少散煤燃烧
  • 加强机动车尾气管控,推广新能源车辆
☀️
夏季(5–8月)
O₃ 优先,协同 PM₂.₅
  • 重点削减 VOCs 排放:石化化工、工业涂装、包装印刷行业
  • 加强油品储运销 VOCs 泄漏管控
  • 在 NOx 敏感区适度控制 NOx 排放,避免「滴定效应」
  • 高温天气加强臭氧预报预警,及时发布健康提示
🌸
春季(3–5月)
O₃ 上升期,提前防控
  • 提前启动 O₃ 防控措施,防止 O₃ 浓度快速攀升
  • 加强 NOx 与 VOCs 协同减排,防止 O₃ 超标
  • 关注沙尘天气对 PM₂.₅ 的叠加影响
  • 推进工业企业 VOCs 治理设施的春季检修维护
🍂
秋季(9–11月)
PM₂.₅ 上升期,协同防控
  • 加强秸秆禁烧监管,防止生物质燃烧造成 PM₂.₅ 峰值
  • 提前部署冬季重污染应对预案
  • 持续推进 NOx 减排,为冬季协同控制奠定基础
  • 加强区域联防联控,协调周边城市协同减排

基于 XGBoost-SHAP 模型的城市 PM₂.₅ 与 O₃ 协同控制研究——以济南市为例

数据时段:2015–2026 | 模型:XGBoost + SHAP | 分析工具:Python / pandas / scikit-learn / shap