AQI Prediction and Analysis Project
📋 目录结构
.
├── hw1/
│ └── data/
│ └── AQIDataset.csv # 原始数据集
├── src/
│ ├── data_processing.py # 数据加载、预处理与交叉验证划分
│ ├── models.py # 模型实现 (GD, LWLR, Lasso, Ridge)
│ └── experiments.py # 实验主程序 (训练、评估、绘图)
├── report/
│ ├── images/ # 实验生成的图表
│ └── 机器学习.md # 详细实验报告
├── README.md # 项目说明文档
└── requirements.txt # 依赖列表
🛠️ 环境要求
安装命令:
pip install pandas numpy matplotlib seaborn scikit-learn
🚀 如何运行
在项目根目录下,运行以下命令即可执行所有实验并生成图表:
python src/experiments.py
- 控制台会输出各步骤的运行日志及最终的模型评估结果。
- 生成的分析图表将保存在
report/images/目录下。 - 查阅
report/机器学习.md获取详细的分析报告。
📊 主要结果
| 模型 | RMSE | MAE |
|---|---|---|
| Gradient Descent | ~32.84 | ~24.69 |
| Lasso | ~33.16 | ~24.95 |
| Ridge | ~33.11 | ~24.89 |
| LWLR (k=2.0) | ~30.36 | ~22.68 |
- 最佳模型: 局部加权线性回归 (LWLR) 在
k=2.0时表现最佳。 - 主要影响因素: 纬度、温度和海拔。
Description
Languages
Python
100%