53 lines
1.5 KiB
Markdown
53 lines
1.5 KiB
Markdown
# AQI Prediction and Analysis Project
|
|
|
|
|
|
## 📋 目录结构
|
|
|
|
```
|
|
.
|
|
├── hw1/
|
|
│ └── data/
|
|
│ └── AQIDataset.csv # 原始数据集
|
|
├── src/
|
|
│ ├── data_processing.py # 数据加载、预处理与交叉验证划分
|
|
│ ├── models.py # 模型实现 (GD, LWLR, Lasso, Ridge)
|
|
│ └── experiments.py # 实验主程序 (训练、评估、绘图)
|
|
├── report/
|
|
│ ├── images/ # 实验生成的图表
|
|
│ └── 机器学习.md # 详细实验报告
|
|
├── README.md # 项目说明文档
|
|
└── requirements.txt # 依赖列表
|
|
```
|
|
|
|
## 🛠️ 环境要求
|
|
|
|
安装命令:
|
|
```bash
|
|
pip install pandas numpy matplotlib seaborn scikit-learn
|
|
```
|
|
|
|
## 🚀 如何运行
|
|
|
|
在项目根目录下,运行以下命令即可执行所有实验并生成图表:
|
|
|
|
```bash
|
|
python src/experiments.py
|
|
```
|
|
|
|
1. 控制台会输出各步骤的运行日志及最终的模型评估结果。
|
|
2. 生成的分析图表将保存在 `report/images/` 目录下。
|
|
3. 查阅 `report/机器学习.md` 获取详细的分析报告。
|
|
|
|
## 📊 主要结果
|
|
|
|
| 模型 | RMSE | MAE |
|
|
| :--- | :--- | :--- |
|
|
| Gradient Descent | ~32.84 | ~24.69 |
|
|
| Lasso | ~33.16 | ~24.95 |
|
|
| Ridge | ~33.11 | ~24.89 |
|
|
| **LWLR (k=2.0)** | **~30.36** | **~22.68** |
|
|
|
|
* **最佳模型**: 局部加权线性回归 (LWLR) 在 $k=2.0$ 时表现最佳。
|
|
* **主要影响因素**: 纬度、温度和海拔。
|
|
|