# AQI Prediction and Analysis Project ## 📋 目录结构 ``` . ├── hw1/ │ └── data/ │ └── AQIDataset.csv # 原始数据集 ├── src/ │ ├── data_processing.py # 数据加载、预处理与交叉验证划分 │ ├── models.py # 模型实现 (GD, LWLR, Lasso, Ridge) │ └── experiments.py # 实验主程序 (训练、评估、绘图) ├── report/ │ ├── images/ # 实验生成的图表 │ └── 机器学习.md # 详细实验报告 ├── README.md # 项目说明文档 └── requirements.txt # 依赖列表 ``` ## 🛠️ 环境要求 安装命令: ```bash pip install pandas numpy matplotlib seaborn scikit-learn ``` ## 🚀 如何运行 在项目根目录下,运行以下命令即可执行所有实验并生成图表: ```bash python src/experiments.py ``` 1. 控制台会输出各步骤的运行日志及最终的模型评估结果。 2. 生成的分析图表将保存在 `report/images/` 目录下。 3. 查阅 `report/机器学习.md` 获取详细的分析报告。 ## 📊 主要结果 | 模型 | RMSE | MAE | | :--- | :--- | :--- | | Gradient Descent | ~32.84 | ~24.69 | | Lasso | ~33.16 | ~24.95 | | Ridge | ~33.11 | ~24.89 | | **LWLR (k=2.0)** | **~30.36** | **~22.68** | * **最佳模型**: 局部加权线性回归 (LWLR) 在 $k=2.0$ 时表现最佳。 * **主要影响因素**: 纬度、温度和海拔。