feat: 添加一键启动脚本并更新项目配置

- 添加 start_all.sh 一键启动脚本，支持启动llama-server和FastAPI服务 - 修改启动脚本使用venv虚拟环境替代conda环境 - 更新README.md，添加一键启动脚本使用说明 - 更新py_tree_generator.py，添加final_prompt返回字段 - 禁用Qwen3模型的思考功能 - 添加RAG检索结果的终端打印 - 移除ROS2相关代码（ros2_client.py已删除）
2025-12-02 21:42:26 +08:00
parent ab6e09423b
commit a6c2027caa
9 changed files with 625 additions and 822 deletions
--- a/README.md
+++ b/README.md
@@ -228,14 +228,96 @@ python ingest.py

 完成前两个阶段后，即可启动并测试后端服务。

-#### 1. 启动后端服务
+#### 1. 启动所有服务（推荐方式：一键启动脚本）

-启动服务的关键在于**按顺序激活环境**：先激活ROS 2工作空间，再激活Conda环境。
+我们提供了一个一键启动脚本 `start_all.sh`，可以自动启动所有必需的服务：

 ```bash
 # 1. 切换到项目根目录
 cd /path/to/your/drone

+# 2. 使用一键启动脚本（推荐）
+./start_all.sh start
+
+# 或者直接运行（start是默认命令）
+./start_all.sh
+```
+
+**脚本功能：**
+- 自动启动推理模型服务（llama-server，端口8081）
+- 自动启动Embedding模型服务（llama-server，端口8090）
+- 自动启动FastAPI后端服务（端口8000）
+- 自动检查端口占用、模型文件、环境配置等
+- 自动等待服务就绪
+- 统一管理日志文件（保存在 `logs/` 目录）
+
+**环境变量配置（可选）：**
+
+在运行脚本前，可以通过环境变量自定义配置：
+
+```bash
+# 设置llama-server路径（如果不在默认位置）
+export LLAMA_SERVER_DIR="/path/to/llama.cpp/build/bin"
+
+# 设置模型路径（如果不在默认位置）
+export INFERENCE_MODEL="~/models/gguf/Qwen/Qwen3-8B-GGUF/Qwen3-8B-Q4_K_M.gguf"
+export EMBEDDING_MODEL="~/models/gguf/Qwen/Qwen3-embedding-4B/Qwen3-Embedding-4B-Q4_K_M.gguf"
+
+# 设置Conda环境名称（如果使用不同的环境名）
+export CONDA_ENV="backend"
+
+# 然后运行脚本
+./start_all.sh
+```
+
+**脚本命令：**
+
+```bash
+./start_all.sh start    # 启动所有服务（默认）
+./start_all.sh stop     # 停止所有服务
+./start_all.sh restart  # 重启所有服务
+./start_all.sh status   # 查看服务状态
+```
+
+**日志查看：**
+
+所有服务的日志都保存在 `logs/` 目录下：
+```bash
+# 查看所有日志
+tail -f logs/*.log
+
+# 查看特定服务日志
+tail -f logs/inference_model.log  # 推理模型
+tail -f logs/embedding_model.log  # Embedding模型
+tail -f logs/fastapi.log          # FastAPI服务
+```
+
+#### 2. 手动启动服务（备选方式）
+
+如果您需要手动控制每个服务的启动，可以按照以下步骤操作：
+
+**启动推理模型服务：**
+
+```bash
+cd /llama.cpp/build/bin
+./llama-server -m ~/models/gguf/Qwen/Qwen3-8B-GGUF/Qwen3-8B-Q4_K_M.gguf --port 8081 --gpu-layers 36 --host 0.0.0.0 -c 8192
+```
+
+**启动Embedding模型服务：**
+
+在另一个终端中：
+```bash
+cd /llama.cpp/build/bin
+./llama-server -m ~/models/gguf/Qwen/Qwen3-embedding-4B/Qwen3-Embedding-4B-Q4_K_M.gguf --gpu-layers 36 --port 8090 --embeddings --pooling last --host 0.0.0.0
+```
+
+**启动FastAPI后端服务：**
+
+在第三个终端中：
+```bash
+# 1. 切换到项目根目录
+cd /path/to/your/drone
+
 # 2. 激活ROS 2编译环境
 #    作用：将我们编译好的`drone_interfaces`包的路径告知系统，否则Python会报`ModuleNotFoundError`。
 #    注意：此命令必须在每次打开新终端时执行一次。
@@ -248,6 +330,7 @@ conda activate backend
 cd backend_service/
 uvicorn src.main:app --host 0.0.0.0 --port 8000
 ```
+
 当您看到日志中出现 `Uvicorn running on http://0.0.0.0:8000` 时，表示服务已成功启动。

 #### 2. 运行API接口测试