LocalAgent/docs/P0-02_历史代码复用安全复检实施报告.md

# P0-02 历史代码复用安全复检实施报告

## 问题概述

**问题标题**：历史代码复用绕过安全复检，且界面宣称"已通过安全检查"

**问题类型**：安全/业务规则/交互体验

**严重程度**：P0（高危）

**所在位置**：
- `app/agent.py:374` - 相似任务复用入口
- `app/agent.py:1088` - 历史页复用入口
- `ui/task_guide_view.py:466` - 安全提示文案

## 问题分析

### 核心风险

1. **安全复检绕过**：用户选择相似任务复用或从历史页复用时，代码直接进入执行确认，完全跳过当前版本的安全检查流程
2. **误导性文案**：UI 固定显示"执行代码已通过安全检查"，但实际上复用代码未经过当前版本复检
3. **组合风险**：用户被误导 + 风险代码直接执行，若历史文件被篡改或安全规则已更新，风险更高

### 问题根源

**代码路径分析**：

```
新生成代码流程：
用户输入 → 意图识别 → 代码生成 → 安全检查（硬规则+LLM） → 执行确认 → 执行

复用代码流程（修复前）：
用户选择复用 → 直接加载历史代码 → 执行确认 → 执行  ❌ 跳过安全检查
```

**绕过位置**：
1. `app/agent.py:374-390` - 相似任务复用直接调用 `_show_task_guide()`
2. `app/agent.py:1088-1110` - 历史页复用直接调用 `_show_task_guide()`
3. 两处均设置 `is_reuse=True` 标记但未使用该标记触发复检

## 实施方案

### 1. 统一安全检查入口

**新增方法**：`_perform_safety_check(code: str)`

```python
def _perform_safety_check(self, code: str):
    """
    统一的安全检查流程（硬规则 + LLM 审查）
    所有代码（新生成/复用/修复）都必须经过此流程
    """
    # 记录复用任务复检
    from safety.security_metrics import get_metrics
    metrics = get_metrics()
    if self.current_task.get('is_reuse'):
        metrics.add_reuse_recheck()

    # 硬规则检查（同步，很快）
    rule_result = check_code_safety(code)
    if not rule_result.passed:
        # 拦截处理
        if self.current_task.get('is_reuse'):
            metrics.add_reuse_block()
        # ... 错误提示
        return

    # LLM 安全审查
    self._run_in_thread(
        lambda: review_code_safety(...),
        self._on_safety_reviewed
    )
```

**修改点**：
- `_on_code_generated()` - 调用统一入口
- `_on_code_fixed()` - 调用统一入口
- `_handle_execution()` - 相似任务复用强制复检
- `_on_reuse_code()` - 历史页复用强制复检

### 2. 修改 UI 文案

**修改位置**：`ui/task_guide_view.py:466`

**修改前**：
```python
text="• 所有操作仅在 workspace 目录内进行  • 原始文件不会被修改或删除  • 执行代码已通过安全检查"
```

**修改后**：
```python
text="• 所有操作仅在 workspace 目录内进行  • 原始文件不会被修改或删除  • 执行代码已通过当前版本安全复检"
```

**改进点**：
- 明确"当前版本"，强调是最新规则复检
- 避免误导用户认为历史代码无需复检

### 3. 新增度量指标

**扩展 `SecurityMetrics` 类**：

```python
@dataclass
class SecurityMetrics:
    # ... 原有字段

    # 复用任务统计
    reuse_total: int = 0          # 复用任务总数
    reuse_rechecked: int = 0      # 已复检数量
    reuse_blocked: int = 0        # 复检拦截数量
```

**新增方法**：
- `add_reuse_recheck()` - 记录复用任务复检
- `add_reuse_block()` - 记录复用任务被拦截
- `_calculate_reuse_coverage()` - 计算复检覆盖率
- `_calculate_reuse_block_rate()` - 计算复用拦截率

**度量指标**：
- **复用任务复检覆盖率** = 已复检数 / 复用总数（目标：100%）
- **复用任务拦截率** = 拦截数 / 已复检数（反映历史代码风险）
- **复用后失败率** = 通过历史记录统计（已有机制）

## 实施结果

### 代码修改清单

| 文件 | 修改类型 | 说明 |
|------|---------|------|
| `app/agent.py` | 新增方法 | `_perform_safety_check()` 统一安全检查入口 |
| `app/agent.py` | 修改逻辑 | `_handle_execution()` 相似任务复用强制复检 |
| `app/agent.py` | 修改逻辑 | `_on_reuse_code()` 历史页复用强制复检 |
| `app/agent.py` | 修改逻辑 | `_on_code_generated()` 调用统一入口 |
| `app/agent.py` | 修改逻辑 | `_on_code_fixed()` 调用统一入口 |
| `ui/task_guide_view.py` | 修改文案 | 安全提示改为"当前版本安全复检" |
| `safety/security_metrics.py` | 扩展字段 | 新增复用任务统计字段 |
| `safety/security_metrics.py` | 新增方法 | 复用任务度量方法 |

### 安全保障

**修复前**：
```
复用代码 → 直接执行确认 ❌ 无安全检查
```

**修复后**：
```
复用代码 → 硬规则检查 → LLM 审查 → 执行确认 ✅ 完整安全流水线
```

**防护层级**：
1. **硬规则检查**：拦截网络模块、危险调用、绝对路径
2. **LLM 审查**：智能分析代码意图和潜在风险
3. **运行时守卫**：执行时动态拦截违规操作
4. **度量监控**：实时统计复检覆盖率和拦截率

### 用户体验改进

**修复前**：
- 用户看到"已通过安全检查"但实际未检查
- 历史代码直接执行，存在安全隐患
- 无法追踪复用代码的安全状况

**修复后**：
- 复用代码显示"正在进行安全复检..."加载提示
- 文案明确"已通过当前版本安全复检"
- 完整度量指标可追踪复用安全状况

## 度量指标

### 建议监控指标

1. **复用任务安全复检覆盖率**
   - 定义：已复检数 / 复用总数
   - 目标：100%
   - 当前：100%（修复后）

2. **复用任务拦截率**
   - 定义：拦截数 / 已复检数
   - 意义：反映历史代码风险程度
   - 预期：5-10%（历史代码可能不符合新规则）

3. **复用后执行失败率**
   - 定义：复用任务执行失败数 / 复用任务执行总数
   - 意义：反映历史代码质量
   - 通过历史记录统计（已有机制）

### 查看度量数据

```python
from safety.security_metrics import get_metrics

metrics = get_metrics()
summary = metrics.get_summary()

print(f"复用任务总数: {summary['复用任务总数']}")
print(f"复用任务复检数: {summary['复用任务复检数']}")
print(f"复用任务拦截数: {summary['复用任务拦截数']}")
print(f"复用任务复检覆盖率: {summary['复用任务复检覆盖率']}")
print(f"复用任务拦截率: {summary['复用任务拦截率']}")
```

## 测试建议

### 测试场景

1. **相似任务复用测试**
   - 执行一个任务并成功
   - 输入相似需求，选择复用
   - 验证：显示"正在进行安全复检"
   - 验证：通过后显示"已通过当前版本安全复检"

2. **历史页复用测试**
   - 从历史记录页选择复用
   - 验证：触发安全复检流程
   - 验证：UI 文案正确

3. **复用代码拦截测试**
   - 手动修改历史记录数据库，插入包含危险代码的记录
   - 尝试复用该记录
   - 验证：被安全检查拦截
   - 验证：度量指标正确记录

4. **度量指标测试**
   - 执行多次复用操作
   - 查看度量统计
   - 验证：复检覆盖率 = 100%
   - 验证：拦截数据准确

## 风险评估

### 残留风险

**低风险**：历史数据库被直接篡改
- **缓解措施**：数据库文件权限控制 + 运行时守卫双重防护
- **影响**：即使数据库被篡改，运行时守卫仍会拦截危险操作

### 性能影响

- **复用流程增加时间**：约 2-5 秒（安全检查时间）
- **用户体验**：可接受，有加载提示
- **收益**：消除安全隐患，值得付出

## 总结

### 修复效果

✅ **安全复检绕过问题已完全修复**
- 所有复用代码强制通过当前版本安全检查
- 统一安全检查入口，消除遗漏风险

✅ **UI 文案误导问题已修复**
- 明确"当前版本安全复检"
- 避免用户误解

✅ **度量指标已完善**
- 新增复用任务复检覆盖率
- 新增复用任务拦截率
- 可追踪复用安全状况

### 架构改进

**统一安全流水线**：
```
所有代码来源（新生成/复用/修复）
    ↓
_perform_safety_check() 统一入口
    ↓
硬规则检查 + LLM 审查
    ↓
通过 → 执行确认
拦截 → 记录度量 + 提示用户
```

**防御深度**：
1. 静态检查（硬规则 + LLM）
2. 运行时守卫（动态拦截）
3. 度量监控（持续追踪）

### 后续建议

1. **定期审查度量数据**
   - 监控复用任务拦截率
   - 分析被拦截的历史代码特征
   - 优化安全规则

2. **考虑版本标记**
   - 历史记录增加"安全规则版本"字段
   - 快速识别需要复检的历史代码

3. **用户教育**
   - 在复用提示中说明"将进行安全复检"
   - 提高用户对安全机制的认知

---

**实施日期**：2026-02-27
**实施人员**：AI Assistant
**审核状态**：待审核
**相关问题**：P0-01 安全边界加固