Files
ai_soc_sw/review/active/P02-001/task.md
T
tupingr 4184a6d0b5 refactor(architecture): 信息架构重构 — 从"人类导向单体文档"到"AI优先分层架构"
新增四层信息架构:
- Layer 0: 角色工作台 (.ai/roles/) — AI 每天只需读2个小文件
- Layer 1: 路线图看板 (ROADMAP.md) — 人机共享进度
- Layer 2: 阶段上下文 (.ai/phases/) — 按当前阶段加载
- Layer 3: 知识沉淀 (.ai/knowledge/) — 决策/模式/教训自动积累

新增:
- DASHBOARD.md — 人类仪表盘(30秒了解全貌)
- ROADMAP.md — 任务看板+阻塞追踪
- docs/share/ — 对外分享内容层(一鸡多吃)
- docs/使用手册.md — 人+AI使用手册
- .ai/prompts/architecture/ — 补充缺失的架构提示词
- .ai/principles.md — 信息架构设计原则
- review/active/INDEX.md — 任务索引

修改:
- AGENTS.md: 239行→117行,顶部AI跳转
- README.md: 精简聚焦人类读者
- PROJECT_CONTEXT.md: 精简+分层说明
- DECISIONS.md: 替换为跳转存根
- 5个task.md: 添加phase字段

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-05-25 16:49:36 +08:00

610 B

P02-001 - 数据集预处理模块

任务信息

  • 任务编号: P02-001
  • 项目: P02_errlens_training
  • 创建时间: 2026-05-22
  • 负责人: Dev AI
  • 状态: TODO
  • 阶段: Phase 1

任务描述

实现数据集预处理模块,包括:

  1. 数据下载
  2. 数据清洗
  3. 数据标注
  4. 特征提取

需求来源

  • 模型训练需求文档

技术要求

  • 支持多线程处理
  • 数据格式标准化
  • 支持增量更新

交付物

  • src/data/download.py - 数据下载
  • src/data/clean.py - 数据清洗
  • src/data/label.py - 数据标注
  • src/data/features.py - 特征提取