4.1 项目总览（总目标·实验目的·挑战）

总目标（最终愿景）

用一台桌面六轴机械臂，自主走完一整局国际象棋——从感知棋盘、思考决策、到物理抓放落子，全流程闭环，并能在抓空 / 碰倒 / 放偏时自我恢复。

架构分层（别搞反）：脑 = Anima，眼 = 相机，手 = 机械臂，其余一切都是脑借用的 tools / skills。

脑 = Anima 认知框架：统一负责理解 + 编排。相机拍到的画面、棋盘状态 → FEN、落子对错的判断，原则上全部交给脑来理解；脑自己直接理解不了时，再由它主动调用检测工具补足。目标是尽量让所有「处理 / 判断」都经由脑完成，而不是把感知/决策拆成一堆各自为政的固定模块。
眼 = 相机：只负责采集像素，不做任何决策。它是脑的输入设备，不是「感知引擎」。
手 = 机械臂（由 VLA / 模仿学习策略驱动）：只负责执行抓放落子，是本项目的工程主体（项目卖点在这只手够鲁棒，而非脑有多聪明）。
工具 / 技能 = Stockfish、python-chess、CV 格子检测、VLM 判图……：这些都不是「脑」，而是脑在思考时可借用的逻辑引擎 / 检测工具，统一视作 tools / skills。算棋 = 调 Stockfish 这个 tool，绝不让 Anima / LLM 自己「心算」棋或当规则引擎（会幻觉）；棋局真值由 python-chess 这个 tool 确定性持有。

一句话：Anima 是唯一的「思考者」，它指挥眼去看、调工具去算/检测、命令手去执行。后续每一节都在这个分层下推进。

Soma Zero 下棋 = Jeff 的 Soma 测试代正式起点。

自主度单调递增：软件 → 人当手 → 遥操当手 → 硬编码自主 → 采数 → VLA → 收口 → 新棋类。每步的 run_pick_place() 共用同一接口签名，替换只改实现。