무슨 일이 일어났나

샤오미 MiMo AI팀이 6월 10일 터미널에서 도는 AI 코딩 에이전트 MiMo Code를 공개했어. GitHub에 v0.1.0이 올라왔고, 6월 15일엔 v0.1.1까지 나왔어. MIT 라이선스라 가져다 고쳐 써도 돼. 샤오미는 자체 벤치에서 SWE-bench Verified 82%79%Claude Code를 앞섰다고 밝혔어. 단, 이건 샤오미가 직접 잰 값이고 SWE-bench나 Terminal-Bench 2.0 같은 독립 리더보드엔 아직 안 올라와 있어.

실무에서 뭐가 달라지나

MiMo Code는 OpenCode를 포크해서 만들었고, 거기에 세션을 넘겨도 맥락을 안 잃는 영구 메모리를 붙였어. 코딩 에이전트가 긴 작업 중에 앞에서 정한 걸 까먹는 문제를 메모리로 메우려는 거야.

  • 영구 메모리: 프로젝트 지식은 MEMORY.md, 작업별 진행은 tasks/0/progress.md에 저장해. SQLite 전문 검색으로 세션이 다시 열릴 때 자동으로 끌어와
  • 컨텍스트 재구성: 컨텍스트가 한계에 가까워지면 체크포인트와 메모리, 진행 로그에서 다시 짜 맞춰서 작업을 이어가
  • Claude Code에서 이전: 기존 인증을 한 단계로 가져올 수 있고, OpenAI 호환 API라면 다른 모델도 붙일 수 있어
  • 무설정 시작: MiMo Auto라는 무료 채널이 기간 한정으로 들어 있어서 따로 설정 없이 바로 써볼 수 있어

메모리가 숫자로 갈리는 지점

샤오미가 미는 근거는 비교 방식에 있어. 같은 MiMo-V2.5-Pro 모델을 MiMo Code와 Claude Code 양쪽 하니스에 똑같이 넣고 재봤더니 SWE-bench Pro에서 62%57%로 약 5%p 차가 났다고 했어. 모델이 같은데도 점수가 갈렸으니, 그 차이는 모델이 아니라 에이전트 구조에서 온다는 주장이야. 200스텝을 넘는 긴 작업에선 MiMo Code 승률이 65%를 넘었고, 그 아래에선 둘이 거의 반반이었어. 우위가 긴 작업 구간에 몰려 있다는 거지.

어떤 의미인가

숫자가 다 샤오미 자체 벤치라 독립 검증이 붙기 전까진 그대로 믿긴 일러. 비교 상대도 Claude CodeClaude Sonnet 4.6을 붙인 조합이라, 이게 Claude 측 최강 세팅인지는 밝혀져 있지 않아. 그래도 긴 작업에서 에이전트가 자꾸 맥락을 까먹는 게 고민이라면, MIT 라이선스니까 한번 깔아서 내 코드베이스에서 어떤지 보고 판단해도 늦지 않아.