한 줄 정의

Xiaomi MiMo는 Xiaomi가 운영하는 AI 모델 팀이자 모델 플랫폼 이름이야. 공식 홈페이지는 MiMo를 Xiaomi의 범용 지능 플랫폼으로 소개하고, 언어 모델, 멀티모달, 음성 기술을 한 브랜드 아래 묶어 보여 줘. 그래서 이 이름은 MiMo-V2.5-ASR 같은 모델 하나가 아니라, 여러 공개 모델과 데모, API 접근 경로가 붙는 상위 이름으로 읽는 편이 맞아.

이 구분이 먼저야. 기사에서 “Xiaomi MiMo가 공개했다”는 문장을 보면 Xiaomi 회사 전체의 모든 AI 제품을 뜻하는 게 아니라, MiMo 팀이나 MiMo 계정이 공개한 특정 모델을 가리키는 경우가 많아. 반대로 모델 카드에서 XiaomiMiMo/MiMo-V2.5-ASR처럼 보이면 그건 Hugging Face 조직 계정 아래 있는 개별 체크포인트야.

실제로 무엇을 하나

MiMo는 모델을 한 갈래만 내놓는 이름이 아니야. 공식 홈페이지의 블로그 목록에는 MiMo-V2.5-ASR, MiMo-V2.5-TTS Series, MiMo-V2.5-Pro, MiMo-V2.5, MiMo-V2-Pro, MiMo-V2-Omni, MiMo-V2-TTS, MiMo-V2-Flash가 같이 보여. 즉 텍스트 생성, 장기 과제 처리, 멀티모달, 음성 인식Text to Speech까지 한 계열 안에서 나눠 공개하는 흐름에 가까워.

공개 경로도 둘로 나뉘어 보여. Xiaomi 쪽 홈페이지는 Web Demo와 API Access를 내세우고, Hugging FaceXiaomiMiMo 계정은 모델 카드, Spaces, 컬렉션을 통해 내려받기와 체험 경로를 보여 줘. 2026-05-06 확인 시점에는 6개 컬렉션, 3개 Spaces, 23개 모델이 표시돼서, 단일 제품 페이지라기보다 공개 모델 유통 계정으로 읽는 게 자연스러워.

가장 구체적인 예시는 MiMo-V2.5-ASR야. 이 모델 카드는 8B Speech to Text 모델로 올라와 있고, License: mit, F32, safetensors, 중국어·영어·광동어 태그가 함께 붙어 있어. Xiaomi 블로그는 이 모델이 중국어·영어, 중국어 방언, 코드스위칭, 노래 가사, 잡음 많은 녹음, 다중 화자 전사를 겨냥한다고 설명해. 다만 그 설명은 ASR 모델 하나의 범위지, Xiaomi MiMo 전체가 전부 음성 인식이라는 뜻은 아니야.

왜 중요한가

Xiaomi MiMo를 알아두면 중국계 공개 모델 뉴스를 읽을 때 층위를 덜 헷갈려. Qwen이나 ModelScope처럼, 이름 하나가 회사, 모델 계열, 허브 계정, 개별 체크포인트 사이를 오가며 쓰일 때가 많거든. MiMo도 “팀/브랜드”와 “개별 모델”을 분리해서 봐야 성능표와 라이선스를 제대로 읽을 수 있어.

관련 이름은 이렇게 갈라 보면 돼. MiMo-V2.5-ASR는 Xiaomi MiMo 안의 개별 Speech to Text 모델이고, Hugging Face는 그 모델을 공개하고 내려받는 허브 경로야. MIT라이선스는 사용·재배포 조건을 보는 축이고, 벤치마크는 Xiaomi가 공개한 WER 표를 내 데이터와 비교할 때 필요한 해석 틀이야.

실무 판단에서는 모델별로 다시 쪼개야 해. 예를 들어 MiMo-V2.5-ASRMIT 라이선스가 붙은 공개 가중치라서 내려받아 실험할 수 있는 후보로 보이지만, Hugging Face 페이지는 이 모델이 어떤 Inference Provider에도 배포되어 있지 않다고 표시해. 그러면 바로 관리형 API를 붙이는 후보가 아니라, 로컬 데모나 자체 GPU 서버 검증부터 보는 쪽에 가까워.

벤치마크도 같은 방식으로 읽어야 해. Xiaomi ASR 블로그는 General English Recognition 표에서 MiMo-V2.5-ASR 평균 WER 5.73, Whisper-large-v3 평균 WER 7.44를 제시해. 이 숫자는 해당 표 안에서는 비교 단서가 되지만, 모든 언어와 모든 녹음 환경에서 Xiaomi MiMo 계열이 더 낫다는 결론은 아니야. 특히 한국어 전사나 현장 잡음 데이터라면 별도 샘플로 다시 재야 해.

주의해서 볼 점

첫째, Xiaomi MiMo를 Xiaomi 회사명과 같은 말로 쓰면 범위가 넓어져. 이 페이지에서 다루는 MiMo는 Xiaomi의 AI 모델 팀/플랫폼 이름이고, 스마트폰, IoT, 운영체제 같은 Xiaomi 전체 제품군을 뜻하지 않아.

둘째, MiMo 계열 모델이라고 해서 라이선스와 배포 경로가 모두 같다고 보면 안 돼. MiMo-V2.5-ASR에는 License: mit가 붙어 있지만, 다른 MiMo 모델도 같은 조건이라고 자동으로 옮겨 적으면 위험해. 각 모델 카드license 값, 저장소 파일, API 약관을 따로 봐야 해.

셋째, MIT 표기는 검토를 빠르게 시작하게 해 주는 신호지 모든 권리를 해결해 주는 도장처럼 쓰면 안 돼. OSI의 MIT 원문은 복제, 수정, 배포, 판매를 넓게 허용하지만 저작권 고지와 허가 문구를 남기라고 요구하고, 데이터셋 권리나 Xiaomi 상표 사용까지 자동으로 풀어 주지는 않아.

넷째, 성능표는 모델별·과제별로 읽어야 해. MiMo-V2.5-ASR의 표는 ASR 과제 안에서 중국어·영어·중국어 방언 중심으로 공개된 숫자야. Xiaomi MiMo라는 이름만 보고 한국어 회의록, 범용 챗봇, 음성 합성까지 한 번에 같은 품질로 기대하면 판단이 바로 흐려져.