이 용어는 어디까지 신뢰할 수 있나요?

M2.7은 MiniMax가 2026년 3월 18일 공개한 “긴 코딩 일을 여러 단계로 이어 가는 AI 모델” 이름이야. 그냥 코드를 한 번 뱉고 끝나는 모델보다 Agentic Coding처럼 계획하고, 도구를 부르고, 다시 고치고, 끝까지 밀어붙이는 쪽에 더 가깝다고 보면 돼.

이 모델로 무엇을 할 수 있나

코딩 에이전트 작업: 공식 발표와 Hugging Face 카드에는 SWE-Pro 56.22%, SWE Multilingual 76.5, Multi SWE Bench 52.7, VIBE-Pro 55.6, Terminal-Bench 2.0 57.0, NL2Repo 39.8이 같이 적혀 있어. 숫자만 떼서 보면 벤치마크 자랑 같지만, 묶어서 읽으면 로그 분석, 버그 추적, 코드 보안, 리팩터링, 저장소 단위 작업까지 한 번에 맡기는 쪽을 노린 모델이야. MiniMax가 든 예시도 구체적이야. 운영 알림이 뜬 상황에서 배포 시점과 모니터링 지표를 엮고, 데이터베이스에서 원인을 다시 확인하고, 누락된 인덱스 마이그레이션 파일을 저장소에서 찾고, 먼저 서비스 중단 없이 인덱스를 추가하는 방식으로 급한 불을 끄는 식이야.
사무 문서 에이전트 작업: MiniMax는 GDPval-AA ELO 1495, Toolathon 46.3%, MM Claw에서 40개 넘는 복잡한 skills에 대한 97% 준수율을 같이 내세워. 그래서 이 모델은 답변만 잘 쓰는 쪽보다 Word·Excel·PPT 파일을 여러 차례 고치고 결과물을 다시 내는 문서 작업 에이전트 문맥에서 더 자주 불려. 공식 카드도 템플릿과 skills를 바탕으로 파일을 바로 만들고, 사용자가 수정 지시를 여러 번 줘도 바로 다시 손볼 수 있는 산출물 형태로 내는 흐름을 예시로 잡아.
로컬 배포 실험: 공개 가중치를 받아 vLLM, SGLang, Transformer 계열 구현, MLX로 배포할 수 있어. 다만 MiniMax 공식 배포 문서 기준 Linux GPU는 96GB GPU 4장 또는 144GB GPU 8장 권장이고, Mac MLX 3비트 최소 변형도 약 112GB 메모리가 필요해서 Local LLM 입문용에 가깝지는 않아.

왜 중요한가

이 모델이 자주 거론되는 이유는 벤치마크 숫자 자체보다, “모델이 자기 작업 환경을 조금씩 고치면서 다음 실험 성능까지 끌어올린다”는 서사까지 같이 밀고 있기 때문이야. MiniMax는 내부 버전의 M2.7이 프로그래밍 scaffold를 100회 넘게 반복적으로 바꾸며 내부 평가 성능을 30% 끌어올렸다고 소개해. 그래서 기사에서 M2.7이 보이면, 단순 코딩 모델이라기보다 긴 루프를 버티는 에이전트 모델로 읽는 편이 덜 틀려.

또 하나는 라이선스와 배포 조건이야. Hugging Face에 가중치가 공개돼 있어도 License는 비상업 사용만 기본 허용하고, 상업 사용은 MiniMax의 사전 서면 승인을 요구해. 이 점에서 gpt-oss나 Gemma 4처럼 Apache 계열 개방 라이선스를 먼저 떠올리면 바로 판단이 어긋나.

주의해서 볼 부분

공개 가중치와 상업 사용 가능은 같은 말이 아니야. M2.7은 공개 가중치 모델이지만 기본 라이선스는 non-commercial에 가까워.
성능 점수와 로컬 운용 난이도도 따로 봐야 해. Benchmark 수치가 높아도, 실제 배포는 다중 GPU나 100GB 이상급 메모리를 먼저 요구해.
API도 일반 종량제보다 구독형 Token Plan 문맥에서 자주 설명돼. 2026년 5월 3일 기준 M2.7은 5시간마다 Starter 1,500회, Plus 4,500회, Max 15,000회 요청 한도로 나뉘어서, 실무에서는 모델 점수보다 요청 한도와 운영 방식이 먼저 걸릴 수 있어.

같이 보면 좋은 모델

gpt-oss: 둘 다 공개 가중치 모델로 같이 묶이기 쉽지만, gpt-oss는 Apache 계열 개방 라이선스로 바로 상업 배포 문맥에 들어가고 M2.7은 비상업 조건과 별도 승인 여부를 먼저 확인해야 해. 비교 축이 라이선스와 배포 정책 쪽으로 분명히 갈려.
Gemma 4: Gemma 4도 로컬 배포 문맥에서 자주 같이 불리지만, M2.7은 문서 편집·Tool Use·긴 에이전트 작업 쪽 설명이 더 앞에 와. 반대로 로컬 운용 난이도와 라이선스 조건은 M2.7 쪽이 더 빡빡해서 같은 공개 가중치 모델로 바로 묶기엔 조건 차이가 커.
Claude Opus 4.6: MiniMax가 MLE Bench Lite 66.6%, VIBE-Pro 55.6 같은 수치를 설명할 때 Opus 4.6을 비교축으로 자주 세워. 그래서 M2.7을 읽을 때도 “오픈 가중치 대안”인지, “최상위 폐쇄형 모델에 근접한 에이전트 모델”인지 비교 문맥을 같이 봐야 해.

이 항목을 참조하는 위키

📰 관련 기사 (1)

MiniMax, M2.7 모델 공개 후 라이선스를 비상업으로 바꿔 논란2026-04-16🔥84점 · 출처 3

포맷 v3 가이드 wiki 3.2.0

팩트 체크

통과 · 2026-05-03 KST

검증 생성: AI + 편집 검토 · 2026-05-03 상태: 통과

통과 원문 대조

공식 발표, 모델 카드, 배포 문서를 같이 보고 M2.7을 긴 에이전트 작업 중심 모델로 읽는 축이 맞는지 확인해 봤어.

MiniMax 공식 발표와 Hugging Face 모델 카드가 모두 자기 개선 반복, 에이전트 팀, 복잡한 작업 묶음, 상황 맞춤 도구 탐색을 M2.7의 핵심 성격으로 적고 있는지 먼저 맞춰 봤어.
독자 문제 대조: 이 페이지를 보는 사람은 '이게 그냥 코딩 모델인지, 긴 에이전트 작업까지 보는 모델인지'부터 헷갈리기 쉬워서 그 축이 공식 설명과 맞는지 먼저 대조해 봤어.
본문에 쓴 SWE-Pro 56.22, VIBE-Pro 55.6, Terminal Bench 2 57.0, GDPval-AA 1495, Toolathon 46.3, MM Claw 97% 같은 숫자는 공식 발표나 모델 카드에 직접 나온 값만 남겼어.
로컬 배포 경로와 OpenAI 호환 서버 설명은 MiniMax 배포 문서 기준으로만 적고, 추정성 설명은 안 넣었어.

브리프의 apache 태그는 공식 LICENSE와 맞지 않아서 반영하지 않았어.

통과 교차 검증 검증 출처 5

MiniMax 발표문과 Hugging Face 카드, 라이선스, 배포 문서, 보조 기사까지 대조해 과장되기 쉬운 부분을 따로 갈라 봤어.

비교 기준: 공개 가중치 여부, 상업 사용 가능 여부, 긴 에이전트 작업 지향성, 로컬 배포 난이도를 축으로 두고 출처별 설명이 같은 방향인지 확인해 봤어.
공식 발표와 Hugging Face 카드가 SWE-Pro 56.22, Terminal Bench 2 57.0, VIBE-Pro 55.6을 같은 방향으로 적는지 교차 확인해 봤어.
Hugging Face LICENSE와 배포 문서를 따로 보고, 공개 가중치가 곧바로 상업적 오픈 모델을 뜻하지 않는다는 점을 분리해서 적었어.
MarkTechPost는 2차 출처로만 쓰고, 라이선스나 배포 조건처럼 민감한 정보는 공식 문서 기준으로만 정리했어.

통과 수치 검증

성능, 모델 규모, 메모리 요구, 요청 한도처럼 실무 판단에 직접 쓰는 숫자를 출처별로 다시 맞춰 봤어.

Hugging Face 모델 카드 기준 229B params, 최근 한 달 다운로드 561,951, SWE Bench Pro 56.2, Terminalbench 2 57 수치를 다시 확인했어.
MiniMax 로컬 배포 문서 기준 Linux GPU 권장 구성 96GB x 4, 144GB x 8, 시퀀스 최대 컨텍스트 196K, MLX 3비트 최소 메모리 112GB를 다시 대조했어.
Token Plan 문서 기준 M2.7 1,500·4,500·15,000 requests/5hrs와 M2.7-highspeed 4,500·15,000·30,000 requests/5hrs를 다시 확인했어.

통과 비판 검토

공개 가중치, 높은 벤치 점수, 에이전트 지향 설명을 한꺼번에 읽으면서 생기기 쉬운 오해를 따로 점검해 봤어.

공개 가중치가 있다는 이유만으로 [gpt-oss](/ko/wiki/gpt-oss/)나 [Gemma 4](/ko/wiki/gemma-4/)처럼 바로 상업 배포 가능한 모델로 읽히지 않게 LICENSE 차이를 본문에 드러냈어.
성능 숫자만 보고 가벼운 로컬 모델로 오해하지 않도록 112GB 이상 메모리와 다중 GPU 권장 구성을 같이 넣었어.
에이전트 팀, [Tool Use](/ko/wiki/tool-use/), office 문서 편집 같은 설명을 단순 챗봇 기능 확장처럼 줄이지 않고, 긴 작업 루프를 이어 가는 모델 성격으로 정리했어.

출처: MiniMaxAI/MiniMax-M2.7 · Hugging Face , LICENSE · MiniMaxAI/MiniMax-M2.7 , MiniMax M2.7: Early Echoes of Self-Evolution , Local Deployment Guide - MiniMax API Docs , Token Plan Overview - MiniMax API Docs , Tool Use & Interleaved Thinking - MiniMax API Docs , MarkTechPost M2.7 Coverage

M2.7(엠투점칠)

모델 프로필

전체 AI 기술 맵에서의 위치

한 줄 정의