무슨 일이 일어났나

MistralMedium 3.5 128B를 공개했어. 오픈 웨이트 모델 중 코딩 벤치마크에서 가장 높은 수준인 SWE-bench Verified 77.6%를 기록했고, 컨텍스트 창이 256K라 긴 코드베이스를 통째로 넣을 수 있어. 라이선스는 Modified MIT야.

이전 Devstral 계열 모델을 전체 벤치마크에서 앞질렀고, 통신 도메인 특화 벤치마크 τ³-Telecom에서는 91.4%를 찍었어. Vibe 플랫폼의 원격 에이전트도 이 모델로 돌아가기 시작했어.

왜 이게 일어났나

오픈 웨이트 진영이 클로즈드 API와의 격차를 좁히는 속도가 빨라지고 있어. SWE-bench 77.6%는 코딩 에이전트 실용화 문턱으로 여겨지는 70%대 후반에 진입한 거야. Mistral 입장에서는 API 상품과 별개로 오픈 웨이트를 계속 내놓아야 기업 고객의 파인튜닝 수요를 흡수할 수 있어 — 그게 이 모델이 나온 이유야.

어떤 의미인가

로컬 실행은 현실적으로 80GB+ VRAM이 필요해서 일반 개발자가 직접 돌리기는 어려워. 하지만 API로는 표준 Mistral 요금에 바로 쓸 수 있고, 가중치가 공개됐으니 도메인 특화 파인튜닝이 가능해.

코딩·에이전트 파이프라인을 구축 중이라면 SWE-bench 기준으로 현재 오픈 웨이트 최상위 선택지야. τ³-Telecom 91.4%가 보여주듯 특화 도메인에서 성능이 두드러지는 구조라, 통신·IT 운영·코드 리뷰 자동화에 파인튜닝하면 전용 모델 수준을 기대할 수 있어.

다음 수순

HuggingFace 모델 카드GGUF 포함 퀀트 버전도 올라와 있어. 고사양 없이 먼저 벤치마크를 돌려보고 싶다면 4-bit 퀀트부터 시작하는 게 현실적이야. 상업 이용 전에는 Modified MIT 라이선스 원문을 직접 읽어두는 걸 권해.