무슨 일이 일어났나
Ant Group의 AI 이니셔티브인 inclusionAI가 2026년 4월 30일 Ling-2.6-1T를 오픈소스로 공개했어. Hugging Face와 ModelScope에 동시 배포됐고, 라이선스는 MIT야.
총 1조 파라미터짜리 MoE 모델인데, 토큰당 실제로 활성화되는 파라미터는 약 500억 수준이야. MLA(Multi-Head Latent Attention)와 Linear Attention을 섞은 하이브리드 구조로 유사 모델 대비 추론 비용을 4분의 1 수준으로 낮췄다고 하거든. 다만 이건 자체 주장이고 독립 재현 벤치마크는 아직 제한적이야.
왜 이게 일어났나
1조 파라미터급 모델은 그동안 사실상 상업 API에서만 접근 가능했어. 오픈웨이트로 풀리면 에이전트 워크플로우, 코딩 보조, 툴 호출 등 실행 중심 작업에 직접 적용해볼 수 있어.
아키텍처 선택도 눈에 띄어. MLA와 Linear Attention 조합은 긴 컨텍스트에서 VRAM 사용과 지연 시간을 줄이는 데 집중한 설계야. 262K 토큰 컨텍스트는 긴 코드베이스나 문서 처리에 쓸 수 있는 범위야.
어떤 의미인가
벤치마크 기준으로는 Artificial Analysis Intelligence Index에서 34점으로, 비교군 오픈웨이트 모델 중앙값 13보다 높아. SWE-bench Verified, BFCL-V4 등 실행 중심 벤치마크에서도 상위권이라고 발표됐어.
실용적인 진입점은 OpenRouter 무료 API야. 직접 서빙하려면 1조 파라미터 규모에 맞는 인프라가 필요하지만, API로는 바로 테스트해볼 수 있어. 에이전트·코딩 작업에서 기존 오픈소스 선택지와 비교해볼 만한 후보야.
다음 수순
Hugging Face 모델 카드에서 아키텍처 세부 사항과 사용 조건을 먼저 확인해. OpenRouter에서 API 접근이 가능하니 에이전트나 코딩 태스크 하나를 골라 기존 모델과 비교 테스트하는 게 빠른 출발점이야.