한 줄 정의
Model Weights는 학습 과정에서 조정된 숫자 파라미터 집합이야. Hugging Face 업로드 문서를 보면 config와 weight 파일이 실제 배포 단위로 함께 움직인다는 점이 바로 보여.
어떻게 작동하나
모델 구조 코드는 설계도에 가깝고, 웨이트는 그 설계도 안을 채우는 실제 숫자 값이야. 실무에선 safetensors와 bin처럼 최소 2개 형식이 자주 보이고, 같은 구조라도 어떤 웨이트를 불러오느냐에 따라 답변 스타일과 메모리 구성이 달라져.
왜 중요한가
오픈 모델 기사에서 진짜 중요한 차이는 논문 공개 여부보다 웨이트 공개 여부일 때가 많아. 특히 config, tokenizer, weight처럼 3개 묶음이 다 맞아야 다른 팀이 직접 추론하거나 미세조정하고 자기 환경에서 재현성과 배포 가능성을 확보할 수 있어.
주의해서 볼 점
웨이트가 있다고 해서 바로 다 되는 건 아니야. 라이선스, 토크나이저, 추론 엔진, 양자화 버전, 필요한 VRAM 같은 조건이 안 맞으면 웨이트 파일만 받아도 실제 실행은 막힐 수 있어.
관련 용어
- deepseek-r1: 모델 공개 기사에서 진짜로 공개된 게 논문인지, API인지, 웨이트 파일인지 구분할 때 자주 비교되는 사례야. 웨이트 공개 여부가 로컬 실행 가능성을 크게 바꿔.
- llama: 오픈 웨이트 모델 얘기에서 가장 자주 예시로 나오는 계열 중 하나야. 웨이트 공개와 라이선스 조건을 같이 봐야 한다는 감각을 주기 좋아.
- gemma: 웨이트가 공개돼도 사용 조건과 재배포 조건이 따로 붙을 수 있다는 점을 떠올리게 해 줘. 파일 접근 가능성과 자유 사용은 같은 말이 아니야.
- quantization: 같은 웨이트라도 저장 형식과 비트 수를 바꿔 메모리 사용량을 줄이는 과정이야. 그래서 웨이트가 있다는 사실과 어떤 형식의 웨이트인지 구분해서 봐야 해.