한 줄 정의
Modal은 AI와 데이터 작업을 서버리스 방식으로 올릴 수 있게 해 주는 클라우드 실행 플랫폼이야. 개발자가 쿠버네티스나 GPU 인프라를 직접 만지기보다 코드 중심으로 실행 환경을 선언해서 쓰는 쪽에 더 가까워.
어떻게 작동하나
코드와 의존성을 정의하면 Modal이 그걸 실행 이미지로 감싸서 클라우드 CPU나 GPU에서 실행해 줘. 공식 소개 기준으로 서브초대 콜드 스타트와 초 단위 과금 같은 운영 특성이 있고, 함수 호출, 배치 작업, 장시간 실행 작업을 같은 플랫폼 안에서 다룰 수 있어.
왜 중요한가
AI 서비스는 모델 품질만큼이나 배포 속도와 운영 단가가 중요해. Modal 같은 플랫폼을 이해하면 팀이 얼마나 적은 인프라 작업으로 GPU 워크로드를 붙일 수 있는지, 그리고 왜 이런 도구가 제품 속도를 바꾸는지 감을 잡기 쉬워.
주의해서 볼 점
Modal이 편하다고 해서 비용과 운영 고민이 사라지는 건 아니야. 콜드 스타트, 장기 실행 비용, 데이터 위치, 벤더 종속성 같은 문제는 여전히 남아서 항상 직접 운영보다 싸고 유연하다고 단정하면 틀려.
관련 용어
- quantization은 모델을 더 가볍게 만드는 기법이야. Modal은 그 모델을 어디서 돌릴지 정하는 플랫폼이라 층위가 다르다는 걸 같이 보면 좋아.
- onnx는 모델 포맷과 호환성 이야기야. 배포 플랫폼과 실행 포맷을 분리해서 읽게 도와줘.
- runtime은 코드나 모델이 실제로 도는 실행 계층이야. Modal은 그 런타임을 감싸는 운영 플랫폼에 더 가까워.
- on-device는 반대로 기기 안에서 추론하는 전략이야. 클라우드 서버리스 중심인 Modal과 대비해서 읽기 좋아.