NVIDIA‘Cosmos 3’을 HuggingFace에 오픈 모델로 공개했어. 설명에 붙은 수식어가 길어 — “Physical AI Reasoning and Action을 위한 최초의 오픈 옴니 모델”. 쉽게 말하면, 로봇이나 자율주행 차량처럼 실제 세계에서 보고 판단하고 움직여야 하는 AI를 위한 모델이야.

텍스트·이미지·비디오를 동시에 처리하는 옴니(Omni) 구조이고, 가중치를 공개(open)해서 누구나 다운로드해서 쓸 수 있어. HuggingFace에는 현재 100만 개 이상의 공개 모델이 등록돼 있는데, NVIDIA가 직접 여기에 올렸다는 게 포인트야. 지금까지 Physical AI 분야의 대형 모델은 대부분 클로즈드 소스였거든. 로보틱스 개발자 입장에선 선택지가 1개 더 생긴 거야.

Physical AI는 아직 상용화 초기 단계야. 제조·물류·의료 로봇 등에서 실험이 진행 중이고, 오픈 모델 공개는 그 실험 진입 비용을 낮추는 효과가 있어. NVIDIA는 2025년부터 Cosmos 시리즈를 공개해왔고, 이번이 3번째 공개 모델이야. NVIDIA 입장에선 자사 GPU 수요를 Physical AI 쪽으로 확장하는 포석이기도 하고.


짚어볼 것

  • Physical AI란: 카메라·센서 입력을 받아 실제 세계에서 동작을 출력하는 AI야. 로봇 팔 제어, 자율주행 판단 등이 대표 사례.
  • ‘첫 오픈 모델’이라는 주장: NVIDIA 자체 표현이야. 경쟁 모델과 실제 성능 비교는 외부 평가가 나와야 알 수 있어.
  • HuggingFace: 모델 가중치와 사용법은 공식 페이지에서 다운로드 가능해.