한 줄 정의
Stable Diffusion은 텍스트 설명이나 기존 이미지를 바탕으로 새 이미지를 만들어 내는 확산 기반 이미지 모델 계열이야. Stability AI 이름과 함께 자주 나오지만, 실제로는 SDXL 같은 여러 버전과 파생 모델을 묶어 부르는 경우가 많아.
이 모델로 무엇을 할 수 있나
실무에서는 콘셉트 시안, 광고 비주얼 초안, 썸네일, 배경 생성, 인페인팅 같은 작업에 많이 써. Stability AI API로 붙여 쓸 수도 있고, 로컬 GPU 환경에서 직접 돌리는 배포 경로도 널리 쓰여서 제품 실험과 내부 제작 파이프라인에 자주 들어가.
왜 중요한가
Stable Diffusion 계열은 이미지 생성 AI를 대형 클라우드 데모에서 끝내지 않고, 실제 제작 워크플로와 로컬 실행 문화로 퍼뜨린 축 가운데 하나야. 그래서 기사에서 이 이름이 보이면 성능 숫자만 볼 게 아니라, 어떤 팀이 자체 워크플로에 붙이려는지까지 같이 읽는 게 중요해.
같이 보면 좋은 모델
- DeepSeek R1은 텍스트 추론 모델이라서, Stable Diffusion처럼 이미지를 직접 만드는 모델과 역할이 아예 다르다는 걸 비교해 보기 좋아.
- Llama는 텍스트 중심 오픈 모델 계열이라서, ‘계열 이름’으로 불린다는 점은 비슷해도 출력 대상이 다르다는 걸 보여 줘.
- Gemma를 같이 보면 경량 텍스트 모델과 이미지 생성 모델이 배포 전략에서 어떻게 갈리는지 감이 잡혀.
- Qwen을 같이 보면 멀티버전 모델 계열을 읽는 법은 비슷하지만, Stable Diffusion은 이미지 제작 파이프라인에 붙는다는 점이 더 선명해져.