한 줄 정의
Qwen3.5-27B (큐웬3.5-27B)는 Alibaba의 Qwen 계열에 포함된 27B급 오픈 웨이트 멀티모달 모델이야. 텍스트 전용 모델로만 보면 안 되고, weight를 직접 받아 inference 경로를 설계하는 후보로 읽는 편이 정확해.
모델 프로필
이 모델은 Qwen 3.5 계열 안에서 “직접 올려서 쓰는 27B급 공개 모델”이라는 성격이 중요해. API 이름표만 보는 문맥보다, 사내 GPU나 전용 추론 서버에 얹을 수 있는지 검토하는 문맥에서 더 자주 거론돼.
라이선스는 Apache 2.0이고 대표 접근 경로는 모델 카드와 Transformers 문서야. 그래서 이 항목을 볼 때는 “호스티드 서비스 소개”보다 “공개 가중치를 어떻게 받아서 배포할지”를 먼저 읽는 편이 맞아.
어디에 쓰이나
실무에서는 이미지가 붙은 문서 분류, 시각 정보가 섞인 질의응답, 캡처 화면 이해, 멀티모달 보조 모델 후보처럼 검토하는 경우가 많아. 오픈 웨이트라서 호출 제한보다 배포 구조, 메모리 예산, 처리량 계획이 먼저 논점이 돼.
예를 들어 내부 문서 검색에 이미지를 섞어 쓰거나, OCR 뒤에 붙는 후처리 모델을 따로 두기 싫을 때 이런 크기의 공개 멀티모달 모델을 비교하게 돼. 도입할 때는 어떤 runtime에 올릴지, 어떤 정밀도로 설정할지, GPU 한 장에 배치가 몇 개까지 들어갈지를 같이 계산해야 해.
왜 중요한가
Qwen3.5-27B가 자주 비교표에 들어오는 이유는 너무 작지도 너무 크지도 않은 중간 지점이기 때문이야. 더 작은 모델은 멀티모달 작업에서 답답할 수 있고, 훨씬 더 큰 모델은 배포 부담이 빠르게 커져. 그래서 오픈 웨이트 멀티모달 모델을 직접 붙이려는 팀은 이 크기를 성능과 운영 부담을 함께 보는 기준점으로 삼는 경우가 많아.
중요한 건 숫자 자체보다 도입 방식이야. API만 붙이면 끝나는 모델이 아니라 가중치 관리, 입력 파이프라인, 지연 시간, 메모리 예산을 전부 같이 봐야 하니까, 이 모델을 이해하면 “오픈 모델을 실제로 굴린다”는 말이 무엇을 뜻하는지 감이 빨리 생겨.
같이 보면 좋은 모델
- Qwen 3.5: 이 버전이 계열 안에서 어떤 위치인지 먼저 볼 때 기준점이 돼.
- Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled: 같은 크기에서 distillation이 붙으면 문서 성격이 어떻게 달라지는지 비교하기 좋아.
- Gemma 4: 다른 벤더의 오픈 모델 축과 비교할 때 자주 함께 올라와.
- GGUF: 직접 서빙이나 경량 배포를 논할 때 같이 따라오는 포맷 문맥이야.