이 뉴스의 요약은 어떻게 만들어졌나요?

원문 링크를 바탕으로 핵심 요약을 만들고 fact-check 및 신호 점검을 거쳐 게재됩니다.

팩트체크 기준은 무엇인가요?

근거 링크, 수치 점검, 문맥 정합성, 최신성으로 조합해 상태를 표시해.

ByteDance Seed가 텍스트 VAE와 block-causal Diffusion Transformer를 결합한 Cola-DLM을 공개했어. LAMBADA 50.8%·SQuAD 30.9% 같은 zero-shot 점수가 함께 풀렸고 Apache-2.0 라이선스거든.

ByteDance Seed 팀이 Cola-DLM(Continuous Latent Diffusion Language Model)을 Hugging Face에 공개했어. 텍스트를 연속 잠재 시퀀스로 변환하는 Text VAE와 그 잠재공간 위에서 동작하는 **block-causal Diffusion Transformer(DiT)**를 합친 구조거든. 라이선스는 Apache-2.0이야.

기존 LLM이 토큰을 순차적으로 생성하는 오토리그레시브 방식이라면, Cola-DLM은 연속 잠재공간에서 디퓨전으로 텍스트를 만드는 접근이야. 두 단계 학습으로 묶여 있는데:

공개된 체크포인트는 논문 RQ4 scaling curve의 2,000 EFLOPs 지점에 해당한다고 명시돼 있어. 토크나이저는 OLMo 2 호환(어휘 100,278개).

zero-shot 벤치마크가 함께 풀려 있어:

LAMBADA가 50%대로 가장 높고, MMLU·HellaSwag는 랜덤 기준선 근처라 아직 absolute 성능은 작은 오토리그레시브 LM 대비 낮은 편이야. 다만 디퓨전 LM 라인의 scaling 가능성을 보여주는 데이터 포인트로 의미가 있어.

모델 카드에 instruction-tuning과 RLHF가 적용되지 않았다고 명시돼 있어. 챗봇용으로 바로 쓸 수 있는 모델이 아니라 연구용 베이스인 거지. 디퓨전 기반 텍스트 생성 연구나, 잠재공간 LM 실험을 해보려는 팀에게 좋은 출발점이 될 수 있어.

태그

#ByteDance#디퓨전모델#언어모델#오픈소스AI#Hugging Face

포맷 v3 가이드 news 3.3.0

팩트 체크

통과 · 2026-05-18 KST

검증 생성: AI + 편집 검토 · 2026-05-18 상태: 통과

통과 원문 대조

본문 설명이 원문 출처와 같은 대상을 가리키는지 먼저 맞춰봤어.

통과 교차 검증 검증 출처 3

관련 출처 3건을 나란히 놓고 핵심 주장 충돌이 없는지 다시 봤어.

통과 수치 검증

숫자, 버전, 고유명칭처럼 틀리기 쉬운 항목만 따로 떼어 확인했어.

통과 mechanism

통과 비판 검토

독자가 과하게 받아들일 수 있는 부분이 없는지 일부러 비판적으로 다시 읽었어.