DiffusionGemma 완전 정리: 확산 모델로 LLM을 다시 그리는 4배 속도의 비밀

DiffusionGemma는 26B MoE 구조의 실험용 공개 모델로, 256토큰을 병렬 생성해 전용 GPU에서 자기회귀 LLM 대비 최대 4배 빠른 텍스트 생성을 제공한다. Apache 2.0 라이선스로 공개된 Gemma 계열 확산 기반 LLM의 구조와 한계를 분석한다.