Sakana AI와 NVIDIA, LLM 추론 및 학습 최대 21.9% 가속화한 TwELL 희소 커널 공개

Sakana AI와 NVIDIA가 LLM 추론 20.5%, 학습 21.9% 속도 향상을 이룬 TwELL 커널을 공개했습니다. CUDA 기반 희소화와 하드웨어 최적화 강점까지 주요 내용으로 분석합니다. 핵심 쟁점과 실무 적용 포인트를 함께 정리합니다. 핵심 쟁점과 실무 적용 포인트를 함께