macOS에서 로컬 코딩 에이전트 설정하는 방법: llama.cpp Metal과 Gemma 4로 사물박스형 LLM 굴리기

Apple Silicon Mac에서 llama.cpp Metal 백엔드와 Gemma 4 26B-A4B GGUF 모델을 활용해 인터넷 없이 동작하는 로컬 코딩 에이전트를 구축하는 전 과정을 단계별로 정리하고, speculative decoding으로 생성 속도를 약 24%까지 끌어올리는