Claude가 Claude를 만든다: 재귀적 자기 개선, 이제 멈출 수 없는가

핵심 요약

가속 곡선: 2024년 4분에서 2026년 12시간으로, AI의 자율 작업 지평이 4개월마다 두 배씩 증가
내부 증거: Anthropic 코드베이스의 80% 이상이 Claude 손을 거치며 8배 생산성 향상 달성
구조적 딜레마: 재귀적 자기 개선은 단일 조직의 통제로는 안전을 담보하기 어렵고, 국제적 검증 가능한 조율이 핵심 과제로 부상

기술 가속이 멈출 가능성보다, 거버넌스 준비가 그 가속을 따라잡을 가능성이 더 작다.

2026년 5월, 한 AI 회사가 공개한 한 장의 보고서가 기술 업계의 뜨거운 감자로 떠올랐다. Anthropic이 자사의 재귀적 자기 개선(Recursive Self-Improvement) 진전 상황을 정량 데이터와 함께 공개한 것이다. 핵심 메시지는 단순하고 충격적이다. AI 모델이 자율적으로 완수 가능한 작업의 길이가 이제 4개월마다 두 배씩 증가하고 있으며, 이는 종전의 7개월 주기보다 더 빠른 가속이라는 점이다. 한마디로, AI가 AI를 만드는 시대가 정착 단계에 접어들었다는 뜻이다.

1장. 가속하는 자율성: 4개월 두 배 법칙

Anthropic이 제시한 데이터는 명확한 지수 곡선을 그린다. 2024년 3월 기준 Claude가 안정적으로 완수할 수 있는 작업의 길이는 약 4분에 불과했다. 그러나 같은 해 하반기 1.5시간, 2025년 들어 4시간, 2026년 초 7시간, 그리고 현재 시점에서 12시간 이상의 작업을 자율적으로 완수하는 수준에 도달했다. 측정 주기가 4개월로 단축됐고 매 주기마다 처리 가능 작업 길이가 정확히 두 배가 됐다.

벤치마크 데이터도 같은 결을 보여준다. SWE-bench 점수는 2년 만에 한 자릿수 초반에서 사실상 포화 수준까지 상승했고, 학술 재현성을 평가하는 CORE-Bench는 15개월 만에 약 20%에서 포화선에 도달했다. METR(Model Evaluation and Threat Research)은 Claude Mythos Preview가 최소 16시간짜리 연속 작업을 인간 개입 없이 완수할 수 있다고 검증했다. 더 긴 시간 지평은 아직 측정되지 않았을 뿐, 가능성이 닫힌 것은 아니다.

2장. Anthropic 내부의 증거: 80% 코드, 8배 생산성

흥미로운 것은 이러한 자율성 향상이 실제 엔지니어링 생산성으로 직결된다는 점이다. 2026년 5월 기준 Anthropic 코드베이스에 병합되는 코드의 80% 이상이 Claude에 의해 작성된다. 일반 엔지니어의 하루 병합 코드량도 2024년 대비 약 8배 증가했다. 이는 단순한 보조 도구를 넘어, AI가 실제 소프트웨어 개발 파이프라인의 주된 작성자가 됐음을 의미한다.

그러나 이는 곧 엔지니어의 역할이 사라졌다는 의미는 아니다. 오히려 엔지니어의 역할은 코드 한 줄을 작성하는 실행자에서, 어떤 문제를 풀지 결정하고 그 결과를 검증하는 책임자로 재정의되고 있다. Anthropic 내부에서도 Claude가 작성한 코드를 리뷰하고, 방향을 잡고, 우선순위를 정하는 일은 여전히 인간이 담당한다. 다만 그러한 인간의 개입 단위는 ‘라인’이 아니라 ‘프로젝트’로 이동했다.

3장. 인간이 여전히 우위를 점하는 영역: 연구 판단과 목표 선택

Anthropic 보고서가 흥미로운 비대칭을 지적한다. 엔지니어링 실행 영역에서 Claude는 인간과 동등하거나 능가하는 성능을 보이지만, 연구 판단과 목표 선택 영역에서는 여전히 인간이 명확한 비교우위를 가진다. 다시 말해, ‘어떻게 만들 것인가’는 빠르게 자동화되는 반면, ‘무엇을 만들 것인가’와 ‘왜 만들 것인가’는 인간 고유의 영역으로 남아 있다.

이러한 비대칭은 앞으로의 경쟁 구도를 결정짓는 핵심 변수가 된다. AI 도구를 자유롭게 활용할 수 있는 환경에서 승부는 도구의 활용 능력이 아니라, 어떤 문제를 선택하고 어떤 방향으로 연구를 끌고 갈 것인가에 대한 판단력에서 갈린다. 목표 선택 자체가 곧 경쟁력이 되는 시대가 도래한 것이다.

4장. 세 가지 미래 시나리오

Anthropic은 가능한 미래를 세 가지 시나리오로 제시한다. 첫째, 현 추세가 정체되는 시나리오다. 자율성 향상이 어떤 천장(ceiling)에 부딪혀 정체 국면에 진입하는 경우로, 실현된다면 인류에게 가장 부드러운 전환 경로가 된다. 둘째, 인간 주도의 복합 효율 향상이 계속되는 시나리오다. AI가 도구로서 강력해지지만 개선 루프의 핵심 결정은 인간이 장악하는 형태다. 셋째, 완전한 재귀적 자기 개선 시나리오다. AI가 자신의 학습 데이터, 아키텍처, 목표 함수까지 스스로 개선하는 루프가 닫히는 경우다.

현재 데이터는 적어도 둘째 시나리오에 가깝게 움직이고 있다. 그러나 셋째 시나리오로의 전환 시점을 정확히 예측하기 어렵다는 점이 문제다. 그 경계는 명확한 이벤트가 아니라 임계점(threshold)의 형태로 나타날 가능성이 높기 때문이다.

5장. 안전과 거버넌스: 검증 가능한 조율의 난제

재귀적 자기 개선의 가장 큰 위험은 한 조직이 아닌 여러 최전선 연구소에서 동시다발적으로 진행된다는 점이다. 한쪽이 감속하더라도 다른 쪽이 가속하면 의미가 없다. 따라서 안전한 감속을 위해서는 여러 국가의 최전선 연구소 간 검증 가능한 조율(verifiable coordination)이 핵심 과제로 떠오른다.

그러나 검증 가능한 조율은 기술적으로도, 정치적으로도 난제가 아닐 수 없다. 모델의 내부 상태와 학습 데이터, 그리고 진행 중인 연구의 방향까지 외부 검증에 열어두는 것은 지적재산권과 국가 안보의 영역과 충돌한다. 그럼에도 불구하고, 자율성이 임계점을 넘어서는 시점 이전에 최소한의 국제 합의가 이루어지지 않으면, 통제 불가능한 경주로에 진입할 위험이 커진다.

결론: 루프가 닫히기까지 남은 시간

Claude가 작성한 코드가 Claude 자체를 개선하는 데 사용되고, 그 개선된 Claude가 더 나은 코드를 작성하는 루프는 이미 부분적으로 가동 중이다. 남은 질문은 이 루프가 완전히 닫히기까지 얼마의 시간이 남았느냐가 아니라, 그 시점에 우리가 어떤 거버넌스 구조를 갖추고 있느냐다. 기술적 가속은 멈추지 않을 가능성이 높다. 남은 것은 그 가속의 방향을 결정할 사회적 합의와, 그 합의를 검증 가능한 형태로 구현할 기술적·정치적 인프라다. 둘 다 아직 충분하지 않다.

정리하면

자율 작업 지평의 4개월 두 배 가속은 단순한 성능 향상이 아니라 개발 패러다임 자체의 전환을 의미한다.
엔지니어의 역할은 라인 단위 작성자에서 프로젝트 단위 판단과 검증 책임자로 이동했다.
재귀적 자기 개선의 위험은 한 조직의 통제로는 해결 불가능하며, 국제적 검증 가능한 조율 없이는 통제 불가능한 경주로에 진입할 가능성이 높다.

TAG : 재귀적 자기 개선, Claude, Anthropic, 자율 작업 지평, SWE-bench, CORE-Bench, METR, AI 에이전트, 자율 코딩, AI 안전, 검증 가능한 조율, 프런티어 AI, AI 개발 패러다임, 연구 자동화