Markdown 우선 메모리 런타임 EverOS - 에이전트 인프라의 새로운 기준이 될까

AI 에이전트 생태계에서 무게치(weights)와 프롬프트 엔지니어링에 집중하던 관심 사이로, 에이전트의 기억과 도구 사용을 관장하는 메모리 런타임 계층이 새로운 차별화 지점으로 떠오르고 있다. 2026년 6월 29일자 MarkTechPost 기사는 이러한 흐름 속에서 Markdown 우선 파일 형식과 BM25 + 벡터 하이브리드 검색, Self-Evolving Skills를 결합한 오픈소스 프로젝트 EverOS를 소개한다. 본문은 단순 소개를 넘어, 왜 메모리 런타임이 모델보다 장기적으로 더 중요한 경쟁 영역이 될 수 있는지 실무자 관점에서 해설한다.

핵심 정리

EverOS는 에이전트의 메모리 런타임을 Markdown 우선 파일 구조로 관리하는 오픈소스 프로젝트다.
전통적인 BM25 키워드 검색과 임베딩 기반 벡터 검색을 결합한 하이브리드 검색을 제공한다.
사용 이력에서 패턴을 축적해 능력을 스스로 갱신하는 Self-Evolving Skills 메커니즘을 갖추고 있다.

에이전트 경쟁의 무게중심이 모델에서 메모리 런타임으로 이동하고 있으며, EverOS는 그 전환점을 상징하는 오픈소스 사례로 해석할 수 있다.

들어가며 – AI 에이전트의 메모리 병목

왜 모델 무게치보다 메모리 런타임이 새로운 경쟁 영역인가

대형 언어 모델의 성능이 상향 평준화되면서, 단일 추론 품질만으로는 에이전트 간 차별화가 어려워지고 있다는 진단이 업계에서 확산되고 있다. 그 자리를 대신 채운 것이 도구 호출(tool use), 장기 기억(long-term memory), 자기 개선(self-improvement) 같은 런타임 계층이다. 에이전트가 어떤 맥락을 기억하고, 어떤 절차로 도구를 조합하느냐가 실제 업무 성과에 직접 영향을 주기 때문이다. 이러한 이유로 메모리 런타임은 에이전트 인프라의 차세대 경쟁 영역으로 부상하고 있는 것으로 분석된다.

오픈소스 메모리 런타임의 부상

폐쇄형 SaaS 형태로 제공되던 에이전트 메모리 서비스와 달리, 최근에는 파일 기반의 투명한 메모리 구조를 채택한 오픈소스 프로젝트가 늘어나고 있다. 사용자가 자신의 데이터를 직접 들여다보고, 마이그레이션할 수 있다는 점은 엔터프라이즈 도입에서 결정적인 변수가 된다. EverOS 역시 이 흐름 위에 있는 사례로 분류된다.

EverOS 개요와 핵심 구성 요소

Markdown-First 설계의 실용적 이점

EverOS는 단순 텍스트 파일이 아니라 구조화된 Markdown 단위로 메모리를 저장한다. 인간이 읽을 수 있는 포맷이라는 점은 단순한 편의가 아니라, 감사 로그와 데이터 거버넌스 측면에서 이점으로 작용할 것으로 분석된다. 또한 Git 등 기존 버전 관리 도구와 자연스럽게 연동되어, 메모리 변경 이력을 코드리뷰하듯 추적할 수 있다.

에이전트 스킬을 코드로 다루는 방식

에이전트가 사용하는 절차와 도구 조합 역시 Markdown 문서 안에서 스킬(skill)이라는 단위로 다룬다. 이를 통해 스킬은 검색 대상, 실행 단위, 개선 대상의 세 가지 역할을 동시에 수행하는 것으로 분석된다. 일반적인 RAG 파이프라인의 문서 청크와 비교해 에이전트 행위를 더 의미 있는 단위로 모듈화한다는 점에서 주목할 만한 설계로 분석된다.

하이브리드 검색 – BM25와 벡터 검색의 결합

에이전트 메모리에서 검색은 성능과 직결되는 핵심 기능으로 분석된다. EverOS는 이 검색 계층에 두 알고리즘을 동시에 배치한다.

구분	BM25	벡터 검색
기반 방식	키워드 빈도와 문서 길이 기반 랭킹	임베딩 벡터 간 코사인 유사도
강점	정확한 용어, 코드 식별자, 에러 메시지에 강함	의미가 유사한 문장, 의역, 다국어 검색에 강함
한계	동의어, 의역, 문맥 이해가 어려움	정확한 식별자나 희소 용어 재현이 약함
계산 비용	낮음, 색인도 가벼움	임베딩 모델과 벡터 DB 인프라 필요

BM25의 강점과 한계

BM25는 오랫동안 정보 검색 분야에서 사용되어 온 랭킹 함수다. 함수명, 환경 변수, 로그 메시지처럼 정확한 토큰 일치가 중요한 케이스에서 여전히 강력한 성능을 보인다. 그러나 의미적 유사성을 반영하지 못한다는 명확한 한계가 있다.

벡터 검색의 강점과 한계

벡터 검색은 임베딩 모델을 통해 텍스트를 고차원 공간에 투영하고, 의미적 거리를 기준으로 검색한다. 사용자 질문의 표현이 달라도 핵심 의도가 같으면 잘 회수한다는 장점이 있다. 반면, 임베딩 모델 학습 데이터에 따라 성능이 좌우되며, 정확한 식별자 검색에서는 BM25보다 불안정할 수 있다.

두 방식을 결합했을 때의 트레이드오프

EverOS가 두 방식을 결합한 것은 검색 정확도 자체보다도 회수율(recall)과 정밀도(precision)의 균형을 노린 선택으로 보인다. 다만 하이브리드 검색은 랭킹 결합 가중치, 중복 제거, 지연 시간 관리 등 튜닝 포인트를 함께 가져온다는 점은 운영 시 고려해야 할 부분이다.

Self-Evolving Skills – 런타임이 스스로 학습하는 구조

스킬 점수 갱신 메커니즘

Self-Evolving Skills는 에이전트가 어떤 스킬을 사용했는지, 그 결과가 어떤지 런타임이 추적하고, 그 통계를 바탕으로 스킬의 우선순위와 신뢰도를 갱신하는 기능으로 분석된다. 즉, 새로운 모델을 재학습하지 않더라도 배포 이후 운영 데이터만으로 에이전트 행동 품질이 점진적으로 개선될 수 있는 구조를 제공하는 것으로 분석된다.

운영 자동화와 가드레일의 균형

스킬이 자동으로 진화한다는 점은 운영 부담을 줄여주지만, 동시에 의도하지 않은 행동 변화로 이어질 위험도 내포한다. 따라서 실제 도입 시에는 자동 채택 구간과 휴먼 승인 구간을 분리하고, 진화 로그를 감사할 수 있는 장치가 필수로 보인다.

기존 솔루션 대비 EverOS의 포지셔닝

LangChain, LlamaIndex 같은 기존 프레임워크는 RAG 파이프라인과 도구 호출을 조합하는 데 초점을 둔다. 메모리 자체를 1급 시민으로 다루는 경우는 상대적으로 적다. EverOS는 이 빈 틈을 독립된 메모리 런타임이라는 형태로 채우려는 시도로 해석된다. 다만 기능의 성숙도, 생태계 확장성, 엔터프라이즈 지원 수준은 아직 검증 단계로 볼 필요가 있다.

도입 시 체크리스트

운영 환경과 비용

임베딩 모델과 벡터 DB의 라이선스 및 운영 비용
하이브리드 검색으로 인한 응답 지연 허용 범위
Markdown 파일을 저장할 스토리지 백업 및 복구 정책

데이터 거버넌스

메모리에 저장될 정보의 민감도 분류 및 마스킹 정책
Self-Evolving Skills의 변경 이력 감사 체계
외부 서비스로 전송되는 메타데이터 범위 점검

전망 – 에이전트 메모리 표준이 될 수 있는가

에이전트 시장이 초기 탐색기를 지나 운영 단계로 접어들면서, 메모리 런타임은 조용하지만 결정적인 인프라로 자리 잡을 가능성이 높다. Markdown 우선이라는 단순한 선택, BM25 + 벡터의 검증된 결합, 그리고 Self-Evolving Skills의 자동화는 그 후보로서 EverOS가 갖는 매력적인 설계 철학을 보여준다. 다만 표준이 되기 위해서는 생태계 통합, 거버넌스 도구, 그리고 장기적인 유지보수 신뢰가 함께 따라야 할 것으로 보인다.

정리 포인트

에이전트 경쟁의 무게중심이 모델에서 메모리 런타임으로 이동하고 있다.
EverOS는 Markdown 우선, BM25 + 벡터 하이브리드, Self-Evolving Skills의 3축 구조다.
하이브리드 검색은 강점을 합치지만 튜닝 포인트를 함께 가져온다.
스킬 자동 진화는 운영 자동화와 가드레일의 균형 설계가 필수다.
표준 등극을 위해서는 생태계와 거버넌스 성숙도가 관건이다.

EverOS, 오픈소스, AI에이전트, 메모리런타임, Markdown, BM25, 벡터검색, 하이브리드검색, SelfEvolvingSkills, 에이전트인프라, RAG, LangChain, LlamaIndex, 오픈소스프로젝트

참고 출처:

Markdown 우선 메모리 런타임 EverOS – 에이전트 인프라의 새로운 기준이 될까