본문 바로가기

분류 전체보기

(8)
Agentic RAG란? 한 번 검색하고 끝나는 RAG에서 ‘부족하면 다시 찾는 AI’로 Agentic RAG가 기존 RAG와 무엇이 다른지, 질문 분해·다중 검색·충분성 검사·재검색 루프가 어떻게 동작하는지 실무 관점에서 쉽게 정리합니다.Agentic RAG란? 한 번 검색하고 끝나는 RAG에서 ‘부족하면 다시 찾는 AI’로AI에게 회사 문서, 법령, 논문, 고객 기록처럼 모델이 원래 알지 못하는 자료를 검색하게 한 뒤 답변을 생성하는 방식을 RAG(Retrieval-Augmented Generation)라고 합니다.RAG는 LLM의 환각을 줄이고 최신 정보나 내부 데이터를 답변에 반영하는 데 매우 유용합니다. 하지만 실제 업무 질문은 생각보다 단순하지 않습니다.예를 들어 사용자가 다음과 같이 질문했다고 해보겠습니다.“프로젝트 X에 사용된 서버의 사양과 최근 장애 원인, 담당 팀의 후속 조..
벡터 데이터베이스란? AI가 의미로 검색하고 기억하게 만드는 핵심 인프라 벡터 데이터베이스가 무엇인지, 임베딩·유사도 검색·인덱스가 어떻게 동작하는지, RAG·추천 시스템·멀티모달 검색·AI 에이전트 메모리에 어떻게 활용되는지 쉽게 정리했습니다.검색창에 정확한 단어를 입력했는데도 원하는 결과가 나오지 않았던 경험이 있을 겁니다.예를 들어 사용자가 다음처럼 검색했다고 해보겠습니다."비 오는 날 신기 좋은 운동화"일반적인 키워드 검색은 문서나 상품 설명에비, 운동화, 신발 같은 단어가 실제로 포함되어 있는지를 중심으로 찾습니다.하지만 사용자가 원하는 것은 단순히 같은 단어가 포함된 결과가 아닙니다.방수 기능이 있는지젖은 노면에서 미끄럽지 않은지편하게 걸을 수 있는지비슷한 목적을 가진 제품인지즉, 사용자는 단어가 아니라 의미를 검색하고 있습니다.이런 의미 기반 검색을 가능하게 만드..
루프 엔지니어링이란? AI 코딩 에이전트를 직접 프롬프트하지 않는 새로운 작업 방식 루프 엔지니어링은 코딩 에이전트에게 매번 직접 지시하는 대신, 목표·자동화·워크트리·스킬·커넥터·서브에이전트·외부 메모리가 반복 실행되는 시스템을 설계하는 방법입니다. 개념과 아키텍처, 실전 도입 순서, 주의점을 쉽게 정리했습니다.AI 코딩 에이전트를 쓰다 보면 어느 순간 비슷한 패턴을 반복하게 됩니다.사용자: 이 이슈를 분석해 줘.에이전트: 분석했습니다.사용자: 그럼 수정해 줘.에이전트: 수정했습니다.사용자: 테스트해 줘.에이전트: 테스트가 실패했습니다.사용자: 오류를 고쳐 줘.에이전트: 다시 수정했습니다.처음에는 이 방식도 충분히 생산적입니다.하지만 프로젝트가 커지고 반복 작업이 늘어나면 사용자는 점점 에이전트의 관리자가 됩니다.다음 프롬프트를 직접 작성하고실패한 작업을 다시 설명하고여러 에이전트의 ..
MCP란 무엇인가? AI 앱과 외부 도구를 연결하는 표준 쉽게 이해하기 MCP(Model Context Protocol)는 AI 앱이 외부 데이터, 파일, API, 도구와 일관된 방식으로 연결되도록 돕는 표준입니다. 개념, 핵심 구조, 아키텍처, 왜 중요한지까지 쉽게 정리했습니다.AI를 조금 깊게 써보기 시작하면 금방 이런 벽에 부딪힙니다.모델은 똑똑한데 내 파일은 제대로 못 읽는다외부 API를 붙이려면 앱마다 연결 방식이 다르다같은 기능을 Claude, ChatGPT, Cursor, 사내 도구에 각각 따로 붙여야 한다보안, 권한, 도구 실행 규칙도 제각각이다즉, 문제는 단순히 “AI 성능”이 아니라AI 앱과 외부 세계를 어떻게 안정적으로 연결할 것인가에 있습니다.이 지점에서 등장하는 개념이 바로 MCP(Model Context Protocol) 입니다.MCP는 한마디로 말..
Google AX란? 중단되어도 다시 이어지는 분산 AI 에이전트 런타임 Google AX(Agent eXecutor)는 장시간 실행되는 AI 에이전트를 더 안정적으로 운영하기 위한 분산 런타임입니다. 재개 가능한 실행, 이벤트 로그, 단일 컨트롤러, Kubernetes 친화 설계를 쉽게 정리했습니다.AI 에이전트 이야기를 하다 보면 대부분 관심이 모델, 프롬프트, 도구 연결에 쏠립니다.하지만 실제 운영 단계로 가면 더 어려운 문제는 따로 있습니다.실행 중 끊기면 어떻게 이어서 실행할까?여러 도구와 서브 에이전트를 누가 조율할까?실행 상태와 이벤트를 어떻게 기록하고 추적할까?장시간 돌아가는 에이전트를 어떻게 안정적으로 운영할까?이런 문제를 정면으로 다루는 오픈소스가 바로 Google AX(Agent eXecutor) 입니다.AX는 에이전트를 더 똑똑하게 만드는 모델이나 프레임..
Cate란? 창 대신 공간을 쓰는 무한 캔버스 IDE, 왜 주목받을까? Cate는 에디터, 터미널, 브라우저, 문서, AI 에이전트를 하나의 무한 캔버스에 펼쳐 쓰는 새로운 형태의 코딩 IDE입니다. 기존 탭 중심 IDE와 무엇이 다른지, 어떤 개발자에게 잘 맞는지 쉽게 정리했습니다.개발하다 보면 이상하게도 코딩 자체보다 창 전환에 더 많은 집중력을 빼앗길 때가 많습니다.에디터를 보다가, 터미널로 가고, 다시 브라우저로 가고, 문서를 열고, AI 채팅창을 띄우고, Git diff를 확인하다 보면 작업 흐름이 자꾸 끊기죠.이 문제를 정면으로 건드리는 흥미로운 도구가 있습니다.바로 Cate입니다.Cate는 기존처럼 탭과 창을 계속 겹쳐 놓는 대신, 하나의 무한 캔버스 위에 에디터·터미널·브라우저·문서·AI 에이전트를 자유롭게 펼쳐 놓고 작업하는 IDE입니다.처음 보면 “그냥 패..
긴 컨텍스트 창을 믿지 마세요: AI 코딩 에이전트가 대화를 길게 할수록 실수하는 이유! 100만 토큰 컨텍스트가 곧 완벽한 기억력을 뜻하지는 않습니다. Lost in the Middle, RULER, Context Rot 연구를 바탕으로 LLM과 AI 코딩 에이전트의 성능을 지키는 컨텍스트 엔지니어링 방법을 정리합니다. AI 코딩 에이전트와 몇 시간 동안 작업하다 보면 이상한 순간이 찾아옵니다.처음에는 요구사항을 정확히 이해하던 에이전트가 갑자기 이미 고친 코드를 다시 건드리고, 앞에서 합의한 제약을 잊고, 존재하지 않는 파일이나 함수를 확신에 차서 언급합니다.이때 흔히 드는 생각은 두 가지입니다.“모델 성능이 갑자기 나빠졌나?”“컨텍스트 창이 아직 남아 있는데 왜 기억하지 못하지?”문제는 컨텍스트 창의 최대 크기와 모델이 실제로 안정적으로 활용하는 정보량이 같지 않다는 데 있습니다.이번 ..
[AI Ouroboros] 쏟아지는 AI 홍수 속에서 '진짜 내 무기'를 찾는 방법 매일 새로운 AI 기술과 툴이 쏟아져 나옵니다. ChatGPT부터 Claude, 그리고 이름조차 외우기 힘든 수많은 자동화 앱들까지.하지만 솔직해져 볼까요? 막상 내 업무나 일상에 적용하려 하면 막막하거나, 몇 번 프롬프트를 입력해 보다가 결국 "그냥 내가 직접 하는 게 편하겠네" 하고 창을 닫아버리진 않으셨나요?안녕하세요! [AI Ouroboros] 방문을 환영합니다.이 블로그는 단순히 트렌디한 기술을 빠르게 받아 적는 뉴스가 아닙니다. 기술의 겉모습에 매몰되지 않고, "이 대단한 기술을 어떻게 내 손으로 직접 구현하고, 내 업무 파이프라인에 연결해 완벽한 효율을 낼 것인가?"에 대한 집요한 실험 기록입니다.앞으로 이 공간을 통해 제가 직접 설치하고, 디버깅하고, 실무에 적용하며 검증한 알짜배기 지식들..