namoman.com

디지털 정원과 실험실

[태그:] AI에이전트

  • 클로드(Claude) 구독 정책 변화와 매니지드 에이전트(Managed Agents) 업데이트 완벽 정리

    인공지능(AI) 시장의 기술 고도화가 빠르게 진행되면서, 글로벌 AI 플랫폼들의 서비스 운영 및 구독 정책에도 크고 작은 변화가 이어지고 있습니다.

    저도 최근에 hermes ai툴을 돌리다가 토큰부족때문에 프로젝트를 스톱한 적이 있다고 말씀드렸는데요.(헤르메스 AI(Hermes Agent) 설치 및 제미나이(Gemini) 연동 완벽 가이드)

    최근 앤스로픽(Anthropic)의 클로드(Claude) 생태계에서 주목할 만한 변화가 포착되었습니다. 바로 서드파티 연동 및 API 활용과 관련된 구독 구조의 변화 움직임과 더불어, 개발자 및 기업 사용자를 위한 ‘클로드 매니지드 에이전트(Claude Managed Agents)’의 강력한 신기능 출시 소식입니다.

    이번 포스팅에서는 최근 커뮤니티와 IT 업계를 중심으로 정보가 공유되고 있는 클로드 구독 관련 이슈와, 앤스로픽이 공식 발표한 매니지드 에이전트의 핵심 업데이트 내용을 알기 쉽게 정리해 드리겠습니다.

    1. 클로드 구독 정책 변화 및 오픈클로(OpenClaw) 이슈

    최근 국내외 블로그 및 기술 커뮤니티를 통해 클로드 사용자들 사이에서 구독 정책 변경 및 추가 비용 발생에 대한 우려와 관심이 높아지고 있습니다. 특히 오픈소스 UI 툴이나 외부 확장 프로그램(예: 오픈클로 등)을 활용해 클로드 API를 연동하던 사용자들 사이에서 비용 체계 변화에 대한 분석이 활발합니다.

    Run agents on a schedule

    일반적인 웹 인터페이스 방식의 Claude Pro 구독과 달리, 외부 에이전트나 서드파티 플랫폼을 통해 클로드의 강력한 LLM 모델을 연동할 때는 토큰(Token) 단위의 API 과금 체계가 적용되거나 플랫폼별 별도 정책이 개입됩니다. 앤스로픽이 자사 인프라 효율성과 기업형 기능을 강화함에 따라, 대량의 텍스트를 처리하거나 자동화 스크립트를 상시 가동하는 헤비 유저들은 비용 청구 방식을 꼼꼼히 모니터링해야 하는 시점입니다. 무분별한 호출을 방지하고 보안을 강화하기 위해 정책이 세분화되고 있으므로, 자신이 사용하는 서드파티 툴의 연동 방식과 앤스로픽 API 대시보드의 사용량 제한(Rate Limits) 설정을 반드시 점검하는 것이 좋습니다.

    2. 신기능: 클로드 매니지드 에이전트(Claude Managed Agents) 업데이트

    구독 정책의 변화 흐름 속에서, 앤스로픽은 개발자와 기업들이 AI 에이전트를 더욱 안정적이고 자율적으로 운영할 수 있도록 돕는 ‘클로드 매니지드 에이전트(Claude Managed Agents)’의 혁신적인 신기능을 대거 출시했습니다. 업무 자동화의 패러다임을 바꿀 두 가지 핵심 업데이트는 다음과 같습니다.

    ① 정기 실행 기능 (Run Agents on a Schedule)

    기존의 AI 에이전트는 사용자가 프롬프트를 입력하거나 특정 트리거(Trigger) 이벤트가 발생해야만 작동하는 수동적인 구조가 많았습니다. 하지만 이번 업데이트를 통해 개발자가 지정한 일정(Schedule)에 맞춰 에이전트가 알아서 작동하도록 설정할 수 있게 되었습니다.

    • 활용 예시: 매일 아침 9시 시장 분석 보고서 자동 작성, 매주 월요일 데이터베이스 이상 징후 체크 및 요약 리포트 발행 등 반복적이고 정기적인 업무를 인간의 개입 없이 100% 자율적으로 수행합니다.
    오픈클로 로고

    ② 보안 볼트 내 환경 변수 저장 (Store Environment Variables in Vaults)

    에이전트가 외부 서비스(예: GitHub, Slack, Notion, 사내 DB 등)와 연동되어 자율적으로 업무를 수행하려면 API 키나 패스워드 같은 민감한 인증 정보가 필수적입니다. 이전에는 이를 코드나 설정 파일에 노출해야 하는 보안 리스크가 있었습니다.

    • 개선 사항: 앤스로픽은 매니지드 에이전트 환경 내에 안전한 암호화 저장소인 ‘볼트(Vault)’ 기능을 도입했습니다. 이제 민감한 환경 변수와 인증 키를 볼트에 안전하게 격리 저장할 수 있으며, 에이전트는 실행 시 보안 위협 없이 이 정보들을 안전하게 호출하여 외부 시스템과 상호작용합니다.

    3. 변화하는 클로드 생태계, 어떻게 대처해야 할까?

    클로드의 구독 정책 움직임과 매니지드 에이전트 기능 강화는 한 가지 명확한 방향성을 보여줍니다. 바로 AI를 단순한 ‘대화형 챗봇’을 넘어, 안전하게 권한을 부여받아 스스로 일하는 ‘자율형 업무 소프트웨어(Autonomous Agent)’로 진화시키겠다는 것입니다.

    개인 사용자 및 기업 관리자분들은 아래 사항을 체크하여 변화에 대응하시기 바랍니다.

    1. 비용 최적화: 외부 툴(OpenClaw 등)을 연동 중이라면 프리미엄 구독 멤버십과 API 토큰 사용량 중 어느 쪽이 비용 효율적인지 정기적으로 비교·분석하세요.
    2. 보안 가이드 준수: 에이전트 개발 시 자사 소스코드에 API 키를 하드코딩하지 말고, 신규 도입된 ‘볼트(Vault)’ 기능을 적극 활용하여 기업 보안 가이드라인을 충족해야 합니다.
    3. 업무 자동화 설계: 정기 실행 기능을 활용해 단순 반복 업무를 에이전트에게 위임하고, 인적 자원은 더 생산적인 기획과 의사결정에 집중할 수 있도록 업무 프로세스를 재설계해 보세요.

    정책 변화의 진짜 배경: 왜 지금 바뀔까?

    많은 IT 커뮤니티와 유저들 사이에서는 “사람들이 오픈클로(OpenClaw) 같은 서드파티 UI 툴을 활용해 무제한에 가깝게 트래픽을 돌려대니 앤스로픽이 결국 칼을 빼든 게 아니냐”는 분석이 지배적입니다.

    실제로 일반적인 웹 브라우저 접속과 달리, 외부 연동 툴을 통한 우회 접근이나 비공식 경로를 통한 대량의 API 호출은 플랫폼 운영사 입장에서 엄청난 서버 부하와 비용 부담을 야기합니다. 결국 트래픽 남용을 막고 정상적인 비즈니스 모델을 보호하기 위해 과금 체계와 모니터링을 강화한 것으로 보입니다.

    과금체계가 부담되시는 글은 저의 이전 포스트(VS코드에서 Deepseek을 연결해서 사용하는 방법)도 참고 하시면 도움이 될 것 같습니다.

    어쨌건 결과적으로 앤스로픽은 꼼수성 이용 패턴은 철저히 차단하는 대신, 기업과 전문 개발자들이 정당한 대가를 지불하고 안전하게 쓸 수 있는 공식 기능(매니지드 에이전트의 스케줄러, 보안 볼트 등)을 대폭 밀어주는 방향으로 생태계를 재편하고 있습니다.

    출처

  • 무료API를 하나의 거대한 자원으로, ‘FreeLLMAPI’프로젝트

    최근 인공지능 기술이 급수적으로 발전하면서, 수많은 AI 연구소와 기업들이 앞다투어 자사 대형 언어 모델(LLM)의 무료 API 티어를 제공하고 있습니다. 덕분에 개인 개발자나 연구자들은 큰 비용을 들이지 않고도 최신 모델들을 테스트해 볼 수 있는 좋은 환경이 마련되었죠.

    하지만 막상 이것들을 실제 프로젝트나 장기적인 테스트에 적용하려고 하면 예상치 못한 문제에 직면하게 됩니다. 각 서비스마다 API 규격이 다르고, 무엇보다 무료 티어 특성상 빈번하게 발생하는 ‘요청 한도 초과(Rate Limit)’ 때문에 시스템이 중간에 멈춰버리기 일쑤이기 때문입니다. 이러한 불편함을 단번에 해결하고 여러 무료 API를 하나의 거대한 자원으로 묶어주는 흥미로운 오픈소스 프로젝트가 있습니다. 바로 FreeLLMAPI입니다.

    1. 매달 17억 토큰의 자유, FreeLLMAPI 개요

    FreeLLMAPI는 무려 16개 이상의 다양한 LLM 제공자(Google Gemini, Groq, Mistral, GitHub Models 등)의 무료 티어를 한데 모아, 단 하나의 OpenAI 호환 엔드포인트 뒤로 묶어주는 강력한 프록시(Proxy) 서버 역할을 합니다.

    원작자의 설명에 따르면, 이 도구를 통해 하나로 합칠 수 있는 추론 용량이 매달 약 17억(1.7B) 토큰에 달한다고 한다. 100개가 넘는 다양한 모델들을 단일 인터페이스 안에서 손쉽게 호출할 수 있다는 점은 가벼운 토이 프로젝트나 아이디어 검증을 진행할 때 엄청난 메리트로 다가온다. 복잡하게 흩어진 자원들을 영혼까지 끌어모아 나만의 든든한 백엔드를 구축하는 셈입니다.

    2. 끊김 없는 운영의 비밀, 스마트 라우팅과 페일오버(Failover)

    여러 무료 API를 섞어 쓸 때 가장 큰 골칫거리는 툭하면 튀어나오는 ‘429 Too Many Requests’ 에러입니다. FreeLLMAPI는 이 문제를 영리하게 해결했습니다.

    핵심 원리는 바로 지능형 라우팅과 자동 우회(Failover) 시스템에 있습니다. 사용자의 요청이 프록시 서버로 들어오면, 엔진은 1순위로 지정된 제공자에게 요청을 보낸다. 만약 여기서 한도 초과나 연결 오류가 발생하더라도 사용자에게 곧바로 에러를 뱉어내지 않습니다. 그 즉시 2순위, 3순위의 다른 제공자로 트래픽을 넘겨(Fallback) 매끄럽게 응답을 받아오죠. 사용자는 뒤에서 어떤 API가 죽었고 다른 경로로 우회되었는지 전혀 신경 쓸 필요 없이 그저 안정적으로 결과물만 받아보면 됩니다.

    – 작동원리

    FreeLLMAPI는 일종의 ‘중개자(Wrapper)’ 역할을 수행합니다.

    • 요청 수신: OpenAI API 규격(v1/chat/completions)으로 들어오는 데이터를 가로챕니다.
    • 변환 및 전달: 요청 내용을 로컬 환경에 설치된 LLM이 이해할 수 있는 형식으로 변환하여 전달합니다.
    • 응답 반환: 로컬 모델의 결과값을 다시 OpenAI API 응답 규격(JSON 형태)으로 포맷팅하여 클라이언트에게 전송합니다. 이 과정 덕분에 개발자는 내부 로직을 수정하지 않고도 백엔드 모델만 쉽게 교체할 수 있습니다.

    3. 직관적인 설치와 세팅 방법

    강력한 기능에 비해 설치 방법은 매우 간결합니다. Node.js 20 이상 환경이 구축되어 있다면 소스코드를 직접 클론하여 의존성을 설치하고 바로 실행할 수 있다.

    하지만 운영의 편의성을 고려한다면 도커(Docker) 기반의 배포를 적극 권장합니다. 라즈베리 파이 같은 ARM 아키텍처까지 지원하는 공식 멀티 아키텍처 이미지(ghcr.io/tashfeenahmed/freellmapi)를 제공하기 때문입니다. NAS나 개인용 홈 서버의 터미널에 아래와 같은 명령어 한 줄만 입력하면 그 즉시 서버가 구동된다.

    서버가 띄워지면, 각 LLM 제공자에서 발급받은 무료 API 키들을 환경 설정이나 대시보드(혹은 설정 파일)에 입력해 두기만 하면 준비는 끝납니다.

    – 설치법

    파이썬 환경이 구축되어 있어야 합니다.

    • 리포지토리 복제
    git clone https://github.com/tashfeenahmed/freellmapi.git
    cd freellmapi
    • 종속성 설치
    pip install -r requirements.txt

    4. 손쉬운 사용법과 AI 에이전트(Agent) 운영의 시너지

    기존에 OpenAI SDK나 LangChain 기반으로 코딩을 해두었다면, 코드를 통째로 갈아엎을 필요가 전혀 없습니다. 클라이언트 초기화 코드에서 base_url을 로컬에 띄운 FreeLLMAPI 서버 주소(예: http://localhost:8000/v1)로 살짝 바꿔주기만 하면 기존 로직이 그대로 동작합니다.

    특히 이 시스템은 AI 에이전트를 운영할 때 완벽한 시너지를 발휘합니다. 자율형 에이전트(AutoGPT 등)는 스스로 계획을 세우고, 검색하고, 코드를 짜느라 짧은 시간 안에 API를 무자비하게 호출합니다. 단일 무료 API로는 몇 분도 안 되어 Rate Limit에 걸려 에이전트가 멈춰버리지만, FreeLLMAPI의 페일오버 체인을 걸어두면 한 제공자의 한도를 다 쓰더라도 다음 제공자로 자연스럽게 넘어가며 24시간 내내 에이전트를 끊김 없이 굴릴 수 있죠.

    서버를 실행하고 클라이언트 코드에서 접속 경로(base_url)를 변경합니다.

    • 서버 실행
    python app.py --model [모델명/경로] --port 8000
    • 연결 코드 예시
    from openai import OpenAI
    
    client = OpenAI(
        base_url="http://localhost:8000/v1",
        api_key="local" # 로컬이므로 보안 키는 불필요
    )
    # 이후 표준 OpenAI 라이브러리 사용법과 동일
    • 기존 코드 연결하기
    from openai import OpenAI
    
    # 로컬 서버 주소로 변경하여 연결
    client = OpenAI(
        base_url="http://localhost:8000/v1",
        api_key="not-needed" # 로컬이므로 별도의 키는 필요하지 않습니다.
    )
    
    response = client.chat.completions.create(
        model="your-local-model",
        messages=[{"role": "user", "content": "로컬 LLM 서버 구축 성공!"}]
    )
    
    print(response.choices[0].message.content)

    5. API 끌어오기 vs 로컬 LLM 직접 구동, 승자는?

    그렇다면 외부 API를 프록시로 끌어오는 방식과 내 PC에서 Ollama나 llama.cpp를 이용해 로컬 LLM을 직접 구동하는 것은 어떤 차이가 있을까요? 각자의 목적에 따라 뚜렷한 장단점이 존재한다.

    1. 하드웨어 사양의 제약 극복 가장 큰 차이는 하드웨어 의존성입니다. 로컬 LLM은 수십~수백억 개의 매개변수를 직접 연산해야 하므로 막대한 VRAM을 갖춘 고성능 GPU가 필수적입니다. 반면 API 연동 방식은 텍스트를 던지고 결과만 받아오는 ‘통신’만 수행하면 됩니다. VRAM이 1MB도 없는 구형 사무용 랩톱이나 라즈베리 파이에서도 수천억 파라미터급의 최고급 모델을 순식간에 구동할 수 있다는 것이 API 프록시의 압도적 장점입니다.

    2. 오프라인 환경과 안정성 로컬 구동은 초기 하드웨어 투자 비용만 극복하면 인터넷이 완전히 끊긴 산속에서도 완벽하게 동작합니다. 반면 API 기반은 인터넷 연결 속도에 응답 속도가 좌우되며, 외부 서버 장애나 해당 기업의 무료 티어 정책이 변경되면 하루아침에 시스템이 먹통이 될 수 있는 불안정성을 내포하고 있죠.

    3. 프라이버시 및 데이터 보안 보안 측면에서는 로컬 LLM의 완승입니다. 사내의 민감한 기밀문서나 개인의 소스코드를 분석할 때, 데이터가 물리적인 내 PC 밖을 한 발짝도 나가지 않습니다. 하지만 FreeLLMAPI를 통해 외부 제공자에게 데이터를 보낼 경우, 16개 기업 각각의 이용 약관(TOS)에 따라 내 질문 데이터가 수집되거나 학습에 쓰일 위험이 존재합니다. 따라서 보안이 중요한 작업에는 로컬 LLM을, 방대한 일반 데이터 처리나 실험적 에이전트 운영에는 API 프록시를 사용하는 식의 하이브리드 전략이 필요합니다.

    구 분 내 용
    장 점비용 절감: API 호출 비용이 발생하지 않음.
    데이터 프라이버시: 데이터가 외부 서버로 나가지 않아 보안 우수.
    범용성: 기존 OpenAI 생태계(라이브러리/툴)와 완벽 호환.
    단 점하드웨어 의존성: 고성능 GPU/RAM 등 로컬 자원을 많이 소모함.
    관리 부담: 모델 업데이트 및 서버 최적화를 사용자가 직접 수행해야 함.
    성능 제한: 최신 클라우드 기반 초거대 모델에 비해 모델 규모가 작을 수 있음.

    결론적으로 FreeLLMAPI는 하드웨어의 한계에 부딪힌 수많은 1인 개발자와 연구자들에게 거대한 클라우드 인프라를 무료로 빌려 쓰는 듯한 경험을 선사하는 훌륭한 프로젝트입니다. 주말을 활용해 내 PC 한구석에 17억 토큰의 잠재력을 품은 AI 허브를 직접 세팅해 보는 것은 어떨까요?

  • ‘클릭 경제’의 해체와 인프라 전쟁: 순다 피차이가 선언한 에이전틱 제미나이 패러다임

    지난 5월 19일 개막한 Google I/O 2026의 여운이 쉽게 가시지 않고 있다. 기술의 진보를 실시간으로 목격하는 것은 언제나 짜릿한 일이지만, 올해 순다 피차이 구글 CEO의 기조연설과 미디어 간담회에서 나온 메시지는 단순한 기술 업데이트 수준을 넘어선 거대한 패러다임의 시프트(Shift)를 예고했기 때문이다.

    구글이 창업 이후 지난 25년 동안 인터넷 세상을 지배해 온 ‘검색창’과 ‘클릭 경제’의 해체를 공식화하고, 바야흐로 ‘에이전틱 제미나이(Agentic Gemini) 시대’로의 완전한 전환을 선언했다.

    sp-tokens-processed-chart.width-500.format-webp
    이게 다 돈이다..

    1. 25년 만의 검색창 개편: 클릭 경제에서 ‘토큰 경제’로

    이번 I/O 2026의 본질은 단순히 모델의 스펙 자랑에 있지 않다. 사용자가 매번 검색어를 입력하고, 나열된 링크를 직접 클릭하며 정보의 호환성이나 에러를 수동으로 필터링하던 시대가 저물고 있음을 뜻한다.

    • 검색의 종말과 실행의 시작: 이제 인공지능은 단순한 정보 답변을 넘어 사용자의 복잡한 문맥과 워크플로우를 이해하고 주체적으로 실행을 완료한다. 질문 한 번으로 멀티 에이전트가 가동되어 계획 수립부터 결과 도출까지 끝마친다.
    • 인프라 수준의 풀스택 접근: 구글은 이를 위해 자체 설계한 AI 반도체 칩부터 고도화된 기반 인프라, 제미나이 3.5 모델 제품군에 이르는 전면적인 혁신을 밀어붙였다.

    사용자가 마주하는 디지털 작업 환경의 수많은 버그와 비효율이라는 장애물을 에이전트라는 초강력 시스템을 통해 완전히 매끄럽게 정리하겠다는 의지를 보인 셈이다.

    2. 제미나이 3.5 플래시와 인프라의 거대한 병목

    순다 피차이 CEO는 이번 행사에서 Gemini 3.5 Flash를 구글 생태계 전반을 지탱할 핵심 모델로 정의했다. 4배 이상 빨라진 가성비와 속도로 복잡한 다단계 워크플로우를 자동화하겠다는 구상이다. 하지만 이 화려한 기술의 확산 뒤에는 거대한 인프라 전쟁이 숨어 있다.

    gemini flash
    이번에 새로 출시 된 flash

    간담회에서 피차이 CEO는 “최근 2년 동안 그 전 20년간 쌓아온 것과 맞먹는 규모의 연산 인프라를 새로 구축했다”고 밝혔다. 알고리즘의 고도화를 넘어, 이제 AI 비즈니스의 진짜 병목이 ‘데이터센터, 칩, 그리고 이를 가동할 전력’으로 이동했음을 고백한 것이다. 구글이 차세대 에너지원 확보와 전력 인프라 구축에 사활을 거는 이유도 바로 여기에 있다.

    3. 완전 자동화 시대의 새로운 병목: 코딩에서 거버넌스로

    기술이 이토록 비용 효율적으로 우리 일상 전반에 깔리게 되면서, 인간 개발자와 운영자가 고민해야 할 영역의 패러다임도 완전히 뒤바뀌었다.

    이제 단순한 코드 작성(Coding)이나 단발성 기능 구현 자체는 더 이상 병목이 아니다. 구글은 지메일, 크롬, 안드로이드 OS 전반을 AI 에이전트를 호출하고 조율하는 관문으로 탈바꿈시켰다. 앞으로의 기술 생태계에서 가장 중요한 핵심 경쟁력은 여러 에이전트를 통제하고 시스템 설계를 꼼꼼하게 구축하는 영역으로 이동하게 된다.

    기존의 작업 방식에이전틱 전환 이후의 작업
    구문 오류(Syntax Error) 수정 및 직접 디버깅 복잡한 비즈니스 로직에 맞는 명확한 문맥(Context) 제공
    수동 빌드, 테스트 인프라 구축, 환경 세팅 AI 에이전트의 런타임 관찰 및 정교한 접근 권한 제어
    라이브러리 버전 호환성 체크 및 소스코드 작성 아키텍처 설계, 조직 내 자산의 체계적인 문서화

    결국 인프라 수준의 완벽한 토양이 세팅되었을 때, 그 안에서 신뢰할 수 있는 구동 환경을 만들고 장기적인 시스템 방향성을 관리하는 거버넌스는 온전히 인간의 몫으로 남는다


    인공지능이 정답을 순식간에 내놓고 다단계 실행 및 배포까지 마무리 짓는 세상이다. 완벽한 결과물을 손쉽게 손에 쥐는 시대가 되었기에, 우리는 오히려 역설적으로 “무엇을, 왜 만들어야 하는가”라는 본질적인 가치와 철학에 집중해야 한다.

    구글 I/O 2026이 보여준 풍경은 단순히 기술의 화려한 연출에 있지 않다. 그것은 인간이 단순 반복적인 작업과 에러 수정의 시간에서 벗어나, 더 멀리 세상을 바라보고 창의적인 기획과 대형 아키텍처 설계를 주도할 수 있도록 새로운 문을 열어준 사건이다.