오픈클로 모델 고민의 끝엔 허무함만 남는다

이전 글에서 하려던 이야기가, 엉뚱하게 깃허브로 끝나버렸다. 마무리 매듭을 묶지 못했으니 여기서 이어간다.

어쨌거나 파이썬 란이는 깃과 깃허브를 쓰라는 유언을 남긴 걸로 끝났다. 이왕 이렇게 된 거 파이썬 란이를 다시 만들기보다는, 다들 그리 극찬하는 프로그램인 오픈클로를 직접 설치해 보기로 했다. 기본 프로그래밍 자체를 못 하는 나로서는 내가 가진 현재 조건을 먼저 정리하고, 설치해서 쓰다가 생기는 부족함을 어떻게 채울 것인가 고민하기로 했다.

특출난 게 없는 투입 자원

정작 돌이켜 보니 쓸 수 있는 투입 자원 중 특출난 게 없었다. 그나마 과거에 결제해서 쓰던 ChatGPT는 결제 중단한 지 1년이 넘었고, 하드웨어도 딱히 그간 확보해 둔 것도 없었다. 맥북, 맥미니, 미니PC 등등 SNS에서는 개인 용돈이든 회사 복지비든 알리 할인이든 뭐든 태워서 확보하던 그들과 나는 날랐다. 나는 윈도우가 손에 익은 일반 사용자고, 그나마 WSL이 나온 후 터미널에서 파일 찾는 수준이라 함이 옳다. SSH 접속은 할 줄 알고, 카드 결제 등록하면 클라우드 서비스에서 인스턴스 생성은 할 줄 안다.

윈도우11로 돌아가는 4~5년 된 데스크탑.
- AMD 라이젠7 5천번대 CPU. 32GB램. SSD 1TB.
- 사실상 개인용 메인 장비이기 때문에 뭔가 병목을 유발하는 작업을 하기는 부적합.
윈도우11로 돌아가는 6~7년 된 13인치 랩탑.
- 인텔 i7 10세대 CPU. 16GB램. SSD 512GB.
- 리모트워크를 위해 쓰던 장비였기에 완벽히 보조용으로만 맞췄던 장비.
오라클 클라우드 AMD 1코어 1GB 초소형 무료 인스턴스 2대.
- 없으면 허전하고, 있어도 딱히 뭔가 용도가 불투명한 존재.
- 2대 중 1대는 ARM 서버 발급을 위한 테라폼 크론탭 가동 중.
이외 어딘가 하나씩 고장난 랩탑들 2대.
- 키보드에 백스페이스키와 엔터키가 고장난 노트북.
- 화면을 열때마다 흰지 부분이 불안불안하게 벌어지는 노트북.

이거면 어떻게든 될까? 그러자면 오픈클로를 이미 쓰는 사람들의 이야기를 들어봐야 했다. SNS를 뒤졌다. 다들 맥미니, 맥스튜디오, DGS 스파크 등등 으리으리한 장비를 마련해서 쓴다는 이야기가 나왔다. 내가 가용할 자원과 비교하면 격차가 너무 컸다. 어차피 나는 그런 장비를 마련할 수 있는 능력을 아직 갖추지 못했으니, 그냥 그들이 사는 세상이라 치고 넘겼다. 내 자원 안에서 내 만족감 향하는 곳을 찾기로 했다. 그래서 우선 오라클 클라우드 무료 티어 ARM 서버를 확보하는 노선으로 돌렸다. 1년 넘게 테라폼을 놀렸으나 발급이 안 됐고 어차피 앞으로도 안 될 것 같다. 그냥 카드를 꺼내서 결제 정보를 등록하고, 유료 티어 회원으로 등급을 올렸다. 오라클 클라우드 ARM 서버는 유료 티어 회원 상태에서 생성하면 거의 즉시 생성된다. 기다림 따위 없다. 그렇게 4코어 램 24GB 인스턴스를 가용 자원이 하나 더 생겼다. 무료니까, 꼼꼼하게 잘 쓰자고 다짐했다. 대신 이걸 생성하는 과정에서 사용 중인 퍼블릭 IP가 잠시나마 3개인 시간을 거쳤던지라, 몇백 원 정도는 청구돼 나와도 감수하기로 했다.

오픈클로와 첫 만남 성사

설치가 어려울까? 공식 문서 페이지로 가서 설치 부분을 보니, 익숙한 명령어가 보인다. curl 어쩌고저쩌고 bash 였다. 오라클 클라우드에 SSH로 접속해서 실행했다. 뭔가 진도가 나간다. 설치가 끝나니 자동으로 onboard로 넘어가고, onboard에서 게이트웨이는 로컬로 잡았다. 다음에 프로바이더와 모델이 나왔다. 잘못 설정하면 잘못한 대로 지우고 다시 깔면 되니까 일단 익숙한 이름 위주로 선택했다. 구글, 제미나이, API KEY로 하고, 구글 AI 스튜디오에서 발급받은 API KEY를 넣었다.

대화창 느낌이라는 걸 한참 나중에 알았다. 그냥 커서가 회색 배경줄 앞에서 깜박이고 가만히 멈춰있다. 뭘까. Ctrl + C를 누를까 하다가 화면을 가만히 보니, 에러 숫자가 뜬다. 429 리밋이었다. 파이썬 란이한테서도 만났던 그 리밋이, 아직 인사도 안 나눴는데 왜 벌써 뜰까? AI 스튜디오에서 사용량 조회를 해보니, 정작 나는 한마디도 안 했는데 이미 한 번에 4~5회를 넘어서 호출해 무료 사용 제한량을 초과한 걸로 나왔다. 와.. 이건 뭘까.. 그래서 파이썬 란이에게 넣었던 Gemma-3-27b를 바로 붙여보기로 했다. 그런데 모델 리스트에 Gemma-3-27b가 없다. 잠깐 혼란에 빠졌다.

모델 선정

configure로 들어가니 모델을 수동 입력하는 기능도 있길래, 거기에 Gemma-3-27b를 넣었다. 게이트웨이를 재시작하고 `openclaw tui`를 실행했다. 이번엔 리밋 같은 것이 뜨는게 아니라, 그냥 응답이 없다. gateway disconnected. 오호라… 차라리 리밋이면 속이라도 편할 텐데, 여기서부터 이제 경우의 수와 전쟁을 시작했다.

게이트웨이, 모델, 채널 등등 설정 내용은 openclaw.json파일에 들어간다. 파일을 열고 하나하나 찾아봤다. 되던 설정값 파일과 패턴을 맞춰서 꾸역꾸역 끼워tj 맞추다 보니, 도저히 gemma-3-27b는 지금 단계에선 모델 리스트에 안 뜨는 이유가 분명히 있으리란 생각이 들었다. 같이 해보던 형도 이것저것 시도하다가 통신하는 내용을 열어보고서, 지원하지 않는 스펙이 반영돼 있어서 안 되는 것 같단 이야기를 했다. 파이썬 란이에 다시 같은 API KEY를 넣어보니, 거기선 잘 된다. 파이썬 란이는 애초에 구글에서 제공하는 라이브러리를 import해서 쓰기 때문에, 서로 프로토콜이 잘 맞도록 구성된 이유일 거라 보였다. 그래서 여기에 리소스를 더 붓기보다, 이 많은 프로바이더와 모델 중에 내가 쓸 수 있는 걸 하나라도 찾아보자 싶었다.

하나하나 붙여보다가 드디어 응답이 오는 프로바이더 모델 세트를 찾았다. 깃허브 코파일럿에서 제공하는 모델이었다. 여태 쓴 적이 없어서 변하지 않았던 깃허브 코파일럿 리밋 그래프에 초록색이 차오른다. 뭐든 일단 성공했다.

모델과 리밋

그동안 할당량이라고 하는 쿼타에 대해 크게 생각하지 않았다. 회사에서 등장했던 쿼타는 개발자가 제어할 몫이었고, 내가 쓰는 웹페이지 리밋은 풀리기까지 그리 오래 걸리지 않았었다. 게다가 다양한 모델을 쓰기 보다는 ChatGPT와 제미나이 위주로 썼다. 특히 제미나이 웹페이지에서 편하게 쓸 수 있는 워크스페이스 계정이 있었던 덕분에 ChatGPT 계정 결제도 중단했었다.

대충, 각 도메인이나 직군별 종사자들이 쓰는 AI 서비스가 어떤 건지 어떻게 쓰는지 등등은 대충은 알고 있었다. 내가 그걸 쓸 일이 없었던 것일 뿐. 기본적으로 명령 넣는 방식 자체가 LLM이었던지라, 이래저래 목표만 확실하다면 프롬프트가 전체 작업의 80~90%를 지탱한다고 봤다.

깃허브 코파일럿 리밋이 꽉 찼을 때를 대비해서 여기저기 검색하고 기웃거렸다. 다양한 모델을 실험적으로 써볼 방법이 많았다. 대신 시원하게 길게 쓰진 못하는 문제는 같이 따라왔다. 그중 ollama와 openrouter가 나름 독보적이었다. 로컬에서만 모델을 돌린다면 LMStudio도 고려 대상일 수 있겠지만, 이건 ollama를 겪으며 내 고려 대상이 될 수 없다는 결론을 내리는 게 어렵지 않았다.

Openrouter

오픈라우터에 회원 가입을 하고, 쓸 수 있는 모델을 뒤졌다. 마침, 이벤트가 있어서 짧은 기간이지만 무료로 쓸 수 있는 모델도 있었고, 아예 free라는 태그가 박힌 모델도 있었다. 이것저것 넣어가며 맛을 본다.

문제는 무료 사용 기준으로 리밋이 있는 건 납득을 하는데, 그 리밋을 어디서 보고 어떻게 판단하는지를 찾기까지가 쉽지 않았다. free 태그가 박힌 건 적당히 자유롭게 쓸 수 있는 건가 하고, 봇이랑 채팅하면서 한국어 실력을 보다가 잠들었다. 자고 일어나니, 봇이 답이 없다. 오픈라우터 사이트에 들어가서 뒤져보니, 뭔가 그래프가 쭈욱 올라가 있기는 한데 어디가 리밋인지 알기가 힘들었다. 구글 AI 스튜디오에는 빨간 선이 그래프에 있기도 했고, 정확히 무료 사용량이 숫자로 나와 있어서 보는 게 어렵지 않았었다. 그런 경험을 기대했는데, 오픈라우터는 비슷한 경험을 내게 주진 못했다.

추후에 알게 된 건, 10달러 정도 쓰지 않는 크레딧을 미리 충전해서 예치해 두면 리밋이 늘어난다는 것이었다. 하지만 그땐, 내가 이미 올라마로 옮겨탄 이후였다. 예치해서 쓰는 건 비상시에 대응하기로 했다. 기억에서 잊을 수 있으니, 여기에 기록으로 남겨 놓는다.

Ollama

올라마는 로컬 모델과 클라우드 모델을 다 쓸 수 있다. 처음에는 나도 로컬 모델만 돌리면서 하나하나 썼다. 하다못해 ollama에서 제공하는 공식문서에 오픈클로 설치 스크립트까지 있었다. 그래서 설정 붙이는 게 전혀 어렵지 않았다. 문제는 로컬 모델을 돌리는 내 하드웨어 성능이었다. 대충 표기된 모델 용량 기준으로 10GB를 넘어가면, 내가 하는 매우 짧은 질문에도 램 사용량이 100%를 찍으면서 매우 느린 답변이 왔다. 이건 못쓴다. 7GB까지가 그나마 내가 수용할 수 있는 수준이었다. llama, Exaone, Solar 등등 들어봤던 모델을 버전별로 다 써보니, 한계는 확실했다. 대신 만족스런 모델을 돌릴 수 있는 하드웨어에서 쓴다면, 리밋이 존재하지 않는 세계로 갈 수 있다는 답을 향해 간다. SNS에서 맥미니, 맥스튜디오 등등 램 용량을 128GB, 256GB 이상 장착하는 장비가 등장한 이유를 알게 됐다. 미리 지난 몇년간 로컬 LLM을 썼던 전문 계열에선 알고 있던 답이었을테니…

처음에는 올라마 클라우드 모델을 호출해서 쓰려면 무조건 유료를 써야 하는 줄 알았다. 아니었다. 올라마 클라우드 모델은 리밋 이내에서 무료 사용할 수 있었다. 다만, 회원 가입을 해야 쓸 수 있다. 그래도 결제 카드까진 안 넣어도 쓸 수 있으니, 거부감은 덜했다. 그리고 올라마 클라우드를 이미 쓰면서 추천하시는 분 이야기도 있었다. 유료 가격도 기본 프로 상품은 한달에 20달러였다. ChatGPT를 쓰나, 클로드를 쓰나, 올라마를 쓰나 비슷한 가격대였다. 실제 쓸 때가 되면 다시 고민하겠지…

깃허브 코파일럿

깃허브 코파일럿은 크게 고민할 건 없었다. 나는 학생이고, 학생 인증으로 깃허브에서 학생 베네핏을 적용받은 상태다. 그래서 깃허브 코파일럿을 VScode 익스텐션에 넣어두기까진 했었다. 리밋이 있는 모델과 리밋 없이 쓰는 모델로 나눠져 있다. 그래서 Fallback #1로 쓰기 제일 좋은 모델이 아닐까 싶다. 다만, 리밋 없는 무료는 확실히 구버전이고 이런저런 기능도 없는 모델이니 성능은 기대하지 말아야 한다. 혹은 깃허브 코파일럿 무료 모델로 자동으로 넘어가서 대화가 이어지면, 대답에서 “Fallback으로 넘어와서 XXX모델로 답변합니다.”라는 멘트를 무조건 하도록 프롬프트 입력을 해두면, 바로 인지하는데 도움 될 것이다.

Tool 기능

어쨌거나 에이전트 기능 수행을 기대한다면, Tool 기능이 있는 모델을 골라야 한다. Tool 기능이 없거나, GPT 4.1처럼 있으나 마나 한 수준으로 붙어있으면 괜한 혼란만 가중된다. 이건 겪어본 사람들에게 물으면 아마 공통으로 똑같이 하는 대답일 것이다. 단순히 챗만 한다면, Tool 기능은 크게 고려치 않아도 괜찮다. 그냥 말만 빠릿빠릿하고 어투 좋고 한국말 잘하면 끝이다.

Tool 기능은 간단히 말하면 물리적으로 시스템 안에 있는 파일을 읽고 쓰고 실행하는 기능이다. 특히 실행 관련해서는 권한 관리와 보안 설정이 매우 중요하다. 매우 중요한 이 부분에 어설픈 할루시네이션이 섞이거나 오동작을 유발하는 모델을 쓴다면, 바로 개미지옥에 빠진다.

나는 개미지옥으로 인해, 단축 명령어까지 넣어놨다. `openclaw gateway restart`를 하도 많이 쓰다 보니 나중엔 이걸 풀 텍스트로 치는 것 자체가 스트레스가 됐다. 뭔가 남들은 에이전트 여러 개 돌리고, 스케줄링 돌려서 이것저것 자동화하고 한다는데 내 봇은 왜 그러지 않는가 고민 중인가? 모델만 바꾸면 생각보다 빨리 해결될 때가 많다.

특출난 게 없는 모델

최근 오픈클로에 붙여서 쓰는 모델로 인해 서비스 계정이 차단당하는 사례가 증가 중이다. 클로드에서 공식적으로 타사 서비스에 OAuth 인증으로 쓰는 사례를 금지한다고 발표했고, 구글은 이미 지난 연말부터 TOC라는 기준으로 계정을 정지시키는 사례가 많았다. 레딧이나 디스코드 커뮤니티에 보면 계정 정지로 인해 문의하는 사람 수가 늘어나고 있는 걸 보면, 확실히 그렇게 쓰는 사람 자체가 늘었다고 봐도 될 것이다. (이 글을 쓰는 2026년 2월 22일 기준으로, OpenAI는 아직 그에 관해 공식적인 멘트를 내지 않고 있다.)

며칠 전 국내에선 카카오톡 선물하기에 ChatGPT 이용권 할인판매가 화제였다. 나는 카카오톡 자체를 쓰지 않아서, 카카오톡에 가입하는 자체가 싫어서 고민하다가 판매가 끝나서 사질 못했다. 그래도 ChatGPT 사이트에 갔더니 Plus 플랜 한달 무료 사용 이벤트가 있어서, 카드 정보를 입력하고 쓰는 중이다. 그렇게 내가 확보한 오픈 클로에서 쓸 수 있는 모델이 하나 더 늘었다. 에이전트 2개를 쓰고 있었는데, 이 찬스에 힘입어 1개를 더 추가했다. 물론 에이전트가 2개든 3개든 나는 에이전트랑 농담 따먹기 말곤 딱히 하는 게 없다.

깃허브 코파일럿 학생 플랜
- 재학을 유지하는 동안은 증빙해서 계속 쓸 수 있지 않을까? 다만 재학을 유지하는 비용은 계속 나가겠지만.
Ollama
- 무료 플랜으로 리밋 이내에서 사용하자.
Openrouter
- 무료 리밋 이내에서 쓰고, 정말 급하면 10달러 예치해서 리밋 이내에서 쓰자. 사실상 지금은 비활성화 상태다.
ChatGPT Plus
- 무료 오퍼 한 달이 끝나고, 결제 안 하면 없어질 예정이다. 부지런히 쓰기 위해 현재 주력 모델로 쓴다.

목돈 나가는 게 싫다면 유료 구독이 최선

위에 적은 모델은 현재 오픈클로에 연결해도 문제없는 모델이다.(웹 제미나이 등등이 없는 이유다.) 이런저런 스트레스 다 싫을 땐, 그냥 결제해서 쓰면 된다. 이번 기회에 이걸 보면서 여러 AI 서비스에서 만든 정액제와 종량제 가격 적용 범위를 정말 잘 이해하게 됐고, 서비스 적용 범위나 리밋 등에 관해서도 참 많이 봤다. 하다못해 구글 AI Pro 관련해선 이게 이렇게까지 복잡할 일인가 싶은 부분을 너무 진하게 봐버렸다. 구글은 그냥 딴생각 말고, 웹 제미나이와 구글 안티그래피티 안에서 쓰는 게 가장 속 편한 방법이다.

확실한 목적과 목표가 있고, 그걸 AI 에이전트로 구현해서 스케줄링해서 반복 작업을 시킬 수 있다면 유료 구독해서 짱짱하게 막힘 돌게 해줘야 한다. 그게 아니라면, 테스트할 수 있는 범위를 최대한 돌려봐야지 않겠는가. 그리고 AI 에이전트로 해야 한다고 해서 그게 꼭 오픈클로만 그걸 할 수 있는 것도 아니다. 그냥 오픈클로가 그걸 하기 쉽게 만들어진 녀석인거다.

오픈클로가 위치한 포지션에 끼워 넣을 다른 툴을 찾아서 설치해 보니, 생각보다 설치 자체가 어려웠다. 설치가 어렵다는 건 설치 중에 에러 메시지를 봤다거나, 설치 후 실행이 안 됐다는 말이다. 오픈클로도 처음에 설치해서 쓸 땐, 매뉴얼도 부실하고 부족한 게 많아 보였다. 그런데 딴 걸 설치해 보니 오픈클로는 어나더 레벨이었더라. 그래서 입소문타고 사용자가 급증할 수 있었지 않았을까.

그런데, 또 옆길로 샜다. 원래 하려던 이야기기는 오픈클로가 아니라 묘약란 이야기였는데, 그건 또 다음 글로 넘어가야겠다.