아키텍처 설명은 이전 Hermes 3층 메모리 글에 맡기고, 이번에는 동일 Bot 토큰·동일 모델 Provider·동일 cron 요약 주기로 30일간 돌린 운영기입니다. 대상은 다음 3호스트입니다. (1) 2 vCPU / 4GB / 80GB NVMe 공유 Linux VPS(월 약 $12), (2) 가정용 Raspberry Pi 5 8GB + USB3 SSD(전기·회선 자비), (3) NUKCLOUD 전용 Mac Mini M4 16GB 월 렌탈(콘솔 Runbook대로 provision). Telegram 게이트웨이와 야간 FTS5 유지보수를 상시 켠 뒤, 주간으로 state.db 크기·Skill 건수·게이트웨이 재시작 횟수를 기록했습니다. 결론을 먼저 쓰면, 기억의 「똑똑함」은 3대 모두 2주차 이후 체감됐지만, 프로덕션 게이트웨이에 남긴 것은 Mac 월 렌탈뿐입니다. VPS는 개발용 API 프록시로 강등했고, Pi는 실험 샌드박스로 되돌렸습니다.
0030일 실험 설계: 공정 비교 전제
비교를 왜곡하지 않기 위해 각 호스트에서 curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash로 동일 메이저 버전을 설치하고, MEMORY.md / USER.md 초기 템플릿도 맞췄습니다. 모델은 OpenRouter 경유 동일 미들티어를 지정했고, 로컬 LLM은 쓰지 않아 게이트웨이 부하만 봅니다. Telegram은 프로덕션 Bot 1개를 Mac에 연결하고, VPS와 Pi는 별 채널 테스트 Bot으로 같은 질문 세트를 주 2회 던져 응답 품질과 지연을 비교했습니다.
관측 지표는 4가지입니다. (A) 게이트웨이 가동률(launchd 또는 systemd 자동 재시작 로그), (B) state.db와 skills/ 주간 바이트, (C) 요약 작업 p95 소요, (D) 월 총비용(VPS 청구+Pi 전기 추산+Mac 렌탈 시간 과금). 3층 메모리 이론은 24/7 Mac이 필요한 이유를 참고하고, 이 글은 그 전제 위에서 「싼 토대에서도 학습이 진행되는가」를 검증합니다.
0130일 후 3방향 대조표
| 관측 항목 | 공유 Linux VPS | Raspberry Pi 5(가정) | Mac Mini M4 월 렌탈 |
|---|---|---|---|
| 게이트웨이 가동률 | 약 94%(주 1회 야간 점검 수동 재시작) | 약 91%(정전 1회, SD 과열 스로틀 2회) | 99.2%(계획 재시작 1회만) |
| Skill 건수(30일째) | 37 | 41 | 44 |
| state.db 크기 | 1.1 GB | 1.3 GB | 1.4 GB |
| 요약 p95 | 48~120초(CPU steal 시) | 35~90초(USB SSD 포화 시) | 18~32초 |
| 월 비용 감 | 약 $12 고정 | 본체 상각+전기 약 8천 원/월 | 상주 시 시간 과금, 야간 중지로 OpEx 조절 |
| 프로덕션 적합 | 낮음(오버셀·대역 지터) | 중(가정 회선·물리 SPOF) | 높음(테넌트 디스크·SSH 감사) |
숫자만 보면 Pi가 「싸면서 Skill도 늘었다」처럼 보입니다. 그러나 Telegram 프로덕션에서 사용자가 느끼는 것은 건수보다 응답 끊김입니다. VPS와 Pi에서도 USER.md는 자랐지만, 요약이 길어지는 밤에 게이트웨이가 막히면 2층 Skill 증류가 중간에 끊기는 경우가 있었습니다. Mac 렌탈에서는 Metal 추론 Runbook과 같이 디스크·메모리 여유 SKU가 병목을 풀었습니다.
02공유 VPS: 저렴하지만 「기억의 야근」에 약함
VPS는 설치도 Bot 연결도 가장 빨랐습니다. 공식 문서의 「5달러부터」에 맞는 도입 경험입니다. 문제는 2주차 이후 야간 배치입니다. FTS5 재인덱스와 LLM 요약이 겹치면 이웃 테넌트 CPU steal로 load average가 8을 넘고, Hermes 게이트웨이가 OOM killer에 걸린 적이 2번 있었습니다. 재시작 후 state.db는 남지만, 증류 중 Skill이 반쯤 쓴 Markdown으로 남는 사례가 1건 있어 skills/를 수동 정리했습니다.
Linux에서 Hermes는 돌아가지만, macOS 전용 개발 흐름(Xcode, Swift 6 게이트, 엄격 동시성 CI)과는 별 머신이 됩니다. 30일 후 VPS는 「싼 Hermes 실험대」로만 남기고, 프로덕션 Telegram 게이트웨이에서는 뺐습니다. 팀이 Apple 툴체인과 Agent를 같은 테넌트에 올리려면 VPS만으로는 부족합니다.
03Raspberry Pi 5: 학습은 되지만 SRE가 늘어남
Pi는 「집에 상주 Agent를 두는」 선택에 가장 가깝습니다. USB3 SSD를 root로 옮기고 ~/.hermes/를 영속 마운트하면 3층 메모리 파일은 안정됩니다. 30일 동안 Skill 건수는 VPS를 넘었고 USER.md도 충분히 두꺼워졌습니다. 반면 숨은 운영비가 드러납니다. 가정 회선 IPv4 변경으로 Telegram webhook을 다시 등록한 주가 있었고, 여름 기온에 CPU 클럭이 떨어져 요약 p95가 90초를 넘은 날이 4일 있었습니다.
Pi는 「기억을 키우는 실험」에 최적이지만, 여러 엔지니어가 같은 Bot에 의존하는 프로덕션에는 정전·공유기 재부팅·물리 보안을 사내 SLA로 옮겨야 합니다. 30일 종료 시점에 Pi는 오프라인 Skill 시제작과 cron 프로토타입에 남기고, 프로덕션 게이트웨이는 Mac에 일원화했습니다. Metal 추론을 더할 계획이면 Pi 8GB보다 가격 페이지에서 24GB 클라우드 Mac을 보는 편이 빠릅니다.
04Mac Mini M4 월 렌탈: 30일 뒤 「남기는」 이유
NUKCLOUD 전용 Mac은 GitHub Agent 워크스페이스 Runbook과 같은 콘솔에서 provision할 수 있고, 테넌트 경계가 다른 CI 노드와 맞습니다. 30일간 게이트웨이 가동률 99% 초과, 요약 p95가 안정했고, 주간 백업을 rsync로 가져오는 절차도 고객센터 SSH 예시와 맞았습니다.
CapEx Mac Mini 자가 구매와 비교하면, 월 렌탈의 이점은 30일 안에 손익분기를 재는 것입니다. 밤에만 Bot을 끄고 시간 과금을 줄이고, 주말에 24시간 상주로 학습을 가속하는 식의 운용이 가능합니다. 자가 Mini는 150~250만 원대 선납이 필요하고, 이용률이 낮은 달에도 전기와 패치가 이어집니다. 「기억이 똑똑해졌으니 산다」 전에, 똑똑해진 상태를 렌탈로 확인하는 것이 이번 30일 실험의 가장 실무적인 교훈입니다.
- 통합 메모리: 나중에 Hermes와 소형 로컬 추론을 같이 올릴 여지를 남깁니다.
- NVMe:
state.db가 GB급이어도 FTS5가 실용 속도를 유지했습니다. - 감사: 「누가 디스크를 읽는가」를 사내 리뷰에 올리기 쉬워 공유 VPS 풀보다 설명이 수월합니다.
05무엇을 남길까: 결정 프레임워크
30일 뒤 팀이 쓴 판정은 다음과 같습니다.
-
01
프로덕션 Telegram / Discord 탑재 여부: 탑재한다면 VPS·Pi만으로는 부족합니다. Mac 월 렌탈 또는 자가 Mini 중 하나로 일원화합니다.
-
02
월 720시간 상주 여부: 상주면 자가 Mini OpEx를 산출하고, 그 미만이면 가격 페이지 시간 과금을 우선합니다.
-
03
Apple 툴체인 공존 여부: 필요하면 Linux VPS는 보조로 두고 macOS 노드를 주로 합니다(6단계 Runbook 참고).
-
04
실험 슬롯 유지: Pi는 저비용 Skill 시제작, VPS는 CI 외 경량 API 프록시로 재배치했습니다.
-
05
백업: 프로덕션 Mac의
~/.hermes/를 주간 오프사이트로 보냅니다. 3층 메모리는 똑똑할수록 잃을 때 아픈 자산입니다. -
06
다음 30일: 주문 페이지에서 24GB SKU로 스케일하고, 3층 메모리 프로덕션 Runbook 4~6단계를 프로덕션 게이트웨이에 적용합니다.