Hermes Agent Review 2026: AI Agent tự cải thiện và thực sự nhớ bạn
Phân tích chuyên sâu Hermes Agent 2026: AI Agent tự cải thiện và thực sự nhớ về bạn Chắc hẳn bạn đã thấy Hermes Agent trên GitHub Trending — hơn 73,000 sao và...
Utilo Team
4/15/2026

Phân tích chuyên sâu Hermes Agent 2026: AI Agent tự cải thiện và thực sự nhớ về bạn
Chắc hẳn bạn đã thấy Hermes Agent trên GitHub Trending — hơn 73,000 sao và đang tăng rất nhanh. Được xây dựng bởi Nous Research (phòng lab đứng sau các dòng model Hermes và Nomos), đây là một AI agent mã nguồn mở chạy trên phần cứng của riêng bạn. Không phải là một wrapper cho chatbot. Không phải là một plugin IDE. Đây là một agent tự hành hoàn chỉnh với memory, scheduling, tool use, và một learning loop giúp nó trở nên tốt hơn khi hoạt động càng lâu.
Đây không phải là bài tóm tắt thông cáo báo chí. Đây là một bài phân tích chuyên sâu thực tế: Hermes thực sự làm gì, cách thiết lập nó, cái gì hoạt động tốt, cái gì không, và liệu nó có đáng để bạn dành thời gian hay không. Mỗi tính năng được mô tả ở đây đều đi kèm với một kịch bản sử dụng thực tế mà bạn có thể thử ngay hôm nay.
Hermes Agent thực sự là gì
Hermes Agent là một AI agent tự host, chạy trên server của bạn (hoặc laptop, hoặc một VPS 5 đô) và nói chuyện với bạn qua terminal, Telegram, Discord, Slack, WhatsApp, Signal — hơn 15 nền tảng từ một gateway process duy nhất. Nó sử dụng bất kỳ LLM nào bạn chỉ định: OpenAI, Anthropic, DeepSeek, Nous Portal, OpenRouter với hơn 200 model, hoặc endpoint local của riêng bạn.
Điểm khác biệt của nó so với "một agent framework nào đó khác": nó có một vòng lặp học tập khép kín (closed learning loop). Nó ghi nhớ mọi thứ qua các session, tạo ra các skill tái sử dụng được từ những nhiệm vụ phức tạp, cải thiện những skill đó trong quá trình sử dụng, và xây dựng một profile về bạn theo thời gian. Hầu hết các agent đều bắt đầu lại từ đầu mỗi cuộc trò chuyện. Hermes thì tích lũy context.
Nó có giấy phép MIT, điều này quan trọng nếu bạn định xây dựng dựa trên nó.
Những con số chính:
- Hơn 73,600 sao GitHub (tính đến tháng 4 năm 2026)
- 647 skill trên 4 registry (79 built-in, 47 optional, 521 do cộng đồng đóng góp)
- Hơn 15 nền tảng nhắn tin được hỗ trợ từ một gateway
- 6 terminal backend: local, Docker, SSH, Daytona, Singularity, Modal
- Yêu cầu context tối thiểu: 64K token (các model dưới mức này sẽ bị từ chối khi khởi động)
Cài đặt: 60 giây, không đùa đâu
# Cài đặt bằng một dòng lệnh — Linux, macOS, WSL2, thậm chí cả Android qua Termux
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
# Tải lại shell của bạn
source ~/.bashrc # hoặc: source ~/.zshrc
# Bắt đầu trò chuyện
hermes
Trình cài đặt xử lý mọi thứ: Python 3.11 (qua uv, không cần sudo), Node.js v22, ripgrep, ffmpeg. Yêu cầu duy nhất là phải có git.
Sau khi cài đặt, bạn sẽ có một bộ lệnh CLI bao quát hầu hết các cấu hình:
hermes model # Chọn nhà cung cấp LLM một cách tương tác
hermes tools # Bật/tắt các nhóm tool
hermes setup # Trình hướng dẫn cài đặt đầy đủ (làm mọi thứ cùng lúc)
hermes gateway # Khởi động gateway nhắn tin
hermes doctor # Chẩn đoán sự cố
hermes update # Cập nhật lên phiên bản mới nhất
Cũng hoạt động trên Android. Termux có một đường dẫn cài đặt riêng với một gói extra .[termux] được tuyển chọn để bỏ qua các dependency về giọng nói không tương thích với Android. Bạn có thể thực sự chạy một AI agent ngay từ điện thoại của mình.
Chọn nhà cung cấp Model
Hermes không khóa bạn vào bất kỳ nhà cung cấp nào. Chạy hermes model và chọn từ danh sách:
| Provider | Mô tả | Phương thức xác thực |
|---|---|---|
| Nous Portal | Subscription, zero-config | Đăng nhập OAuth |
| OpenAI Codex | ChatGPT OAuth, các model Codex | Xác thực device code |
| Anthropic | Các model Claude trực tiếp | Xác thực Claude Code hoặc API key |
| OpenRouter | Hơn 200 model, multi-provider | API key |
| DeepSeek | API trực tiếp | API key |
| GitHub Copilot | GPT-5.x, Claude, Gemini qua Copilot | OAuth |
| Hugging Face | Hơn 20 model mã nguồn mở | HF_TOKEN |
| Custom Endpoint | VLLM, SGLang, Ollama, bất kỳ endpoint nào tương thích OpenAI | Base URL + key |
Cùng với: Z.AI/GLM, Kimi/Moonshot, MiniMax, Alibaba Cloud/DashScope, Arcee AI, và nhiều hơn nữa.
Quy tắc 64K: Hermes yêu cầu ít nhất 64,000 token context. Các model có ít hơn sẽ bị từ chối khi khởi động. Điều này hợp lý — các quy trình công việc gọi nhiều tool (multi-step tool-calling workflows) ngốn context rất nhanh, và một window nhỏ có nghĩa là agent sẽ mất dấu những gì nó đang làm giữa chừng một tác vụ. Nếu bạn đang chạy một model local, hãy đặt --ctx-size 65536 hoặc cao hơn.
Chuyển đổi nhà cung cấp bất cứ lúc nào với hermes model. Không cần thay đổi code, không bị khóa chân.
Hệ thống bộ nhớ: Nhỏ, có giới hạn, và có chủ ý
Đây là điểm Hermes khác biệt so với hầu hết các agent framework. Thay vì đổ mọi thứ vào một vector database, Hermes sử dụng hai file nhỏ, giới hạn ký tự:
| File | Mục đích | Giới hạn |
|---|---|---|
MEMORY.md | Ghi chú của Agent — các thông tin về môi trường, quy ước, bài học kinh nghiệm | 2,200 ký tự (~800 token) |
USER.md | Profile người dùng — sở thích, phong cách giao tiếp của bạn | 1,375 ký tự (~500 token) |
Cả hai đều nằm trong ~/.hermes/memories/ và được đưa vào system prompt dưới dạng một snapshot đóng băng (frozen snapshot) khi session bắt đầu.
Cách bộ nhớ thực sự hoạt động trong thực tế:
══════════════════════════════════════════════
MEMORY (your personal notes) [67% — 1,474/2,200 chars]
══════════════════════════════════════════════
Dự án của người dùng là một web service Rust tại ~/code/myapi sử dụng Axum + SQLx
§Máy này chạy Ubuntu 22.04, có Docker và Podman đã cài đặt
§Người dùng thích các phản hồi ngắn gọn, không thích giải thích dài dòng
Agent quản lý bộ nhớ của chính nó thông qua ba action:
- add — Lưu một thông tin mới
- replace — Cập nhật một mục hiện có (đối sánh chuỗi con)
- remove — Xóa một thứ gì đó không còn liên quan
Điểm cần lưu ý về snapshot đóng băng: Khi Hermes ghi vào bộ nhớ trong một session, các thay đổi được lưu vào disk ngay lập tức — nhưng chúng sẽ không xuất hiện trong system prompt cho đến khi session tiếp theo bắt đầu. Điều này là có chủ ý (để bảo toàn LLM prefix cache nhằm tăng performance), nhưng nó có nghĩa là agent có thể "quên" một điều gì đó nó vừa học nếu bạn tiếp tục nói chuyện trong cùng một session.
Khi bộ nhớ đầy, agent sẽ nhận được một lỗi với các mục hiện tại và thống kê sử dụng, sau đó phải hợp nhất hoặc thay thế các mục để tạo không gian. Nó giống như một người có cuốn sổ tay chỉ có 15 dòng — bạn học cách chọn lọc những gì mình ghi lại.
Nên lưu gì và bỏ qua gì:
- ✅ Nên lưu: Sở thích của người dùng, thông tin môi trường, quy ước dự án, các chỉnh sửa, các mẫu quy trình công việc
- ❌ Nên bỏ qua: Thông tin tầm phào, thông tin dễ tìm kiếm, các khối code lớn, dữ liệu tạm thời cho session cụ thể
Cách tiếp cận có giới hạn này thật mới mẻ. Hầu hết các hệ thống bộ nhớ của agent hoặc không có giới hạn (và chứa đầy rác) hoặc sử dụng truy xuất vector (thường tạo ra các liên quan không có thật). Hermes buộc phải có kỷ luật.
Skills: Bộ nhớ quy trình do Agent tự tạo ra
Skills là câu trả lời của Hermes cho câu hỏi "làm thế nào để bạn làm tốt hơn các nhiệm vụ lặp đi lặp lại?" Khi agent hoàn thành một việc gì đó phức tạp, nó có thể tạo ra một skill — về cơ bản là một file SKILL.md với hướng dẫn cho lần sau. Các skill tự cải thiện trong quá trình sử dụng.
Hệ sinh thái lớn một cách đáng ngạc nhiên: 647 skill trên 4 registry. Các skill tích hợp sẵn bao gồm:
- Coding agents: Claude Code, Codex, ủy quyền cho OpenCode
- Công cụ sáng tạo: nghệ thuật ASCII, nghệ thuật sinh tạo p5.js, hoạt hình toán học Manim, sơ đồ Excalidraw, sơ đồ kiến trúc
- Tích hợp nền tảng: Apple Notes, Apple Reminders, FindMy, iMessage
- Giải trí: thiết lập server modpack Minecraft, người chơi Pokemon (vâng, nó chơi Pokemon một cách tự động qua giả lập headless)
- Thiết kế: 54 mẫu design system chất lượng sản phẩm được trích xuất từ các trang web thực tế (Stripe, Linear, Vercel, Notion, Airbnb…)
Skills tuân theo tiêu chuẩn mở agentskills.io, vì vậy chúng có thể di động và chia sẻ trong cộng đồng.
Tình huống thực tế: Bạn yêu cầu Hermes thiết lập một stack Docker Compose cho một ứng dụng Postgres + Redis + Node. Nó thực hiện, sau đó tạo ra một skill tên là "docker-compose-setup" với template, các vấn đề thường gặp, và các quy ước về port mà nó đã khám phá ra. Lần sau khi bạn yêu cầu một stack tương tự, nó sẽ tải skill đó và hoàn thành công việc chỉ bằng một nửa số bước.
Tools: 47 tool tích hợp, được tổ chức theo danh mục
Hermes đi kèm với một registry tool đa dạng. Bạn bật/tắt các nhóm bằng hermes tools:
| Danh mục | Ví dụ | Dùng để làm gì |
|---|---|---|
| Web | web_search, web_extract | Tìm kiếm và scrape web |
| Terminal & Files | terminal, process, read_file, patch | Chạy lệnh, chỉnh sửa file |
| Browser | browser_navigate, browser_snapshot, browser_vision | Tự động hóa trình duyệt hoàn toàn |
| Media | vision_analyze, image_generate, text_to_speech | Phân tích hình ảnh, tạo ảnh, TTS |
| Agent orchestration | todo, execute_code, delegate_task | Lập kế hoạch, subagents, thực thi code |
| Memory & recall | memory, session_search | Bộ nhớ bền vững, tìm kiếm qua các session |
| Automation | cronjob, send_message | Tác vụ theo lịch, gửi tin nhắn ra ngoài |
Bật/tắt nhanh:
# Bắt đầu chỉ với tool web và terminal
hermes chat --toolsets "web,terminal"
# Hoặc cấu hình tương tác
hermes tools
Terminal Backends: Chạy mọi nơi, an toàn
Đây là một trong những tính năng thực tế mạnh nhất của Hermes. Bạn có thể chọn nơi các lệnh terminal của agent thực sự được thực thi:
| Backend | Trường hợp sử dụng |
|---|---|
local | Mặc định — chạy trên máy của bạn |
docker | Container cô lập — an toàn cho các tác vụ không đáng tin |
ssh | Server từ xa — agent không thể động đến code của chính nó |
daytona | Cloud sandbox — bền vững, ngủ đông khi không hoạt động |
modal | Serverless — có thể mở rộng, trả tiền theo mức sử dụng |
singularity | HPC container — tính toán cluster không cần root |
# ~/.hermes/config.yaml
terminal:
backend: docker
docker_image: python:3.11-slim
container_persistent: true # các gói cài đặt vẫn còn sau các session
container_cpu: 1
container_memory: 5120 # 5GB
Backend SSH là điểm vàng về bảo mật: agent làm việc trên một máy từ xa và thực sự không thể sửa đổi code hoặc config của chính nó. Các backend container (Docker, Singularity, Modal) tăng cường bảo mật hơn nữa: hệ thống file gốc chỉ đọc, tất cả các capability của Linux bị loại bỏ, không có leo thang đặc quyền, giới hạn PID, cô lập namespace hoàn toàn.
Mẹo thực tế: Nếu bạn đang chạy Hermes trên một VPS và giao cho nó các nhiệm vụ thực tế, hãy bắt đầu với backend docker. Nếu bạn tin tưởng các nhiệm vụ nhưng muốn tách biệt, hãy sử dụng ssh. Chỉ sử dụng local để phát triển hoặc cho các tác vụ mà bạn sẽ tự mình chạy.
Cron: Tự động hóa theo lịch trình tích hợp sẵn
Hermes có một trình lập lịch cron tích hợp. Không cần công cụ bên ngoài. Tạo các job bằng ngôn ngữ tự nhiên hoặc biểu thức cron, và kết quả sẽ được gửi đến bất kỳ nền tảng nhắn tin nào.
# Từ trong cuộc trò chuyện
/cron add "every 6h" "Check GitHub trending repos in Python and summarize the top 5 new ones. If nothing interesting, respond with [SILENT]." --name "GitHub watcher" --deliver telegram
# Từ CLI
hermes cron create "0 9 * * 1" \
"Generate a weekly report of top AI news, trending ML repos, and most-discussed HN posts." \
--name "Weekly AI digest" \
--deliver telegram
Điều quan trọng cần hiểu là: Các job cron chạy trong các session agent hoàn toàn mới, không có bộ nhớ từ cuộc trò chuyện hiện tại của bạn. Các prompt phải hoàn toàn khép kín. Điều này làm nhiều người vấp phải — họ viết một prompt cron kiểu như "làm cái việc mà chúng ta đã thảo luận" và tự hỏi tại sao agent không biết họ đang nói gì.
Tham số --script là một tuyệt chiêu. Bạn có thể đính kèm một script Python chạy trước mỗi lần thực thi. stdout của nó sẽ trở thành context cho agent:
# ~/.hermes/scripts/watch-site.py
import hashlib, json, os, urllib.request
URL = "https://example.com/pricing"
STATE_FILE = os.path.expanduser("~/.hermes/scripts/.watch-state.json")
content = urllib.request.urlopen(URL, timeout=30).read().decode()
current_hash = hashlib.sha256(content.encode()).hexdigest()
# Load previous state
prev_hash = None
if os.path.exists(STATE_FILE):
with open(STATE_FILE) as f:
prev_hash = json.load(f).get("hash")
# Save current state
with open(STATE_FILE, "w") as f:
json.dump({"hash": current_hash, "url": URL}, f)
if prev_hash and prev_hash != current_hash:
print(f"CHANGE DETECTED on {URL}")
print(f"Content preview:\n{content[:2000]}")
else:
print("NO_CHANGE")
/cron add "every 1h" "If script says CHANGE DETECTED, summarize what changed. If NO_CHANGE, respond with [SILENT]." --script ~/.hermes/scripts/watch-site.py --name "Pricing monitor" --deliver telegram
Mẹo [SILENT]: Khi phản hồi của agent chứa [SILENT], việc gửi thông báo sẽ bị chặn. Bạn chỉ nhận được thông báo khi có điều gì đó thực sự xảy ra. Không bị spam.
Messaging Gateway: Nói chuyện với nó từ điện thoại của bạn
hermes gateway setup # tương tác — chọn nền tảng của bạn
hermes gateway # khởi động gateway process
Hermes hỗ trợ hơn 15 nền tảng nhắn tin từ một gateway duy nhất: Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, Email, SMS, DingTalk, Feishu, WeCom, BlueBubbles, Home Assistant, và Open WebUI.
Ví dụ thiết lập Telegram (phổ biến nhất):
- Tạo một bot qua @BotFather (
/newbot) - Lấy user ID của bạn qua @userinfobot
- Chạy
hermes gateway setup, chọn Telegram, dán token và user ID vào - Khởi động gateway:
hermes gateway
Vậy là xong. Bây giờ bạn có thể trò chuyện với agent của mình từ điện thoại trong khi nó làm việc trên server của bạn.
Ghi âm giọng nói cũng hoạt động — gửi một tin nhắn thoại trên Telegram, Hermes sẽ tự động chuyển nó thành văn bản với faster-whisper (chạy local, miễn phí) và phản hồi lại văn bản đó.
Mẹo cho chat nhóm: Các bot Telegram mặc định bật chế độ riêng tư (privacy mode) — bot chỉ thấy các /command và các trả lời trực tiếp. Để nó thấy tất cả tin nhắn trong nhóm, hoặc tắt privacy mode trong BotFather hoặc thăng cấp bot lên admin.
Tích hợp MCP: Mở rộng với các Tool bên ngoài
Hermes hỗ trợ Giao thức Ngữ cảnh Model (Model Context Protocol - MCP) — kết nối với bất kỳ server MCP nào để thêm các tool:
# ~/.hermes/config.yaml
mcp:
servers:
- name: "github"
command: "npx"
args: ["-y", "@modelcontextprotocol/server-github"]
env:
GITHUB_TOKEN: "your-token"
Các tool MCP sẽ xuất hiện cùng với các tool tích hợp sẵn. Bạn có thể lọc những tool MCP nào agent có thể sử dụng để tránh quá tải tool.
Bảo mật: Bảy lớp sâu
Hermes có một mô hình phòng thủ theo chiều sâu (defense-in-depth) thực sự, chứ không chỉ là "chúng tôi đã thêm một lời nhắc phê duyệt":
- Phân quyền người dùng (User authorization) — allowlists kiểm soát ai có thể nói chuyện với agent
- Phê duyệt lệnh nguy hiểm (Dangerous command approval) — cần sự can thiệp của con người (human-in-the-loop) cho các hoạt động phá hủy (rm -rf, chmod 777, v.v.)
- Cô lập container (Container isolation) — Docker/Singularity/Modal với các thiết lập được tăng cường bảo mật
- Lọc thông tin xác thực MCP (MCP credential filtering) — cô lập biến môi trường cho các tiến trình con MCP
- Quét file context (Context file scanning) — phát hiện prompt injection trong các file dự án
- Cô lập giữa các session (Cross-session isolation) — các session không thể truy cập dữ liệu của nhau
- Làm sạch đầu vào (Input sanitization) — các tham số thư mục làm việc được xác thực dựa trên allowlist
Các chế độ phê duyệt:
# ~/.hermes/config.yaml
approvals:
mode: manual # manual | smart | off
timeout: 60 # giây trước khi tự động từ chối
manual(mặc định): Luôn hỏi trước các lệnh nguy hiểmsmart: Sử dụng một LLM phụ để đánh giá rủi ro — tự động phê duyệt rủi ro thấp, tự động từ chối nguy hiểm, chuyển lên cho bạn quyết định khi không chắc chắnoff/--yolo: Bỏ qua mọi kiểm tra. Chỉ sử dụng trong CI/CD hoặc các container dùng một lần.
Timeout này là fail-closed: Nếu bạn không phản hồi trong vòng 60 giây, lệnh sẽ bị từ chối. Không phải được phê duyệt. Đây là mặc định đúng đắn.
Subagents: Ủy quyền và song song hóa
Hermes có thể tạo ra các subagent cô lập để thực hiện các luồng công việc song song:
❯ Nghiên cứu ba chủ đề này đồng thời:
1. Các benchmark mới nhất về async runtime của Rust
2. Các tính năng mới của PostgreSQL 17
3. Các phương pháp hay nhất để caching LLM trong môi trường production
Mỗi subagent có session, tool, và context riêng. Kết quả được trả về cho agent cha. Điều này hữu ích cho các tác vụ có thể thực hiện song song một cách tự nhiên — nghiên cứu, xử lý hàng loạt, các hoạt động trên nhiều repo.
Bạn cũng có thể sử dụng execute_code để viết các script Python gọi các tool qua RPC, thu gọn các pipeline nhiều bước thành các lượt không tốn context.
Những nhược điểm thực tế (Phần thẳng thắn)
Mọi bài review chỉ nói những điều tốt đẹp đều vô dụng. Đây là những điểm yếu thực sự:
1. Bộ nhớ nhỏ và đòi hỏi quản lý chủ động
2,200 ký tự cho bộ nhớ của agent. 1,375 cho profile người dùng. Tổng cộng chỉ khoảng 20 mục ngắn. Đối với một trợ lý cá nhân được cho là "phát triển cùng bạn," việc đạt đến giới hạn này nhanh một cách khó chịu. Bạn sẽ thấy agent dành nhiều lượt để hợp nhất và thay thế các mục bộ nhớ thay vì làm việc thực sự. Cách tiếp cận có giới hạn này về mặt triết lý là hợp lý, nhưng trong thực tế, nó có nghĩa là agent sẽ quên những điều bạn ước nó không quên.
2. Snapshot đóng băng tạo ra một "độ trễ bộ nhớ" (Memory Lag)
Các thay đổi trong bộ nhớ trong một session chỉ có hiệu lực ở session tiếp theo. Điều này có nghĩa là nếu bạn nói với agent "hãy nhớ tôi đã chuyển sang PostgreSQL 17," nó sẽ ghi vào disk — nhưng nếu bạn hỏi về cài đặt cơ sở dữ liệu của mình sau đó trong cùng cuộc trò chuyện, system prompt vẫn hiển thị thông tin cũ. Agent có thể kiểm tra trạng thái trực tiếp qua các phản hồi từ tool, nhưng không phải lúc nào nó cũng nghĩ đến việc đó. Điều này dẫn đến những khoảnh khắc khó hiểu khi agent dường như đã quên những gì bạn vừa nói với nó.
3. Prompt cho Cron phải hoàn toàn khép kín
Mỗi job cron chạy trong một session trống. Không có bộ nhớ, không có lịch sử trò chuyện, không có context từ các lần chạy trước. Điều này có nghĩa là các prompt cron của bạn cần phải nêu rõ mọi thứ — làm gì, làm như thế nào, sử dụng định dạng đầu ra nào, gửi đi đâu. Viết prompt cron tốt là một kỹ năng riêng, và những lần thử đầu tiên thường cho ra kết quả vô dụng vì mọi người chỉ định không đủ thông tin.
4. Yêu cầu Context tối thiểu 64K loại bỏ các model local nhỏ hơn
Nếu bạn muốn chạy hoàn toàn local với một model 7B hoặc 13B, bạn có thể không gặp may trừ khi bạn có đủ RAM cho context 64K. Đây là một quyết định kỹ thuật hợp lý (context nhỏ = vòng lặp agent bị hỏng), nhưng nó có nghĩa là Hermes không thực sự "chạy trên mọi thứ" — nó chạy trên mọi thứ có thể phục vụ một model có context 64K.
5. Khởi động lại Gateway làm mất kết nối
Nếu bạn cần khởi động lại gateway (cập nhật, thay đổi cấu hình, phục hồi sau sự cố), tất cả các session nhắn tin đang hoạt động sẽ bị ngắt kết nối. Không có cơ chế chuyển giao mượt mà (graceful handoff). Người dùng trên Telegram/Discord chỉ thấy bot im lặng, rồi hoạt động trở lại. Đối với mục đích cá nhân thì không sao; đối với việc triển khai cho đội nhóm thì đây là một điểm yếu.
Hermes phù hợp ở đâu: 3 so sánh nhanh
Đây không phải là các bài review đầy đủ — chỉ là những ghi chú định vị để bạn biết khi nào nên chọn cái gì.
Hermes vs OpenClaw: Cả hai đều là AI agent cá nhân tự host với gateway nhắn tin, cron, bộ nhớ và sử dụng tool. OpenClaw dựa trên Node.js với trọng tâm là sự đa dạng kênh và kiến trúc plugin. Hermes dựa trên Python với trọng tâm là vòng lặp học tập (skill, tự cải thiện) và sự sẵn sàng cho nghiên cứu (xuất trajectory, huấn luyện RL). Nếu bạn muốn "trí thông minh agent ngày càng tăng," hãy nghiêng về Hermes. Nếu bạn muốn "định tuyến tin nhắn ổn định qua 15 nền tảng với hệ sinh thái plugin phong phú," hãy nghiêng về OpenClaw.
Hermes vs LangGraph: LangGraph là một framework để xây dựng các quy trình làm việc của agent — bạn viết graph, định nghĩa các node, xử lý state. Hermes là một agent sẵn sàng sử dụng — cài đặt và trò chuyện. Nếu bạn cần một hệ thống điều phối đa agent tùy chỉnh cho một sản phẩm, hãy sử dụng LangGraph. Nếu bạn cần một agent cá nhân hoạt động ngay lập tức (out of the box), hãy sử dụng Hermes.
Hermes vs CrewAI: CrewAI tập trung vào việc đóng vai đa agent (các agent "nhà nghiên cứu," "người viết," "người biên tập" hợp tác với nhau). Hermes là một agent duy nhất với khả năng ủy quyền cho subagent. CrewAI tốt hơn cho các quy trình làm việc nhóm đã được xác định trước. Hermes tốt hơn cho hỗ trợ cá nhân có mục tiêu mở, nơi nhiệm vụ không được biết trước.
Bảng tra cứu nhanh
Các lệnh thiết yếu
hermes # Bắt đầu trò chuyện
hermes model # Chuyển đổi nhà cung cấp LLM
hermes tools # Bật/tắt các bộ tool
hermes gateway setup # Cấu hình các nền tảng nhắn tin
hermes gateway # Khởi động gateway nhắn tin
hermes cron list # Liệt kê các job đã lên lịch
hermes config set KEY VAL # Đặt một giá trị cấu hình
hermes doctor # Chẩn đoán sự cố
hermes update # Cập nhật lên phiên bản mới nhất
hermes --continue # Tiếp tục session cuối cùng
hermes --yolo # Bỏ qua phê duyệt lệnh (cẩn thận!)
Cấu hình đề xuất cho lần đầu
# ~/.hermes/config.yaml
# Sử dụng Docker để an toàn
terminal:
backend: docker
docker_image: python:3.11-slim
container_persistent: true
# Giữ lại các lời nhắc phê duyệt
approvals:
mode: manual
timeout: 60
Các vấn đề thường gặp
| Vấn đề | Nguyên nhân | Cách khắc phục |
|---|---|---|
| Agent bỏ qua bộ nhớ bạn vừa thêm | Snapshot đóng băng — bộ nhớ chỉ được tải khi bắt đầu session | Bắt đầu một session mới (hermes) |
| Job cron cho ra kết quả rác | Prompt không tự chứa đủ thông tin | Viết mọi thứ ra trong prompt của cron |
| Bot không thấy tin nhắn trong nhóm | Chế độ riêng tư của Telegram | Tắt trong BotFather, sau đó thêm lại bot vào nhóm |
| Model bị từ chối khi khởi động | Context window < 64K | Sử dụng một model lớn hơn hoặc tăng --ctx-size |
hermes: command not found sau khi cài đặt | Shell chưa được tải lại | Chạy source ~/.bashrc |
Kết luận
Hermes Agent là AI agent cá nhân mã nguồn mở hoàn chỉnh nhất hiện có vào tháng 4 năm 2026. Vòng lặp học tập (memory + skills + user modeling) thực sự mới mẻ — hầu hết các agent cạnh tranh thậm chí không cố gắng cải thiện qua các session. 6 backend terminal mang lại cho bạn sự linh hoạt thực sự trong việc triển khai. Hệ sinh thái 647 skill có nghĩa là bạn không phải bắt đầu từ con số không.
Những đánh đổi là có thật: giới hạn bộ nhớ nhỏ, độ trễ do snapshot đóng băng, gánh nặng từ prompt của cron, và yêu cầu context tối thiểu 64K. Nhưng đây là những lựa chọn kỹ thuật, không phải lỗi — chúng giữ cho hệ thống có giới hạn và dễ dự đoán.
Nếu bạn muốn một AI agent sống trên server của mình, nói chuyện với bạn từ Telegram, chạy các tác vụ đã lên lịch, và thực sự trở nên tốt hơn theo thời gian — Hermes là lựa chọn nên thử. Cài đặt chỉ mất 60 giây. Bạn sẽ biết trong vòng một giờ liệu nó có phù hợp với quy trình làm việc của mình hay không.
Links:
- GitHub: github.com/NousResearch/hermes-agent
- Docs: hermes-agent.nousresearch.com/docs
- Discord: discord.gg/NousResearch
- Skills Hub: agentskills.io
- License: MIT