Phân tích chuyên sâu Hermes Agent 2026: AI Agent tự cải thiện và thực sự nhớ về bạn

Chắc hẳn bạn đã thấy Hermes Agent trên GitHub Trending — hơn 73,000 sao và đang tăng rất nhanh. Được xây dựng bởi Nous Research (phòng lab đứng sau các dòng model Hermes và Nomos), đây là một AI agent mã nguồn mở chạy trên phần cứng của riêng bạn. Không phải là một wrapper cho chatbot. Không phải là một plugin IDE. Đây là một agent tự hành hoàn chỉnh với memory, scheduling, tool use, và một learning loop giúp nó trở nên tốt hơn khi hoạt động càng lâu.

Đây không phải là bài tóm tắt thông cáo báo chí. Đây là một bài phân tích chuyên sâu thực tế: Hermes thực sự làm gì, cách thiết lập nó, cái gì hoạt động tốt, cái gì không, và liệu nó có đáng để bạn dành thời gian hay không. Mỗi tính năng được mô tả ở đây đều đi kèm với một kịch bản sử dụng thực tế mà bạn có thể thử ngay hôm nay.

Hermes Agent thực sự là gì

Hermes Agent là một AI agent tự host, chạy trên server của bạn (hoặc laptop, hoặc một VPS 5 đô) và nói chuyện với bạn qua terminal, Telegram, Discord, Slack, WhatsApp, Signal — hơn 15 nền tảng từ một gateway process duy nhất. Nó sử dụng bất kỳ LLM nào bạn chỉ định: OpenAI, Anthropic, DeepSeek, Nous Portal, OpenRouter với hơn 200 model, hoặc endpoint local của riêng bạn.

Điểm khác biệt của nó so với "một agent framework nào đó khác": nó có một vòng lặp học tập khép kín (closed learning loop). Nó ghi nhớ mọi thứ qua các session, tạo ra các skill tái sử dụng được từ những nhiệm vụ phức tạp, cải thiện những skill đó trong quá trình sử dụng, và xây dựng một profile về bạn theo thời gian. Hầu hết các agent đều bắt đầu lại từ đầu mỗi cuộc trò chuyện. Hermes thì tích lũy context.

Nó có giấy phép MIT, điều này quan trọng nếu bạn định xây dựng dựa trên nó.

Những con số chính:

Hơn 73,600 sao GitHub (tính đến tháng 4 năm 2026)
647 skill trên 4 registry (79 built-in, 47 optional, 521 do cộng đồng đóng góp)
Hơn 15 nền tảng nhắn tin được hỗ trợ từ một gateway
6 terminal backend: local, Docker, SSH, Daytona, Singularity, Modal
Yêu cầu context tối thiểu: 64K token (các model dưới mức này sẽ bị từ chối khi khởi động)

Cài đặt: 60 giây, không đùa đâu

# Cài đặt bằng một dòng lệnh — Linux, macOS, WSL2, thậm chí cả Android qua Termux
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# Tải lại shell của bạn
source ~/.bashrc  # hoặc: source ~/.zshrc

# Bắt đầu trò chuyện
hermes

Trình cài đặt xử lý mọi thứ: Python 3.11 (qua uv, không cần sudo), Node.js v22, ripgrep, ffmpeg. Yêu cầu duy nhất là phải có git.

Sau khi cài đặt, bạn sẽ có một bộ lệnh CLI bao quát hầu hết các cấu hình:

hermes model    # Chọn nhà cung cấp LLM một cách tương tác
hermes tools    # Bật/tắt các nhóm tool
hermes setup    # Trình hướng dẫn cài đặt đầy đủ (làm mọi thứ cùng lúc)
hermes gateway  # Khởi động gateway nhắn tin
hermes doctor   # Chẩn đoán sự cố
hermes update   # Cập nhật lên phiên bản mới nhất

Cũng hoạt động trên Android. Termux có một đường dẫn cài đặt riêng với một gói extra .[termux] được tuyển chọn để bỏ qua các dependency về giọng nói không tương thích với Android. Bạn có thể thực sự chạy một AI agent ngay từ điện thoại của mình.

Chọn nhà cung cấp Model

Hermes không khóa bạn vào bất kỳ nhà cung cấp nào. Chạy hermes model và chọn từ danh sách:

Provider	Mô tả	Phương thức xác thực
Nous Portal	Subscription, zero-config	Đăng nhập OAuth
OpenAI Codex	ChatGPT OAuth, các model Codex	Xác thực device code
Anthropic	Các model Claude trực tiếp	Xác thực Claude Code hoặc API key
OpenRouter	Hơn 200 model, multi-provider	API key
DeepSeek	API trực tiếp	API key
GitHub Copilot	GPT-5.x, Claude, Gemini qua Copilot	OAuth
Hugging Face	Hơn 20 model mã nguồn mở	HF_TOKEN
Custom Endpoint	VLLM, SGLang, Ollama, bất kỳ endpoint nào tương thích OpenAI	Base URL + key

Cùng với: Z.AI/GLM, Kimi/Moonshot, MiniMax, Alibaba Cloud/DashScope, Arcee AI, và nhiều hơn nữa.

Quy tắc 64K: Hermes yêu cầu ít nhất 64,000 token context. Các model có ít hơn sẽ bị từ chối khi khởi động. Điều này hợp lý — các quy trình công việc gọi nhiều tool (multi-step tool-calling workflows) ngốn context rất nhanh, và một window nhỏ có nghĩa là agent sẽ mất dấu những gì nó đang làm giữa chừng một tác vụ. Nếu bạn đang chạy một model local, hãy đặt --ctx-size 65536 hoặc cao hơn.

Chuyển đổi nhà cung cấp bất cứ lúc nào với hermes model. Không cần thay đổi code, không bị khóa chân.

Hệ thống bộ nhớ: Nhỏ, có giới hạn, và có chủ ý

Đây là điểm Hermes khác biệt so với hầu hết các agent framework. Thay vì đổ mọi thứ vào một vector database, Hermes sử dụng hai file nhỏ, giới hạn ký tự:

File	Mục đích	Giới hạn
`MEMORY.md`	Ghi chú của Agent — các thông tin về môi trường, quy ước, bài học kinh nghiệm	2,200 ký tự (~800 token)
`USER.md`	Profile người dùng — sở thích, phong cách giao tiếp của bạn	1,375 ký tự (~500 token)

Cả hai đều nằm trong ~/.hermes/memories/ và được đưa vào system prompt dưới dạng một snapshot đóng băng (frozen snapshot) khi session bắt đầu.

Cách bộ nhớ thực sự hoạt động trong thực tế:

══════════════════════════════════════════════
MEMORY (your personal notes) [67% — 1,474/2,200 chars]
══════════════════════════════════════════════
Dự án của người dùng là một web service Rust tại ~/code/myapi sử dụng Axum + SQLx
§Máy này chạy Ubuntu 22.04, có Docker và Podman đã cài đặt
§Người dùng thích các phản hồi ngắn gọn, không thích giải thích dài dòng

Agent quản lý bộ nhớ của chính nó thông qua ba action:

add — Lưu một thông tin mới
replace — Cập nhật một mục hiện có (đối sánh chuỗi con)
remove — Xóa một thứ gì đó không còn liên quan

Điểm cần lưu ý về snapshot đóng băng: Khi Hermes ghi vào bộ nhớ trong một session, các thay đổi được lưu vào disk ngay lập tức — nhưng chúng sẽ không xuất hiện trong system prompt cho đến khi session tiếp theo bắt đầu. Điều này là có chủ ý (để bảo toàn LLM prefix cache nhằm tăng performance), nhưng nó có nghĩa là agent có thể "quên" một điều gì đó nó vừa học nếu bạn tiếp tục nói chuyện trong cùng một session.

Khi bộ nhớ đầy, agent sẽ nhận được một lỗi với các mục hiện tại và thống kê sử dụng, sau đó phải hợp nhất hoặc thay thế các mục để tạo không gian. Nó giống như một người có cuốn sổ tay chỉ có 15 dòng — bạn học cách chọn lọc những gì mình ghi lại.

Nên lưu gì và bỏ qua gì:

✅ Nên lưu: Sở thích của người dùng, thông tin môi trường, quy ước dự án, các chỉnh sửa, các mẫu quy trình công việc
❌ Nên bỏ qua: Thông tin tầm phào, thông tin dễ tìm kiếm, các khối code lớn, dữ liệu tạm thời cho session cụ thể

Cách tiếp cận có giới hạn này thật mới mẻ. Hầu hết các hệ thống bộ nhớ của agent hoặc không có giới hạn (và chứa đầy rác) hoặc sử dụng truy xuất vector (thường tạo ra các liên quan không có thật). Hermes buộc phải có kỷ luật.

Skills: Bộ nhớ quy trình do Agent tự tạo ra

Skills là câu trả lời của Hermes cho câu hỏi "làm thế nào để bạn làm tốt hơn các nhiệm vụ lặp đi lặp lại?" Khi agent hoàn thành một việc gì đó phức tạp, nó có thể tạo ra một skill — về cơ bản là một file SKILL.md với hướng dẫn cho lần sau. Các skill tự cải thiện trong quá trình sử dụng.

Hệ sinh thái lớn một cách đáng ngạc nhiên: 647 skill trên 4 registry. Các skill tích hợp sẵn bao gồm:

Coding agents: Claude Code, Codex, ủy quyền cho OpenCode
Công cụ sáng tạo: nghệ thuật ASCII, nghệ thuật sinh tạo p5.js, hoạt hình toán học Manim, sơ đồ Excalidraw, sơ đồ kiến trúc
Tích hợp nền tảng: Apple Notes, Apple Reminders, FindMy, iMessage
Giải trí: thiết lập server modpack Minecraft, người chơi Pokemon (vâng, nó chơi Pokemon một cách tự động qua giả lập headless)
Thiết kế: 54 mẫu design system chất lượng sản phẩm được trích xuất từ các trang web thực tế (Stripe, Linear, Vercel, Notion, Airbnb…)

Skills tuân theo tiêu chuẩn mở agentskills.io, vì vậy chúng có thể di động và chia sẻ trong cộng đồng.

Tình huống thực tế: Bạn yêu cầu Hermes thiết lập một stack Docker Compose cho một ứng dụng Postgres + Redis + Node. Nó thực hiện, sau đó tạo ra một skill tên là "docker-compose-setup" với template, các vấn đề thường gặp, và các quy ước về port mà nó đã khám phá ra. Lần sau khi bạn yêu cầu một stack tương tự, nó sẽ tải skill đó và hoàn thành công việc chỉ bằng một nửa số bước.

Tools: 47 tool tích hợp, được tổ chức theo danh mục

Hermes đi kèm với một registry tool đa dạng. Bạn bật/tắt các nhóm bằng hermes tools:

Danh mục	Ví dụ	Dùng để làm gì
Web	`web_search`, `web_extract`	Tìm kiếm và scrape web
Terminal & Files	`terminal`, `process`, `read_file`, `patch`	Chạy lệnh, chỉnh sửa file
Browser	`browser_navigate`, `browser_snapshot`, `browser_vision`	Tự động hóa trình duyệt hoàn toàn
Media	`vision_analyze`, `image_generate`, `text_to_speech`	Phân tích hình ảnh, tạo ảnh, TTS
Agent orchestration	`todo`, `execute_code`, `delegate_task`	Lập kế hoạch, subagents, thực thi code
Memory & recall	`memory`, `session_search`	Bộ nhớ bền vững, tìm kiếm qua các session
Automation	`cronjob`, `send_message`	Tác vụ theo lịch, gửi tin nhắn ra ngoài

Bật/tắt nhanh:

# Bắt đầu chỉ với tool web và terminal
hermes chat --toolsets "web,terminal"

# Hoặc cấu hình tương tác
hermes tools

Terminal Backends: Chạy mọi nơi, an toàn

Đây là một trong những tính năng thực tế mạnh nhất của Hermes. Bạn có thể chọn nơi các lệnh terminal của agent thực sự được thực thi:

Backend	Trường hợp sử dụng
`local`	Mặc định — chạy trên máy của bạn
`docker`	Container cô lập — an toàn cho các tác vụ không đáng tin
`ssh`	Server từ xa — agent không thể động đến code của chính nó
`daytona`	Cloud sandbox — bền vững, ngủ đông khi không hoạt động
`modal`	Serverless — có thể mở rộng, trả tiền theo mức sử dụng
`singularity`	HPC container — tính toán cluster không cần root

# ~/.hermes/config.yaml
terminal:
  backend: docker
  docker_image: python:3.11-slim
  container_persistent: true  # các gói cài đặt vẫn còn sau các session
  container_cpu: 1
  container_memory: 5120      # 5GB

Backend SSH là điểm vàng về bảo mật: agent làm việc trên một máy từ xa và thực sự không thể sửa đổi code hoặc config của chính nó. Các backend container (Docker, Singularity, Modal) tăng cường bảo mật hơn nữa: hệ thống file gốc chỉ đọc, tất cả các capability của Linux bị loại bỏ, không có leo thang đặc quyền, giới hạn PID, cô lập namespace hoàn toàn.

Mẹo thực tế: Nếu bạn đang chạy Hermes trên một VPS và giao cho nó các nhiệm vụ thực tế, hãy bắt đầu với backend docker. Nếu bạn tin tưởng các nhiệm vụ nhưng muốn tách biệt, hãy sử dụng ssh. Chỉ sử dụng local để phát triển hoặc cho các tác vụ mà bạn sẽ tự mình chạy.

Cron: Tự động hóa theo lịch trình tích hợp sẵn

Hermes có một trình lập lịch cron tích hợp. Không cần công cụ bên ngoài. Tạo các job bằng ngôn ngữ tự nhiên hoặc biểu thức cron, và kết quả sẽ được gửi đến bất kỳ nền tảng nhắn tin nào.

# Từ trong cuộc trò chuyện
/cron add "every 6h" "Check GitHub trending repos in Python and summarize the top 5 new ones. If nothing interesting, respond with [SILENT]." --name "GitHub watcher" --deliver telegram

# Từ CLI
hermes cron create "0 9 * * 1" \
  "Generate a weekly report of top AI news, trending ML repos, and most-discussed HN posts." \
  --name "Weekly AI digest" \
  --deliver telegram

Điều quan trọng cần hiểu là: Các job cron chạy trong các session agent hoàn toàn mới, không có bộ nhớ từ cuộc trò chuyện hiện tại của bạn. Các prompt phải hoàn toàn khép kín. Điều này làm nhiều người vấp phải — họ viết một prompt cron kiểu như "làm cái việc mà chúng ta đã thảo luận" và tự hỏi tại sao agent không biết họ đang nói gì.

Tham số --script là một tuyệt chiêu. Bạn có thể đính kèm một script Python chạy trước mỗi lần thực thi. stdout của nó sẽ trở thành context cho agent:

# ~/.hermes/scripts/watch-site.py
import hashlib, json, os, urllib.request

URL = "https://example.com/pricing"
STATE_FILE = os.path.expanduser("~/.hermes/scripts/.watch-state.json")

content = urllib.request.urlopen(URL, timeout=30).read().decode()
current_hash = hashlib.sha256(content.encode()).hexdigest()

# Load previous state
prev_hash = None
if os.path.exists(STATE_FILE):
    with open(STATE_FILE) as f:
        prev_hash = json.load(f).get("hash")

# Save current state
with open(STATE_FILE, "w") as f:
    json.dump({"hash": current_hash, "url": URL}, f)

if prev_hash and prev_hash != current_hash:
    print(f"CHANGE DETECTED on {URL}")
    print(f"Content preview:\n{content[:2000]}")
else:
    print("NO_CHANGE")

/cron add "every 1h" "If script says CHANGE DETECTED, summarize what changed. If NO_CHANGE, respond with [SILENT]." --script ~/.hermes/scripts/watch-site.py --name "Pricing monitor" --deliver telegram

Mẹo [SILENT]: Khi phản hồi của agent chứa [SILENT], việc gửi thông báo sẽ bị chặn. Bạn chỉ nhận được thông báo khi có điều gì đó thực sự xảy ra. Không bị spam.

Messaging Gateway: Nói chuyện với nó từ điện thoại của bạn

hermes gateway setup  # tương tác — chọn nền tảng của bạn
hermes gateway        # khởi động gateway process

Hermes hỗ trợ hơn 15 nền tảng nhắn tin từ một gateway duy nhất: Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, Email, SMS, DingTalk, Feishu, WeCom, BlueBubbles, Home Assistant, và Open WebUI.

Ví dụ thiết lập Telegram (phổ biến nhất):

Tạo một bot qua @BotFather (/newbot)
Lấy user ID của bạn qua @userinfobot
Chạy hermes gateway setup, chọn Telegram, dán token và user ID vào
Khởi động gateway: hermes gateway

Vậy là xong. Bây giờ bạn có thể trò chuyện với agent của mình từ điện thoại trong khi nó làm việc trên server của bạn.

Ghi âm giọng nói cũng hoạt động — gửi một tin nhắn thoại trên Telegram, Hermes sẽ tự động chuyển nó thành văn bản với faster-whisper (chạy local, miễn phí) và phản hồi lại văn bản đó.

Mẹo cho chat nhóm: Các bot Telegram mặc định bật chế độ riêng tư (privacy mode) — bot chỉ thấy các /command và các trả lời trực tiếp. Để nó thấy tất cả tin nhắn trong nhóm, hoặc tắt privacy mode trong BotFather hoặc thăng cấp bot lên admin.

Tích hợp MCP: Mở rộng với các Tool bên ngoài

Hermes hỗ trợ Giao thức Ngữ cảnh Model (Model Context Protocol - MCP) — kết nối với bất kỳ server MCP nào để thêm các tool:

# ~/.hermes/config.yaml
mcp:
  servers:
    - name: "github"
      command: "npx"
      args: ["-y", "@modelcontextprotocol/server-github"]
      env:
        GITHUB_TOKEN: "your-token"

Các tool MCP sẽ xuất hiện cùng với các tool tích hợp sẵn. Bạn có thể lọc những tool MCP nào agent có thể sử dụng để tránh quá tải tool.

Bảo mật: Bảy lớp sâu

Hermes có một mô hình phòng thủ theo chiều sâu (defense-in-depth) thực sự, chứ không chỉ là "chúng tôi đã thêm một lời nhắc phê duyệt":

Phân quyền người dùng (User authorization) — allowlists kiểm soát ai có thể nói chuyện với agent
Phê duyệt lệnh nguy hiểm (Dangerous command approval) — cần sự can thiệp của con người (human-in-the-loop) cho các hoạt động phá hủy (rm -rf, chmod 777, v.v.)
Cô lập container (Container isolation) — Docker/Singularity/Modal với các thiết lập được tăng cường bảo mật
Lọc thông tin xác thực MCP (MCP credential filtering) — cô lập biến môi trường cho các tiến trình con MCP
Quét file context (Context file scanning) — phát hiện prompt injection trong các file dự án
Cô lập giữa các session (Cross-session isolation) — các session không thể truy cập dữ liệu của nhau
Làm sạch đầu vào (Input sanitization) — các tham số thư mục làm việc được xác thực dựa trên allowlist

Các chế độ phê duyệt:

# ~/.hermes/config.yaml
approvals:
  mode: manual   # manual | smart | off
  timeout: 60    # giây trước khi tự động từ chối

manual (mặc định): Luôn hỏi trước các lệnh nguy hiểm
smart: Sử dụng một LLM phụ để đánh giá rủi ro — tự động phê duyệt rủi ro thấp, tự động từ chối nguy hiểm, chuyển lên cho bạn quyết định khi không chắc chắn
off / --yolo: Bỏ qua mọi kiểm tra. Chỉ sử dụng trong CI/CD hoặc các container dùng một lần.

Timeout này là fail-closed: Nếu bạn không phản hồi trong vòng 60 giây, lệnh sẽ bị từ chối. Không phải được phê duyệt. Đây là mặc định đúng đắn.

Subagents: Ủy quyền và song song hóa

Hermes có thể tạo ra các subagent cô lập để thực hiện các luồng công việc song song:

❯ Nghiên cứu ba chủ đề này đồng thời:
  1. Các benchmark mới nhất về async runtime của Rust
  2. Các tính năng mới của PostgreSQL 17
  3. Các phương pháp hay nhất để caching LLM trong môi trường production

Mỗi subagent có session, tool, và context riêng. Kết quả được trả về cho agent cha. Điều này hữu ích cho các tác vụ có thể thực hiện song song một cách tự nhiên — nghiên cứu, xử lý hàng loạt, các hoạt động trên nhiều repo.

Bạn cũng có thể sử dụng execute_code để viết các script Python gọi các tool qua RPC, thu gọn các pipeline nhiều bước thành các lượt không tốn context.

Những nhược điểm thực tế (Phần thẳng thắn)

Mọi bài review chỉ nói những điều tốt đẹp đều vô dụng. Đây là những điểm yếu thực sự:

1. Bộ nhớ nhỏ và đòi hỏi quản lý chủ động

2,200 ký tự cho bộ nhớ của agent. 1,375 cho profile người dùng. Tổng cộng chỉ khoảng 20 mục ngắn. Đối với một trợ lý cá nhân được cho là "phát triển cùng bạn," việc đạt đến giới hạn này nhanh một cách khó chịu. Bạn sẽ thấy agent dành nhiều lượt để hợp nhất và thay thế các mục bộ nhớ thay vì làm việc thực sự. Cách tiếp cận có giới hạn này về mặt triết lý là hợp lý, nhưng trong thực tế, nó có nghĩa là agent sẽ quên những điều bạn ước nó không quên.

2. Snapshot đóng băng tạo ra một "độ trễ bộ nhớ" (Memory Lag)

Các thay đổi trong bộ nhớ trong một session chỉ có hiệu lực ở session tiếp theo. Điều này có nghĩa là nếu bạn nói với agent "hãy nhớ tôi đã chuyển sang PostgreSQL 17," nó sẽ ghi vào disk — nhưng nếu bạn hỏi về cài đặt cơ sở dữ liệu của mình sau đó trong cùng cuộc trò chuyện, system prompt vẫn hiển thị thông tin cũ. Agent có thể kiểm tra trạng thái trực tiếp qua các phản hồi từ tool, nhưng không phải lúc nào nó cũng nghĩ đến việc đó. Điều này dẫn đến những khoảnh khắc khó hiểu khi agent dường như đã quên những gì bạn vừa nói với nó.

3. Prompt cho Cron phải hoàn toàn khép kín

Mỗi job cron chạy trong một session trống. Không có bộ nhớ, không có lịch sử trò chuyện, không có context từ các lần chạy trước. Điều này có nghĩa là các prompt cron của bạn cần phải nêu rõ mọi thứ — làm gì, làm như thế nào, sử dụng định dạng đầu ra nào, gửi đi đâu. Viết prompt cron tốt là một kỹ năng riêng, và những lần thử đầu tiên thường cho ra kết quả vô dụng vì mọi người chỉ định không đủ thông tin.

4. Yêu cầu Context tối thiểu 64K loại bỏ các model local nhỏ hơn

Nếu bạn muốn chạy hoàn toàn local với một model 7B hoặc 13B, bạn có thể không gặp may trừ khi bạn có đủ RAM cho context 64K. Đây là một quyết định kỹ thuật hợp lý (context nhỏ = vòng lặp agent bị hỏng), nhưng nó có nghĩa là Hermes không thực sự "chạy trên mọi thứ" — nó chạy trên mọi thứ có thể phục vụ một model có context 64K.

5. Khởi động lại Gateway làm mất kết nối

Nếu bạn cần khởi động lại gateway (cập nhật, thay đổi cấu hình, phục hồi sau sự cố), tất cả các session nhắn tin đang hoạt động sẽ bị ngắt kết nối. Không có cơ chế chuyển giao mượt mà (graceful handoff). Người dùng trên Telegram/Discord chỉ thấy bot im lặng, rồi hoạt động trở lại. Đối với mục đích cá nhân thì không sao; đối với việc triển khai cho đội nhóm thì đây là một điểm yếu.

Hermes phù hợp ở đâu: 3 so sánh nhanh

Đây không phải là các bài review đầy đủ — chỉ là những ghi chú định vị để bạn biết khi nào nên chọn cái gì.

Hermes vs OpenClaw: Cả hai đều là AI agent cá nhân tự host với gateway nhắn tin, cron, bộ nhớ và sử dụng tool. OpenClaw dựa trên Node.js với trọng tâm là sự đa dạng kênh và kiến trúc plugin. Hermes dựa trên Python với trọng tâm là vòng lặp học tập (skill, tự cải thiện) và sự sẵn sàng cho nghiên cứu (xuất trajectory, huấn luyện RL). Nếu bạn muốn "trí thông minh agent ngày càng tăng," hãy nghiêng về Hermes. Nếu bạn muốn "định tuyến tin nhắn ổn định qua 15 nền tảng với hệ sinh thái plugin phong phú," hãy nghiêng về OpenClaw.

Hermes vs LangGraph: LangGraph là một framework để xây dựng các quy trình làm việc của agent — bạn viết graph, định nghĩa các node, xử lý state. Hermes là một agent sẵn sàng sử dụng — cài đặt và trò chuyện. Nếu bạn cần một hệ thống điều phối đa agent tùy chỉnh cho một sản phẩm, hãy sử dụng LangGraph. Nếu bạn cần một agent cá nhân hoạt động ngay lập tức (out of the box), hãy sử dụng Hermes.

Hermes vs CrewAI: CrewAI tập trung vào việc đóng vai đa agent (các agent "nhà nghiên cứu," "người viết," "người biên tập" hợp tác với nhau). Hermes là một agent duy nhất với khả năng ủy quyền cho subagent. CrewAI tốt hơn cho các quy trình làm việc nhóm đã được xác định trước. Hermes tốt hơn cho hỗ trợ cá nhân có mục tiêu mở, nơi nhiệm vụ không được biết trước.

Bảng tra cứu nhanh

Các lệnh thiết yếu

hermes                    # Bắt đầu trò chuyện
hermes model              # Chuyển đổi nhà cung cấp LLM
hermes tools              # Bật/tắt các bộ tool
hermes gateway setup      # Cấu hình các nền tảng nhắn tin
hermes gateway            # Khởi động gateway nhắn tin
hermes cron list          # Liệt kê các job đã lên lịch
hermes config set KEY VAL # Đặt một giá trị cấu hình
hermes doctor             # Chẩn đoán sự cố
hermes update             # Cập nhật lên phiên bản mới nhất
hermes --continue         # Tiếp tục session cuối cùng
hermes --yolo             # Bỏ qua phê duyệt lệnh (cẩn thận!)

Cấu hình đề xuất cho lần đầu

# ~/.hermes/config.yaml

# Sử dụng Docker để an toàn
terminal:
  backend: docker
  docker_image: python:3.11-slim
  container_persistent: true

# Giữ lại các lời nhắc phê duyệt
approvals:
  mode: manual
  timeout: 60

Các vấn đề thường gặp

Vấn đề	Nguyên nhân	Cách khắc phục
Agent bỏ qua bộ nhớ bạn vừa thêm	Snapshot đóng băng — bộ nhớ chỉ được tải khi bắt đầu session	Bắt đầu một session mới (`hermes`)
Job cron cho ra kết quả rác	Prompt không tự chứa đủ thông tin	Viết mọi thứ ra trong prompt của cron
Bot không thấy tin nhắn trong nhóm	Chế độ riêng tư của Telegram	Tắt trong BotFather, sau đó thêm lại bot vào nhóm
Model bị từ chối khi khởi động	Context window < 64K	Sử dụng một model lớn hơn hoặc tăng `--ctx-size`
`hermes: command not found` sau khi cài đặt	Shell chưa được tải lại	Chạy `source ~/.bashrc`

Kết luận

Hermes Agent là AI agent cá nhân mã nguồn mở hoàn chỉnh nhất hiện có vào tháng 4 năm 2026. Vòng lặp học tập (memory + skills + user modeling) thực sự mới mẻ — hầu hết các agent cạnh tranh thậm chí không cố gắng cải thiện qua các session. 6 backend terminal mang lại cho bạn sự linh hoạt thực sự trong việc triển khai. Hệ sinh thái 647 skill có nghĩa là bạn không phải bắt đầu từ con số không.

Những đánh đổi là có thật: giới hạn bộ nhớ nhỏ, độ trễ do snapshot đóng băng, gánh nặng từ prompt của cron, và yêu cầu context tối thiểu 64K. Nhưng đây là những lựa chọn kỹ thuật, không phải lỗi — chúng giữ cho hệ thống có giới hạn và dễ dự đoán.

Nếu bạn muốn một AI agent sống trên server của mình, nói chuyện với bạn từ Telegram, chạy các tác vụ đã lên lịch, và thực sự trở nên tốt hơn theo thời gian — Hermes là lựa chọn nên thử. Cài đặt chỉ mất 60 giây. Bạn sẽ biết trong vòng một giờ liệu nó có phù hợp với quy trình làm việc của mình hay không.

Links:

GitHub: github.com/NousResearch/hermes-agent
Docs: hermes-agent.nousresearch.com/docs
Discord: discord.gg/NousResearch
Skills Hub: agentskills.io
License: MIT

Hermes Agent Review 2026: AI Agent tự cải thiện và thực sự nhớ bạn