Глубокое погружение в Hermes Agent 2026: самообучающийся ИИ-агент, который действительно вас помнит

Вы, наверное, видели Hermes Agent в трендах GitHub — более 73 000 звёзд, и их число быстро растёт. Созданный Nous Research (лабораторией, стоящей за семействами моделей Hermes и Nomos), это open-source ИИ-агент, который работает на вашем собственном железе. Не обёртка для чат-бота. Не плагин для IDE. Полноценный автономный агент с памятью, планировщиком, использованием инструментов и циклом обучения, который становится лучше, чем дольше работает.

Это не пересказ пресс-релиза. Это практическое глубокое погружение: что Hermes на самом деле делает, как его настроить, что работает хорошо, а что — нет, и стоит ли он вашего времени. Каждая описанная здесь функция сопровождается реальным сценарием использования, который вы можете попробовать уже сегодня.

Что такое Hermes Agent на самом деле

Hermes Agent — это self-hosted ИИ-агент, который живёт на вашем сервере (или ноутбуке, или VPS за $5) и общается с вами через терминал, Telegram, Discord, Slack, WhatsApp, Signal — более 15 платформ через единый gateway-процесс. Он использует любую LLM, на которую вы его направите: OpenAI, Anthropic, DeepSeek, Nous Portal, OpenRouter с более чем 200 моделями или ваш собственный локальный endpoint.

Фишка, которая отличает его от «ещё одного фреймворка для агентов»: у него есть closed learning loop. Он запоминает информацию между сессиями, создаёт переиспользуемые skills из сложных задач, улучшает эти skills в процессе использования и со временем строит ваш профиль. Большинство агентов начинают каждую беседу с чистого листа. Hermes накапливает контекст.

Проект распространяется по лицензии MIT, что важно, если вы собираетесь строить что-то на его основе.

Ключевые цифры:

73,600+ звёзд на GitHub (на апрель 2026)
647 skills в 4 реестрах (79 встроенных, 47 опциональных, 521 от сообщества)
15+ платформ для обмена сообщениями, поддерживаемых из одного gateway
6 терминальных бэкендов: local, Docker, SSH, Daytona, Singularity, Modal
Минимальное требование к контексту: 64K токенов (модели с меньшим контекстом отклоняются при запуске)

Установка: 60 секунд, без шуток

# Установка в одну строку — Linux, macOS, WSL2 и даже Android через Termux
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# Перезагрузите ваш shell
source ~/.bashrc  # или: source ~/.zshrc

# Начните чат
hermes

Установщик делает всё сам: Python 3.11 (через uv, без sudo), Node.js v22, ripgrep, ffmpeg. Единственное предварительное требование — git.

После установки вы получаете набор CLI-команд, которые покрывают большую часть конфигурации:

hermes model    # Интерактивный выбор провайдера LLM
hermes tools    # Включение/отключение групп инструментов
hermes setup    # Полный мастер настройки (делает всё сразу)
hermes gateway  # Запуск gateway для обмена сообщениями
hermes doctor   # Диагностика проблем
hermes update   # Обновление до последней версии

Работает и на Android. У Termux есть специальный путь установки с подобранным .[termux] extra, который пропускает несовместимые с Android зависимости для работы с голосом. Вы можете буквально запустить ИИ-агента со своего телефона.

Выбор провайдера моделей

Hermes не привязывает вас к какому-либо провайдеру. Запустите hermes model и выберите из списка:

Провайдер	Что это	Метод аутентификации
Nous Portal	Подписка, не требует настройки	OAuth login
OpenAI Codex	ChatGPT OAuth, модели Codex	Device code auth
Anthropic	Модели Claude напрямую	Claude Code auth или API key
OpenRouter	200+ моделей, мультипровайдер	API key
DeepSeek	Прямой API	API key
GitHub Copilot	GPT-5.x, Claude, Gemini через Copilot	OAuth
Hugging Face	20+ открытых моделей	HF_TOKEN
Custom Endpoint	VLLM, SGLang, Ollama, любой OpenAI-совместимый	Base URL + ключ

Плюс: Z.AI/GLM, Kimi/Moonshot, MiniMax, Alibaba Cloud/DashScope, Arcee AI и другие.

Правило 64K: Hermes требует как минимум 64 000 токенов контекста. Модели с меньшим объёмом отклоняются при запуске. Это имеет смысл — многошаговые рабочие процессы с вызовом инструментов быстро съедают контекст, и маленькое окно означает, что агент потеряет нить рассуждений на полпути к выполнению задачи. Если вы запускаете локальную модель, установите --ctx-size 65536 или выше.

Меняйте провайдера в любое время с помощью hermes model. Никаких изменений в коде, никакой привязки.

Система памяти: маленькая, ограниченная и продуманная

Здесь Hermes отходит от большинства фреймворков для агентов. Вместо того чтобы сваливать всё в vector database, Hermes использует два крошечных, ограниченных по количеству символов файла:

Файл	Назначение	Лимит
`MEMORY.md`	Заметки агента — факты об окружении, соглашения, извлечённые уроки	2200 симв. (~800 токенов)
`USER.md`	Профиль пользователя — ваши предпочтения, стиль общения	1375 симв. (~500 токенов)

Оба файла находятся в ~/.hermes/memories/ и внедряются в system prompt как замороженный снимок (frozen snapshot) в начале сессии.

Как память на самом деле работает на практике:

══════════════════════════════════════════════
MEMORY (your personal notes) [67% — 1,474/2,200 chars]
══════════════════════════════════════════════
User's project is a Rust web service at ~/code/myapi using Axum + SQLx
§This machine runs Ubuntu 22.04, has Docker and Podman installed
§User prefers concise responses, dislikes verbose explanations

Агент управляет своей памятью с помощью трёх действий:

add — сохранить новый факт
replace — обновить существующую запись (по совпадению подстроки)
remove — удалить то, что больше не актуально

Загвоздка с frozen snapshot: Когда Hermes записывает что-то в память во время сессии, изменения немедленно сохраняются на диск, но они не появятся в system prompt до начала следующей сессии. Это сделано намеренно (для сохранения prefix cache LLM ради производительности), но это означает, что агент может «забыть» то, что он только что узнал, если вы продолжаете общаться в той же сессии.

Когда память заполняется, агент получает ошибку с текущими записями и статистикой использования, после чего должен объединить или заменить записи, чтобы освободить место. Это похоже на человека с блокнотом, в котором всего 15 строк — вы учитесь избирательно подходить к тому, что записывать.

Что сохранять, а что пропускать:

✅ Сохранять: предпочтения пользователя, факты об окружении, соглашения по проекту, исправления, шаблоны рабочих процессов
❌ Пропускать: тривиальную информацию, легко находимые факты, большие блоки кода, временные данные для конкретной сессии

Этот ограниченный подход освежает. Большинство систем памяти агентов либо не имеют ограничений (и забиваются шумом), либо используют vector retrieval (который галлюцинирует релевантность). Hermes заставляет быть дисциплинированным.

Skills: процедурная память, которую агент создаёт сам

Skills — это ответ Hermes на вопрос «как стать лучше в выполнении повторяющихся задач?». Когда агент завершает что-то сложное, он может создать skill — по сути, файл SKILL.md с инструкциями на следующий раз. Skills самоулучшаются в процессе использования.

Экосистема на удивление велика: 647 skills в 4 реестрах. Встроенные покрывают:

Агенты для кодинга: делегирование задач Claude Code, Codex, OpenCode
Креативные инструменты: ASCII-арт, генеративное искусство на p5.js, математические анимации Manim, диаграммы Excalidraw, архитектурные диаграммы
Интеграции с платформами: Apple Notes, Apple Reminders, FindMy, iMessage
Развлечения: настройка сервера с модпаком для Minecraft, игрок в Pokemon (да, он автономно играет в Pokemon через headless-эмуляцию)
Дизайн: 54 шаблона дизайн-систем производственного качества, извлечённых из реальных сайтов (Stripe, Linear, Vercel, Notion, Airbnb…)

Skills следуют открытому стандарту agentskills.io, поэтому они портативны и могут быть разделены с сообществом.

Реальный сценарий: Вы просите Hermes настроить Docker Compose стек для приложения на Postgres + Redis + Node. Он это делает, а затем создаёт skill под названием "docker-compose-setup" с шаблоном, распространёнными проблемами и соглашениями о портах, которые он обнаружил. В следующий раз, когда вы попросите похожий стек, он загрузит этот skill и сделает всё в два раза быстрее.

Tools: 47 встроенных, организованных по категориям

Hermes поставляется с обширным реестром инструментов. Вы можете включать/отключать группы с помощью hermes tools:

Категория	Примеры	Для чего
Web	`web_search`, `web_extract`	Поиск и скрейпинг веба
Terminal & Files	`terminal`, `process`, `read_file`, `patch`	Выполнение команд, редактирование файлов
Browser	`browser_navigate`, `browser_snapshot`, `browser_vision`	Полная автоматизация браузера
Media	`vision_analyze`, `image_generate`, `text_to_speech`	Анализ и генерация изображений, TTS
Agent orchestration	`todo`, `execute_code`, `delegate_task`	Планирование, субагенты, выполнение кода
Memory & recall	`memory`, `session_search`	Постоянная память, поиск между сессиями
Automation	`cronjob`, `send_message`	Задачи по расписанию, исходящие сообщения

Быстрое включение/отключение:

# Начать только с инструментами для веба и терминала
hermes chat --toolsets "web,terminal"

# Или настроить интерактивно
hermes tools

Terminal Backends: запускайте где угодно, безопасно

Это одна из самых сильных практических особенностей Hermes. Вы можете выбрать, где на самом деле будут выполняться команды агента в терминале:

Бэкенд	Сценарий использования
`local`	По умолчанию — выполняется на вашей машине
`docker`	Изолированные контейнеры — безопасно для ненадёжных задач
`ssh`	Удалённый сервер — агент не может трогать свой собственный код
`daytona`	Облачная песочница — постоянная, засыпает при бездействии
`modal`	Serverless — масштабируемая, оплата по мере использования
`singularity`	HPC-контейнеры — rootless-вычисления в кластере

# ~/.hermes/config.yaml
terminal:
  backend: docker
  docker_image: python:3.11-slim
  container_persistent: true  # пакеты сохраняются между сессиями
  container_cpu: 1
  container_memory: 5120      # 5GB

Бэкенд ssh — это золотая середина в плане безопасности: агент работает на удалённой машине и буквально не может изменять свой собственный код или конфигурацию. Контейнерные бэкенды (Docker, Singularity, Modal) добавляют дополнительное усиление защиты: read-only корневая файловая система, все capabilities Linux сброшены, нет повышения привилегий, лимиты PID, полная изоляция через namespaces.

Практический совет: Если вы запускаете Hermes на VPS и даёте ему реальные задачи, начните с бэкенда docker. Если вы доверяете задачам, но хотите разделения, используйте ssh. Используйте local только для разработки или задач, которые вы бы запустили сами.

Cron: встроенная автоматизация по расписанию

У Hermes есть встроенный планировщик cron. Никаких внешних инструментов не требуется. Создавайте задачи на естественном языке или с помощью cron-выражений, и результаты будут доставляться на любую платформу обмена сообщениями.

# Из чата
/cron add "every 6h" "Check GitHub trending repos in Python and summarize the top 5 new ones. If nothing interesting, respond with [SILENT]." --name "GitHub watcher" --deliver telegram

# Из CLI
hermes cron create "0 9 * * 1" \
  "Generate a weekly report of top AI news, trending ML repos, and most-discussed HN posts." \
  --name "Weekly AI digest" \
  --deliver telegram

Критически важно понимать: задачи cron запускаются в чистых сессиях агента без памяти о вашем текущем чате. Промпты должны быть полностью самодостаточными. Это сбивает людей с толку — они пишут в cron промпт вроде «сделай то, что мы обсуждали» и удивляются, почему агент понятия не имеет, что они имеют в виду.

Параметр --script — это мощный инструмент. Вы можете прикрепить Python-скрипт, который запускается перед каждым выполнением. Его stdout становится контекстом для агента:

# ~/.hermes/scripts/watch-site.py
import hashlib, json, os, urllib.request

URL = "https://example.com/pricing"
STATE_FILE = os.path.expanduser("~/.hermes/scripts/.watch-state.json")

content = urllib.request.urlopen(URL, timeout=30).read().decode()
current_hash = hashlib.sha256(content.encode()).hexdigest()

# Load previous state
prev_hash = None
if os.path.exists(STATE_FILE):
    with open(STATE_FILE) as f:
        prev_hash = json.load(f).get("hash")

# Save current state
with open(STATE_FILE, "w") as f:
    json.dump({"hash": current_hash, "url": URL}, f)

if prev_hash and prev_hash != current_hash:
    print(f"CHANGE DETECTED on {URL}")
    print(f"Content preview:\n{content[:2000]}")
else:
    print("NO_CHANGE")

/cron add "every 1h" "If script says CHANGE DETECTED, summarize what changed. If NO_CHANGE, respond with [SILENT]." --script ~/.hermes/scripts/watch-site.py --name "Pricing monitor" --deliver telegram

Хитрость с [SILENT]: Когда ответ агента содержит [SILENT], доставка подавляется. Вы получаете уведомление только тогда, когда что-то действительно произошло. Никакого спама.

Messaging Gateway: общайтесь с ним со своего телефона

hermes gateway setup  # интерактивно — выбирает вашу платформу
hermes gateway        # запускает процесс gateway

Hermes поддерживает 15+ платформ для обмена сообщениями из одного gateway: Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, Email, SMS, DingTalk, Feishu, WeCom, BlueBubbles, Home Assistant и Open WebUI.

Пример настройки Telegram (самый распространённый):

Создайте бота через @BotFather (/newbot)
Получите свой ID пользователя через @userinfobot
Запустите hermes gateway setup, выберите Telegram, вставьте токен и ID пользователя
Запустите gateway: hermes gateway

Вот и всё. Теперь вы можете общаться с вашим агентом со своего телефона, пока он работает на вашем сервере.

Голосовые заметки тоже работают — отправьте голосовое сообщение в Telegram, Hermes автоматически транскрибирует его с помощью faster-whisper (работает локально, бесплатно) и ответит на текст.

Совет по групповым чатам: У ботов Telegram по умолчанию включен режим приватности — бот видит только /commands и прямые ответы. Чтобы он видел все сообщения в группе, либо отключите режим приватности в BotFather, либо сделайте бота администратором.

Интеграция MCP: расширение с помощью внешних инструментов

Hermes поддерживает Model Context Protocol (MCP) — подключитесь к любому MCP-серверу для добавления инструментов:

# ~/.hermes/config.yaml
mcp:
  servers:
    - name: "github"
      command: "npx"
      args: ["-y", "@modelcontextprotocol/server-github"]
      env:
        GITHUB_TOKEN: "your-token"

Инструменты MCP появляются рядом со встроенными. Вы можете фильтровать, какие инструменты MCP может использовать агент, чтобы избежать их переизбытка.

Безопасность: семь уровней защиты

У Hermes есть настоящая модель defense-in-depth, а не просто «мы добавили запрос на подтверждение»:

Авторизация пользователя — белые списки контролируют, кто может общаться с агентом
Подтверждение опасных команд — human-in-the-loop для разрушительных операций (rm -rf, chmod 777 и т.д.)
Изоляция в контейнере — Docker/Singularity/Modal с усиленными настройками
Фильтрация учётных данных MCP — изоляция переменных окружения для подпроцессов MCP
Сканирование файлов контекста — обнаружение prompt injection в файлах проекта
Изоляция между сессиями — сессии не могут получить доступ к данным друг друга
Санитизация ввода — параметры рабочего каталога проверяются по белому списку

Режимы подтверждения:

# ~/.hermes/config.yaml
approvals:
  mode: manual   # manual | smart | off
  timeout: 60    # секунд до автоматического отказа

manual (по умолчанию): всегда спрашивает перед выполнением опасных команд
smart: использует вспомогательную LLM для оценки риска — автоматически одобряет низкорискованные, автоматически отклоняет опасные, эскалирует сомнительные
off / --yolo: обходит все проверки. Используйте только в CI/CD или одноразовых контейнерах.

Тайм-аут работает по принципу fail-closed: если вы не ответите в течение 60 секунд, команда будет отклонена. Не одобрена. Это правильное поведение по умолчанию.

Subagents: делегируйте и распараллеливайте

Hermes может порождать изолированных субагентов для параллельных потоков работы:

> Исследуй эти три темы одновременно:
  1. Последние бенчмарки асинхронных рантаймов Rust
  2. Новые фичи PostgreSQL 17
  3. Лучшие практики кеширования LLM в продакшене

Каждый субагент получает свою собственную сессию, инструменты и контекст. Результаты возвращаются родительскому агенту. Это полезно для задач, которые естественно распараллеливаются — исследование, пакетная обработка, операции в нескольких репозиториях.

Вы также можете использовать execute_code для написания Python-скриптов, которые вызывают инструменты через RPC, сводя многошаговые пайплайны к операциям с нулевой стоимостью контекста.

Реальные недостатки (честная часть)

Любой обзор, в котором говорится только о хорошем, бесполезен. Вот что на самом деле мешает:

1. Память крошечная и требует активного управления

2200 символов для памяти агента. 1375 для профиля пользователя. Это примерно 20 коротких записей всего. Для личного ассистента, который должен «расти вместе с вами», достижение потолка происходит удручающе быстро. Вы обнаружите, что агент тратит ходы на объединение и замену записей в памяти вместо выполнения реальной работы. Ограниченный подход философски верен, но на практике это означает, что агент забывает вещи, которые вы бы хотели, чтобы он помнил.

2. Frozen snapshot создаёт «лаг памяти»

Изменения в памяти во время сессии вступают в силу только в следующей сессии. Это значит, что если вы скажете агенту «запомни, я перешёл на PostgreSQL 17», он запишет это на диск, но если вы спросите о настройках вашей базы данных позже в том же разговоре, system prompt всё ещё будет показывать старую информацию. Агент может проверить текущее состояние через ответы инструментов, но он не всегда догадывается это сделать. Это приводит к запутанным моментам, когда кажется, что агент забыл то, что вы ему только что сказали.

3. Промпты для cron должны быть полностью самодостаточными

Каждая задача cron выполняется в пустой сессии. Никакой памяти, никакой истории разговоров, никакого контекста из предыдущих запусков. Это означает, что ваши cron-промпты должны описывать всё — что делать, как делать, какой формат вывода использовать, куда доставлять. Написание хороших cron-промптов — это само по себе искусство, и первые несколько попыток обычно приводят к бесполезным результатам, потому что люди не до конца всё прописывают.

4. Минимальный контекст в 64K отсекает небольшие локальные модели

Если вы хотите работать полностью локально с моделью на 7B или 13B, скорее всего, вам не повезёт, если вы не можете позволить себе RAM для контекста в 64K. Это разумное инженерное решение (маленький контекст = сломанные циклы агента), но это означает, что Hermes на самом деле не «работает на чём угодно» — он работает на чём угодно, что может обслуживать модель с контекстом в 64K.

5. Перезапуск gateway разрывает соединения

Если вам нужно перезапустить gateway (обновление, изменение конфигурации, восстановление после сбоя), все активные сессии обмена сообщениями отключаются. Нет плавной передачи. Пользователи в Telegram/Discord просто видят, что бот замолкает, а затем возвращается. для личного использования это нормально; для командного развёртывания это неприятный момент.

Место Hermes: 3 быстрых сравнения

Это не полноценные обзоры — просто заметки для позиционирования, чтобы вы знали, что и когда выбирать.

Hermes vs OpenClaw: Оба являются self-hosted персональными ИИ-агентами с messaging gateway, cron, памятью и использованием инструментов. OpenClaw основан на Node.js с упором на разнообразие каналов и плагинную архитектуру. Hermes основан на Python с упором на learning loop (skills, самоулучшение) и готовность к исследованиям (экспорт траекторий, RL-тренировка). Если вам нужна «растущая интеллектуальность агента», склоняйтесь к Hermes. Если вам нужна «стабильная маршрутизация сообщений по 15 платформам с обширной экосистемой плагинов», склоняйтесь к OpenClaw.

Hermes vs LangGraph: LangGraph — это фреймворк для построения рабочих процессов агентов — вы пишете граф, определяете узлы, управляете состоянием. Hermes — это готовый к использованию агент — установи и общайся. Если вам нужна кастомная мультиагентная оркестрация для продукта, используйте LangGraph. Если вам нужен личный агент, который работает из коробки, используйте Hermes.

Hermes vs CrewAI: CrewAI фокусируется на ролевой игре нескольких агентов (агенты «исследователь», «писатель», «редактор» сотрудничают). Hermes — это один агент с делегированием задач субагентам. CrewAI лучше подходит для предопределённых командных рабочих процессов. Hermes лучше подходит для открытой личной помощи, когда задача заранее не известна.

Краткая шпаргалка

Основные команды

hermes                    # Начать чат
hermes model              # Сменить провайдера LLM
hermes tools              # Включить/отключить наборы инструментов
hermes gateway setup      # Настроить платформы обмена сообщениями
hermes gateway            # Запустить messaging gateway
hermes cron list          # Показать список запланированных задач
hermes config set KEY VAL # Установить значение конфигурации
hermes doctor             # Диагностировать проблемы
hermes update             # Обновиться до последней версии
hermes --continue         # Возобновить последнюю сессию
hermes --yolo             # Обойти подтверждение команд (осторожно!)

Частые подводные камни

Проблема	Причина	Решение
Агент игнорирует только что добавленную информацию	Frozen snapshot — память загружается только при старте сессии	Начните новую сессию (`hermes`)
Задача cron выдаёт мусор	Промпт не самодостаточен	Пропишите всё детально в промпте для cron
Бот не видит сообщения в группе	Режим приватности Telegram	Отключите в BotFather, затем снова добавьте бота в группу
Модель отклонена при запуске	Окно контекста < 64K	Используйте модель побольше или увеличьте `--ctx-size`
`hermes: command not found` после установки	Shell не был перезагружен	Выполните `source ~/.bashrc`

Итог

Hermes Agent — это самый полный open-source персональный ИИ-агент, доступный в апреле 2026 года. Learning loop (память + skills + моделирование пользователя) — действительно новая вещь, большинство конкурирующих агентов даже не пытаются реализовать улучшение между сессиями. 6 терминальных бэкендов дают вам реальную гибкость развёртывания. Экосистема из 647 skills означает, что вы не начинаете с нуля.

Компромиссы реальны: крошечные лимиты памяти, лаг из-за frozen snapshot, накладные расходы на промпты для cron и порог контекста в 64K. Но это инженерные решения, а не баги — они делают систему ограниченной и предсказуемой.

Если вы хотите ИИ-агента, который живёт на вашем сервере, общается с вами через Telegram, выполняет задачи по расписанию и со временем действительно становится лучше — Hermes это тот, который стоит попробовать. Установка занимает 60 секунд. Вы поймёте в течение часа, подходит ли он для вашего рабочего процесса.

Ссылки:

GitHub: github.com/NousResearch/hermes-agent
Документация: hermes-agent.nousresearch.com/docs
Discord: discord.gg/NousResearch
Хаб скиллов: agentskills.io
Лицензия: MIT

Обзор Hermes Agent 2026: Самосовершенствующийся ИИ-агент, который действительно запоминает вас