Karpathy Agent Method: как я использую AI-агентов по принципам Андрея Карпаты

Идеи Андрея Карпаты про агентов — пожалуй, самый прагматичный подход к AI-инженерии, который я видел. Он не про хайп, а про работающие минимальные решения.

Я перевёл его метод в 10 принципов для работы с Hermes Agent, Claude Code и Codex. Вот как это выглядит на практике.

10 принципов Karpathy Agent Method

1. 🤏 Стартуй с最小льного работающего цикла

Не строй архитектуру из 5 агентов, пока не заработал один. Мой блог bronevik.vip начинался с:

  • одного агента (Hermes)
  • одной команды (npm create astro)
  • одного деплоя (Cloudflare Pages)

Весь стек вырос из этого, а не из многостраничного плана.

2. 📖 Пиши код, который можно отладить по памяти

Если ты не можешь прочитать свой пайплайн через месяц — значит он слишком сложный. Я храню playbooks в Obsidian (40-playbooks/) на одну страницу. Не больше.

3. 🔍 Инспектируй реальные входы и выходы до абстракции

Прежде чем писать “универсальный контент-генератор”, я вручную:

  • загрузил 4 транскрипта Julian Goldie через yt-dlp
  • проанализировал в Obsidian
  • понял, что работает

Только потом написал автоматизацию.

4. 🎯 Держи eval рядом с задачей

Для SEO-статьи eval — это:

1. Ранг в поиске через неделю
2. Время индексации (IndexNow)
3. CTR из Search Console

Не абстрактные метрики вроде “качество контента”.

5. 📝 Записывай кейсы отказов

У меня есть заметки в BRONEVIK_INCIDENT_* — каждый раз когда что-то сломалось. PCIe ошибка, Telegram-бот упал — всё задокументировано. Это предотвращает повторение.

6. ⚡ Автоматизируй только когда ручной процесс понятен

Я не начинал с cron-задач. Сначала:

  • собрал блог руками
  • написал 2 статьи вручную
  • настроил деплой
  • теперь можно думать об автогенерации

7. 📂 Явные файлы и скрипты вместо скрытого состояния

Вся конфигурация Hermes — в ~/.hermes/. Все playbooks — в 40-playbooks/. Никакой “магии” в runtime.

8. 📊 Измеряй latency, cost, correctness и reliability отдельно

Для каждого агента я знаю:

  • сколько стоит токен (deepseek-v4-flash, minimax-m3)
  • latency ответа
  • % успешных выполнений
  • количество retry

Без цифр — это догадки.

9. 🛟 Держи простой fallback

Если Hermes не может войти в Cloudflare Dashboard — есть ручной путь через wrangler CLI. Если wrangler не работает — есть Direct Upload через API. Если API блокирует — есть Upload UI.

10. 🧹 Убирай сложность, которая не улучшает eval

Я отключил Telegram-ботов (Codex и Claude), когда понял, что MCP host-bridge покрывает все needs. Меньше движущихся частей = меньше поломок.

Как это применить к контенту

Мой контент-пайплайн по Karpathy:

  1. Brief — тема и ключевые слова
  2. Source pack — материалы из Obsidian, YouTube транскрипты
  3. Outline — структура статьи
  4. Draft — черновик (Hermes Agent)
  5. Factual check — проверка фактов
  6. Style pass — редактура
  7. Publish checklist — sitemap, IndexNow, canonical URL
  8. Performance notes — через месяц смотрю что залетело

Итог

Karpathy Agent Method — это не про “агенты будущего”, а про инженерную дисциплину сейчас. 10 принципов, которые работают на реальном стеке.

Весь мой блог bronevik.vip построен на этих принципах. Подписывайся на RSS — следующая статья будет про сравнение стеков агентов 🔥