Karpathy Agent Method: как я использую AI-агентов по принципам Андрея Карпаты
Идеи Андрея Карпаты про агентов — пожалуй, самый прагматичный подход к AI-инженерии, который я видел. Он не про хайп, а про работающие минимальные решения.
Я перевёл его метод в 10 принципов для работы с Hermes Agent, Claude Code и Codex. Вот как это выглядит на практике.
10 принципов Karpathy Agent Method
1. 🤏 Стартуй с最小льного работающего цикла
Не строй архитектуру из 5 агентов, пока не заработал один. Мой блог bronevik.vip начинался с:
- одного агента (Hermes)
- одной команды (
npm create astro) - одного деплоя (Cloudflare Pages)
Весь стек вырос из этого, а не из многостраничного плана.
2. 📖 Пиши код, который можно отладить по памяти
Если ты не можешь прочитать свой пайплайн через месяц — значит он слишком сложный. Я храню playbooks в Obsidian (40-playbooks/) на одну страницу. Не больше.
3. 🔍 Инспектируй реальные входы и выходы до абстракции
Прежде чем писать “универсальный контент-генератор”, я вручную:
- загрузил 4 транскрипта Julian Goldie через yt-dlp
- проанализировал в Obsidian
- понял, что работает
Только потом написал автоматизацию.
4. 🎯 Держи eval рядом с задачей
Для SEO-статьи eval — это:
1. Ранг в поиске через неделю
2. Время индексации (IndexNow)
3. CTR из Search Console
Не абстрактные метрики вроде “качество контента”.
5. 📝 Записывай кейсы отказов
У меня есть заметки в BRONEVIK_INCIDENT_* — каждый раз когда что-то сломалось. PCIe ошибка, Telegram-бот упал — всё задокументировано. Это предотвращает повторение.
6. ⚡ Автоматизируй только когда ручной процесс понятен
Я не начинал с cron-задач. Сначала:
- собрал блог руками
- написал 2 статьи вручную
- настроил деплой
- теперь можно думать об автогенерации
7. 📂 Явные файлы и скрипты вместо скрытого состояния
Вся конфигурация Hermes — в ~/.hermes/. Все playbooks — в 40-playbooks/. Никакой “магии” в runtime.
8. 📊 Измеряй latency, cost, correctness и reliability отдельно
Для каждого агента я знаю:
- сколько стоит токен (deepseek-v4-flash, minimax-m3)
- latency ответа
- % успешных выполнений
- количество retry
Без цифр — это догадки.
9. 🛟 Держи простой fallback
Если Hermes не может войти в Cloudflare Dashboard — есть ручной путь через wrangler CLI. Если wrangler не работает — есть Direct Upload через API. Если API блокирует — есть Upload UI.
10. 🧹 Убирай сложность, которая не улучшает eval
Я отключил Telegram-ботов (Codex и Claude), когда понял, что MCP host-bridge покрывает все needs. Меньше движущихся частей = меньше поломок.
Как это применить к контенту
Мой контент-пайплайн по Karpathy:
- Brief — тема и ключевые слова
- Source pack — материалы из Obsidian, YouTube транскрипты
- Outline — структура статьи
- Draft — черновик (Hermes Agent)
- Factual check — проверка фактов
- Style pass — редактура
- Publish checklist — sitemap, IndexNow, canonical URL
- Performance notes — через месяц смотрю что залетело
Итог
Karpathy Agent Method — это не про “агенты будущего”, а про инженерную дисциплину сейчас. 10 принципов, которые работают на реальном стеке.
Весь мой блог bronevik.vip построен на этих принципах. Подписывайся на RSS — следующая статья будет про сравнение стеков агентов 🔥