Skip to main content

Улучшение качества агентов для оптимизации использования ИИ

Изучайте стратегии создания более качественных агентов, которые выполняют задачи меньше и, как следствие, используют меньше AI credits.

Introduction

Когда агенты хорошо проработаны, обучены и работают в рамках чётких ограничений, эффективность токенов естественно повышается. Качественные агенты выполняют задачи за меньшее количество попыток, следуют более четким рабочим процессам с меньшим количеством переработки и избегают дорогостоящих циклов отладки и коррекции.

Следуйте стратегиям, изложенным в этой статье, чтобы повысить качество и AI credits эффективность агентов.

1. Выберите правильную модель для правильной задачи

Выбор модели — один из самых быстрых способов повысить качество агентов и экономичность затрат, но часто его упускают из виду. Распространённая закономерность — по умолчанию выбирать наиболее подходящую модель для каждой задачи, но это часто увеличивает использование токенов без улучшения результата. В некоторых случаях с высокой нагрузкой на выполнение чрезмерное использование моделей рассуждения может снижать качество, поскольку модель может чрезмерно обдумывать задачу или вносить ненужные изменения.

Выбирайте модель на основе задействованной работы:

  • Модели рассуждения: лучше всего подходят для архитектурных решений, сложной отладки, проектирования системы и задач, требующих более глубокого анализа.
  • Модели среднего звена: Лучше всего, когда план уже чёткий и агент должен эффективно его реализовать.
  • Более лёгкие модели: лучше всего подходят для рефакторинга, форматирования, обновления документации и других рутинных, чётко осмысленных изменений.

Используйте столько возможностей, сколько требует задача, и как можно меньше. Возможность сопоставления задач улучшает результаты и напрямую контролирует затраты в масштабе.

Для разбивки по моделям и типам задачи см. Сравнение моделей ИИ с помощью различных задач.

Настройте уровень рассуждения модели

Некоторые модели также поддерживают настраиваемые уровни рассуждения, которые определяют, насколько модель рассуждает перед реакцией. Более высокий уровень может улучшить ответы на сложные задачи, но потребляет больше жетонов и, соответственно, больше кредитов, поэтому по умолчанию стоит использовать обычный уровень и повышать его только для более сложных задач. Доступно настраиваемое рассуждение для Visual Studio Code и Второй пилот CLI для поддерживаемых моделей.

См . раздел AUTOTITLE.

Использование Выбор автомодели Copilot

Выбор автомодели Copilot выбирает подходящую модель для вас, исходя из цели вашей задачи.

См . раздел AUTOTITLE.

2. Дайте чёткие рекомендации в своих подсказках

Ваш запрос задаёт направление для всего, что делает агент. Когда подсказка расплывчата, агент должен сделать выводы о намерениях, исследовать больше контекста и принимать решения. Это часто приводит к повторным попыткам, смещению объёма и ненужному использованию токенов.

Хорошо структурированные задания обладают тремя качествами:

  • Чёткое определение задачи. Вместо того чтобы «решить проблему», объясните, в чём проблема, где она возникает и каков ожидаемый исход.
  • Соответствующий контекст предоставлен заранее. Если вы уже знаете, какие файлы, сервисы, логи, ошибки или входные данные имеют значение, включите их. Это помогает агенту избежать ненужного исследования.
  • Явное условие остановки. Скажите агенту, как выглядит «готово». Без точки остановки агенты могут продолжать работу за пределами цели, добавляя дополнительные коммиты, рефакторируя несвязанный код или расширяя область действия.

Эти дополнительные рекомендации не увеличивают использование токенов существенно, но могут значительно сократить количество запусков агентов, необходимых для достижения правильного результата.

Для лучших практик по инженерии в подсказках см. Инженерия подсказок для GitHub Copilot Chat.

3. Держите контекст максимально компактным

Copilot отправляет контекст, к которому имеет доступ, в виде входных токенов, и этот контекст складывается: открытые вкладки редактора, прикреплённые файлы и полный диалог длинного разговора считаются контекстом.

Чтобы сохранить контекст под контролем, подумайте о следующем:

Начинайте новый разговор, когда меняете задачу

Длинная нить несёт всю свою историю в каждом новом запросе. Когда переходите к другой задаче, начните новый разговор. Рассмотрим пример.

  • В Второй пилот CLI употреблении /new (или /clear)
  • В Копилот Чат, начните новую сессию чата.

Компактные длинные Второй пилот CLI сессии, которые вы хотите продолжать

Когда нужно, чтобы поток продолжался, но он стал большим, заходите /compactВторой пилот CLI , чтобы кратко свести историю и уменьшить окно контекста, при этом по желанию фокусируйте резюме (например, /compact focus on the auth module).

Кроме того, вы можете /context использовать его для проверки текущего потребления в любое время.

См . раздел AUTOTITLE.

Дайте Copilot карту вашего проекта

Хорошо поддерживаемый пользовательский файл инструкций, например файл или AGENTS.md``.github/copilot-instructions.md , даёт агентам структурный обзор вашего репозитория, чтобы им не приходилось читать большое количество файлов только для ориентации. См . раздел AUTOTITLE.

Приносите только те инструменты, которые вам нужны

Большие наборы инструментов (например, полноценный набор инструментов на сервере MCP) дополняют контекст при каждом запросе. Там, где это подходит вашему рабочему процессу, включайте только наборы инструментов, относящихся к задаче.

См . раздел AUTOTITLE.

Воспользуйтесь кэшированием контекста

Copilot Повторно использует уже отправленный контекст через кэширование, что снижает стоимость последующих ходов. Однако кэшированный контекст истекает после периода бездействия и не используется повторно при смене модели в середине сессии. В обоих случаях контекст повторно отправляется и снова выставляется в виде новых входных токенов. Чтобы получить максимум от кэширования, держите связанную работу в одной непрерывной сессии и избегайте смены моделей на полпути.

4. Уменьшить повторяющиеся ошибки с copilot-instructions.md помощью файла

Постоянные инструкции улучшают согласованность между взаимодействиями агентов, но их ценность полностью зависит от того, как они написаны. Файл copilot-instructions.md на уровне репозитория — самый прямой способ закодировать это руководство. Индивидуальные и организационные инструкции могут наложиться поверх более широкой согласованности.

Лучшие инструкции короткие, конкретные и основанные на реальном наблюдаемом поведении агента — а не на стандартных лучших практиках, которые звучат хорошо, но не применимы к вашей системе.

Что включить:

  • Необходимые фреймворки, библиотеки или шаблоны проектирования
  • Известные подводные камни, которые агент склонен повторять
  • Ожидания вывода, такие как «быть лаконичным» или «только возвращать код»
  • Командные конвенции, которым должен следовать агент
  • Команды сборки, тестирования и волона

Чего следует избегать:

  • Длинная, общая документация
  • Руководство, генерируемое ИИ, которое не отражает вашу реальную систему
  • Разовые предпочтения или редко используемые детали
  • Перегруженные инструкции, делающие контекст шумным

Следите за обновлением инструкций по мере развития вашей кодовой базы, архитектуры, стандартов и рабочих процессов. Поскольку эти инструкции включены в контекст агента при каждом запуске, даже небольшие улучшения могут снизить количество повторяющихся ошибок и уменьшить потерю использования токенов со временем.

Дополнительные сведения см. в разделе Добавление пользовательских инструкций репозитория для GitHub Copilot.

5. Исследовать, планировать, а затем внедрять

Одним из самых больших изменений в эффективной работе с агентами стало отказ от выполнения всего за одну сессию. Когда исследования, планирование и внедрение происходят одновременно, контекст быстро растёт, накапливается нерелевантная информация, а качество агента со временем ухудшается.

Разбейте работу на чёткие этапы:

  • Исследования: Используйте агент для изучения кодовой базы, выявления релевантных файлов и понимания зависимостей.
  • План: Создайте подробный, структурированный план или спецификацию перед внесением изменений. Именно здесь модели рассуждений наиболее ценны.
    • В Второй пилот CLI, используйте /plan.
    • В Копилот ЧатVisual Studio Code, выберите «Планировать» из выпадающего меню агента или введите plan в окно контекста.
  • Реализация: Реализуйте в соответствии с планом, используя сфокусированный контекст и модель, подходящую для реализации.

Начало новой сессии между фазами предотвращает перенос ненужного контекста вперёд. Перенос контекста с предыдущих этапов может увеличить использование токенов, создать предвзятость и снизить ясность для агента. Каждая фаза должна работать только с необходимостью. Для получения рекомендаций по эффективному определению обхвата сессий см. AUTOTITLE.

6. Добавить детерминированные ограждение

Агенты не детерминированы и не всегда верны, особенно в многоступенчатых рабочих процессах. Без ограничений мелкие ошибки могут быстро накапливаться: агенты строят на неправильных выходах, отдаляются от цели и делают отладку более дорогой и трудоёмкой.

Детерминированные органы управления вводят чёткие сигналы прохода/отказа:

  • Юнит-тесты подтверждают, что изменения агента привели к ожидаемому поведению.
  • Линтеры обеспечивают структуру и последовательность, предотвращая проблемы с форматированием, смещение стиля и избежаемую очистку.
  • Сканирование безопасности выявляет рискованные закономерности на ранних этапах, до того, как их становится сложнее распустить.

Вместе эти органы управления создают плотную обратную связь: агент вносит изменения, тестирует, делает правило или скан оценивает их, и агент корректирует перед тем, как двигаться дальше. Это предотвращает длинные цепочки неправильных изменений, которые являются одним из главных причин потери токенов.

Команды, инвестирующие в эти ограничения, получают меньше повторных решений, более быстрое выполнение задач и более предсказуемое поведение агентов. Они часто снижают общее потребление токенов, даже если отдельные шаги требуют немного больше токенов заранее.

Дальнейшие действия

Помимо повышения эффективности агентов, вы также можете контролировать и управлять своими расходами, чтобы максимально эффективно использовать ваши AI credits:

  • Используйте панель управления и управление бюджетом. Страница «Использование ИИ» https://github.com/settings/billingпод разделом разбивает расход по каждой функции и модели, чтобы вы могли видеть, куда именно идут ваши кредиты, и корректировать соответственно.
  • Выявляйте дорогие закономерности, пока они не накапливались. В течение Второй пилот CLI сессии /usage используйте для просмотра метрик на уровне сессии и выявления дорогих закономерностей во время работы. Кроме того, /chronicle tips анализирует вашу недавнюю историю сессий и выявляет возможности для более эффективного использования Copilot .
  • Перейдите на более высокий лимит. Если вы регулярно приближаетесь к своему месячному лимиту, более высокий тариф может быть экономичнее, чем оплата дополнительного расхода, так как более высокие планы имеют больше AI credit лимита. См. раздел [AUTOTITLE и О индивидуальных планах и преимуществах GitHub Copilot](/copilot/how-tos/manage-your-account/view-and-change-your-copilot-plan).