Введение

Автономные AI агенты — в широком определении это компьютерная система, которая может воспринимать свою среду и действовать автономно для достижения своих целей или задач. Агенты могут учиться и улучшать свою производительность используя доступные им инструменты.

В контексте агентов построенных на языковых моделях такое взаимодействие происходит с использованием человеческого языка и текстовой информации. В этом руководстве мы рассмотрим основы автономных AI агентов, включая их определение, характеристики и применения.

Реальные примеры

Первый автономный агент на базе LLM был описан в этом пейпере, за ним последовал проект babyagi от того же автора. После этого появилось сторонний проект — AutoGPT, который собрал уже 140 тысяч звезд на Гитхабе и стал самым быстрорастущим проектом в истории по количеству звезд.

AutoGPT

Auto-GPT - это экспериментальное приложение на Python, разработанное Тораном Брюсом Ричардсом. Основанный на GPT-4 от OpenAI, Auto-GPT способен выполнять задачи автономно, с минимальным участием человека, и самостоятельно формулировать подзадачи для достижения поставленной цели.

Отличие от ChatGPT

В отличие от интерактивных систем, таких как ChatGPT, которые требуют ручного ввода команд для каждой задачи, Auto-GPT сам назначает себе новые цели для достижения большего результата, не требуя обязательного участия человека. Он умеет управлять краткосрочной и долгосрочной памятью, записывая и считывая данные из баз данных и файлов. Auto-GPT способен выполнять действия в Интернете, такие как поиск в вебе, работа с веб-формами и взаимодействие с API, и это все - без участия пользователя. Кроме того, он включает в себя функцию синтеза речи для голосового вывода1.

Возможности Auto-GPT

Auto-GPT может писать, отлаживать, тестировать и редактировать код. Некоторые эксперты полагают, что эти способности могут распространяться даже на исходный код Auto-GPT, что позволит ему само-улучшаться. Важно понимать, что само улучшение происходит на уровне «дополнительных знаний», а не на уровне самой модели. Знания прокидываются в контекст и модель отвечает исходя из них. Если знания удалить или перестать передавать, то перед нами окажется обычная модель GPT со стандартным набором знаний.

Ограничения Auto-GPT

Несмотря на все его возможности, у Auto-GPT есть много ограничений. Он часто страдает от "галлюцинаций" типичных для больших языковых моделей. Auto-GPT часто испытывает трудности в выполнении креативных задач с множеством способов решения (разработчики постоянно пытаются это устранить и оптимизировать путь решения проблем). После успешного выполнения задачи он обычно не помнит, как выполнить ее позже. Или к примеру когда он самостоятельно пишет программу, то он часто забывает использовать эту программу позже. Auto-GPT испытывает трудности в эффективном декомпозиции задач и понимании контекста проблемы и пересечении целей.

Изучаем дополнительно

  1. Пост в телеграме про автономных агентов