[Перевод] Новый фреймворк Memento позволяет агентам на базе LLM учиться на опыте — без дообучения модели
newsare.net
Учёные из Юниверсити Колледж Лондон (UCL) и лаборатории Huawei Noah’s Ark Lab разработали новый подход к обучению, который позволяет агентам на базе бо[Перевод] Новый фреймворк Memento позволяет агентам на базе LLM учиться на опыте — без дообучения модели
Учёные из Юниверсити Колледж Лондон (UCL) и лаборатории Huawei Noah’s Ark Lab разработали новый подход к обучению, который позволяет агентам на базе больших языковых моделей (LLM) динамически адаптироваться к среде без дообучения самой модели. Метод основан на системе структурированной памяти, которая автоматически обновляется по мере накопления агентом опыта, что даёт возможность непрерывно повышать качество его работы. Читать далее Read more