[Перевод] Карпаты оставил GPU работать на ночь. Утром в git-истории было 100 экспериментов, которые провёл не он
newsare.net
Во время моей аспирантуры у меня был ночной ритуал. Около девяти вечера я запускал обучение. Подкручивал гиперпараметр. Может, менял learning rate,[Перевод] Карпаты оставил GPU работать на ночь. Утром в git-истории было 100 экспериментов, которые провёл не он
Во время моей аспирантуры у меня был ночной ритуал. Около девяти вечера я запускал обучение. Подкручивал гиперпараметр. Может, менял learning rate, может, добавлял пару attention heads. Нажимал Enter. Потом какое-то время сидел, глядя на кривую loss, осознавал, что уже одиннадцать, ложился спать — и просыпался, обнаружив, что всё упало в три ночи из-за ошибки нехватки памяти, которую я должен был поймать заранее.На следующий день — чинишь баг, пробуешь снова. Один эксперимент в день, если повезёт. Два — если звёзды сойдутся.А теперь умножьте это на каждого ML-исследователя на планете. Тысячи нас сидят перед терминалами, вручную подкручивая одну переменную за раз, запуская один эксперимент, ожидая, проверяя, подкручивая снова. Именно так большая часть ML-исследований до сих пор работает в 2026 году.Андрей Карпати просто спросил: а что если компьютер будет делать всё это сам? И выложил репозиторий под названием autoresearch. Который решает ровно эту проблему. Читать далее Read more












