Как я победил в RAG Challenge: от нуля до SoTA за один конкурс
Когда новичок пытается построить свою первую вопросно-ответную LLM систему, он быстро узнаёт, что базовый RAG - это для малышей и его нужно «прокачивать» модными техниками: Hybrid Search, Parent Document Retrieval, Reranking и десятки других непонятных терминов.Глаза разбегаются, наступает паралич выбора, ладошки потеют.А что, если попробовать их все?Я решил потратить на подготовку к соревнованию 200+ часов и собственноручно проверить каждую из этих методик. Получилось настолько удачно, что я выиграл конкурс во всех номинациях.Теперь рассказываю, какие техники оказались полезными, а какие нет, и как повторить мой результат. Читать далее