newsare.net
Модель демонстрирует высокие результаты в понимании текста, математике и программировании, а также подходит для слабых устройств из-за своеXiaomi представила рассуждающую ИИ-модель MiMo: быстрее OpenAI o1-mini
Модель демонстрирует высокие результаты в понимании текста, математике и программировании, а также подходит для слабых устройств из-за своего небольшого размера. Компания Xiaomi, а точнее новая команда разработчиков Xiaomi Big Model Core Team, представила свою первую открытую модель искусственного интеллекта MiMo, способную подражать человеку в логике решения задач. Модель подходит для математических вычислений, генерации кода и даже рассуждений, при этом обгоняя по быстродействию аналоги — китайский проект Qwen и o1-mini от американского стартапа OpenAI. Чтобы достичь таких результатов, разработчики выбрали необычный подход — сосредоточились на предварительном обучении. Для этого они использовали 25 трлн токенов и специальный набор из 200 млрд токенов рассуждений, а после применили продвинутую фильтрацию и многоступенчатое смешивание обучающих выборок. Дополнительно, уже на этапе постобучения, MiMo накормили еще 130 тысячами задач по математике и программированию. На данный момент модель потенциально подходит для устройств с ограниченными ресурсами из-за своего небольшого размера. При этом она доступна сразу в 4-х версиях: базовая MiMo-7B-Base с потенциалом к рассуждениям, продвинутая MiMo-7B-RL-Zero, адаптированная под конкретные задачи MiMo-7B-SFT и, самое интересное, флагманская модель MiMo-7B-RL, демонстрирующая высокие результаты в математике, программировании и понимании текста. Read more