Deep Think with Confidence (DeepConf): уверенные рассуждения с ранней остановкой
newsare.net
На этой неделе разбираем методику Deep Think with Confidence (DeepConf) — подход к рассуждениям LLM, который измеряет локальную уверенность модели по ходу генDeep Think with Confidence (DeepConf): уверенные рассуждения с ранней остановкой
На этой неделе разбираем методику Deep Think with Confidence (DeepConf) — подход к рассуждениям LLM, который измеряет локальную уверенность модели по ходу генерации и использует её для ранней остановки низкокачественных трасс, а также для взвешенной агрегации ответов офлайн. DeepConf не требует дообучения модели и легко встраивается в существующие inference‑стеки, при этом одновременно:- Повышает точность на сложных бенчмарках (до 99.9% на AIME 2025 с GPT‑OSS‑120B),- Существенно сокращает вычисления за счёт раннего отсечения «плохих» цепочек (до −84.7% токенов). Читать далее