Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes

World Science News

newsare.net

Когда модель DeepSeek R1 стала широко обсуждаться в сообществе, я заинтересовался, можно ли эффективно использовать её и другие крупные модели в д

Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes

Когда модель DeepSeek R1 стала широко обсуждаться в сообществе, я заинтересовался, можно ли эффективно использовать её и другие крупные модели в домашних условиях, не прибегая к дорогостоящим облачным сервисам. Поскольку DevOps и инфраструктурой я увлекаюсь уже несколько лет, у меня постепенно сформировалась домашняя лаборатория, на которой я и решил проверить эту идею. Эта статья в трёх частях — результат моего опыта в решении этой задачи. Внутри вас ждёт пошаговое руководство по реализации бюджетного распределённого инференса с использованием Ray Serve, vLLM, Kubernetes, Proxmox и других технологий. В первой части мы разберём настройку GPU и его проброс в Proxmox, развернём Kubernetes-кластер, установим GPU Operator и KubeRay Operator. Поехали! Read more

Facebook Twitter

05:45 12.05.2025

[Перевод] Ролевые игры для CTO: устраняем неэффективные настройки по умолчанию в технологических командах

newsare.net

Все вокруг повторяют мантры про «не сдаваться», хакатоны и борьбу с техническим долгом. Эти слова звучат правильно — но почему тогда команды

[Перевод] Ролевые игры для CTO: устраняем неэффективные настройки по умолчанию в технологических командах

Все вокруг повторяют мантры про «не сдаваться», хакатоны и борьбу с техническим долгом. Эти слова звучат правильно — но почему тогда команды, которые им следуют, часто буксуют на месте? Может, дело не в мотивации, а в том, что мы слепо копируем сценарии, которые давно не работают? Пора выйти за рамки привычного.Привет, Хабр! Меня зовут Егор Толстой, я — ведущий подкаста Podlodka и автор Роадмапа Тимлида. Веду телеграм-канал Teamlead Good Reads, где каждый день делюсь идеями о работе с командами. Публикую перевод интересной статьи для техлидов от технического консультанта Авива Бен-Йосефа, автора книги The Tech Executive Operating System.«У нас никто никогда не сдаётся!» «Посмотрите, какой хакатон мы провели!» «Мы жёстко закладываем время на борьбу с техдолгом».На первый взгляд — правильные и вдохновляющие лозунги. Но на деле это просто рекомендации, которым имеет смысл следовать… если вы хотите управлять посредственной командой.Как технический лидер, вы часто попадаете в ловушку «общепринятых» практик. Но что, если именно эти практики тормозят развитие вашей команды и организации? В этой статье — шесть нестандартных установок. Они могут показаться непопулярными, зато помогут выстроить устойчивую, инновационную и по-настоящему эффективную команду. Читать далее

World and Local News

World Science News

Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes

newsare.net

Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes

[Перевод] Ролевые игры для CTO: устраняем неэффективные настройки по умолчанию в технологических командах

newsare.net

[Перевод] Ролевые игры для CTO: устраняем неэффективные настройки по умолчанию в технологических командах

Как довести фичу до продакшена без боли: пошаговый гайд от команды RuStore. Часть 2

newsare.net

Как довести фичу до продакшена без боли: пошаговый гайд от команды RuStore. Часть 2

Story Points не работают? И другие мифы про оценку задач, в которые мы почему-то верим

newsare.net

Story Points не работают? И другие мифы про оценку задач, в которые мы почему-то верим

Недельный геймдев: #225 — 11 мая, 2025

newsare.net

Недельный геймдев: #225 — 11 мая, 2025

Эффект душа: почему отдых и переключение на хобби помогают принимать крутые решения

newsare.net

Эффект душа: почему отдых и переключение на хобби помогают принимать крутые решения

Как мы создавали ИТ-школу с нуля: ошибки, инсайты и уроки, которые мы извлекли (часть 1)

newsare.net

Как мы создавали ИТ-школу с нуля: ошибки, инсайты и уроки, которые мы извлекли (часть 1)

DeepSeek как ангел хранитель твоего кода

newsare.net

DeepSeek как ангел хранитель твоего кода

Механизмы взаимодействия пользователя и системы с приложением в Windows

newsare.net

Механизмы взаимодействия пользователя и системы с приложением в Windows

Как избавиться от зацикливания обработчиков событий в Битриксе

newsare.net

Как избавиться от зацикливания обработчиков событий в Битриксе

Tuna Секреты — современный подход к конфигурации окружений

newsare.net

Tuna Секреты — современный подход к конфигурации окружений

В сервисах Mail стал доступен новый тариф

newsare.net

В сервисах Mail стал доступен новый тариф

Людям с целиакией разрешили целоваться с поевшими глютена партнерами

newsare.net

Людям с целиакией разрешили целоваться с поевшими глютена партнерами

Китай опередил остальной мир по росту бремени деменции

newsare.net

Китай опередил остальной мир по росту бремени деменции

Компьютерный дизайн белков помог получить циклопропаны и силаны энантиоселективно

newsare.net

Компьютерный дизайн белков помог получить циклопропаны и силаны энантиоселективно

XENONnT не увидел легкой темной материи

newsare.net

XENONnT не увидел легкой темной материи

Здоровую диету связали с более поздним началом менструаций

newsare.net

Здоровую диету связали с более поздним началом менструаций

Топ-10 лучших смартфонов до 15000 рублей в 2025 году

newsare.net

Топ-10 лучших смартфонов до 15000 рублей в 2025 году

WSJ: Apple планирует поднять цены на iPhone в 2025 году

newsare.net

WSJ: Apple планирует поднять цены на iPhone в 2025 году

У Samsung появился первый в мире OLED-монитор на 500 Гц

newsare.net

У Samsung появился первый в мире OLED-монитор на 500 Гц

Папа Римский Лев XIV назвал ИИ главной проблемой человечества

newsare.net

Папа Римский Лев XIV назвал ИИ главной проблемой человечества

Ученые впервые сняли, как большая новозеландская улитка откладывает яйцо

newsare.net

Ученые впервые сняли, как большая новозеландская улитка откладывает яйцо

Найдена бактерия, которая «поедает» нефть с поверхности океана

newsare.net

Найдена бактерия, которая «поедает» нефть с поверхности океана

Philips предлагает ремонтировать триммеры с помощью 3D-печати

newsare.net

Philips предлагает ремонтировать триммеры с помощью 3D-печати

Топ-12 лучших встраиваемых вытяжек для кухни в 2025 году: рейтинг редакции Hi-Tech Mail

newsare.net

Топ-12 лучших встраиваемых вытяжек для кухни в 2025 году: рейтинг редакции Hi-Tech Mail

Как удалить страницу в Word: 6 простых способов

newsare.net

Как удалить страницу в Word: 6 простых способов