Как мы готовили Kubernetes под ML-нагрузки: пошаговый гайд (и что пошло не так)

World Science News

newsare.net

Привет! Я Дмитрий, инженер и руководитель направления MLOps в Совкомбанке. Специализируюсь на разработке и эксплуатации ML-платформ на базе Kubernet

Как мы готовили Kubernetes под ML-нагрузки: пошаговый гайд (и что пошло не так)

Привет! Я Дмитрий, инженер и руководитель направления MLOps в Совкомбанке. Специализируюсь на разработке и эксплуатации ML-платформ на базе Kubernetes и GPU. С 2010 года в ИТ: строю инфраструктуру для машинного обучения, внедряю Kubeflow и GPU-оператор, настраиваю MIG на H100 в корпоративных средах с повышенными требованиями к безопасности и надежности. В последние годы фокусируюсь на оптимизации ML-пайплайнов, повышении утилизации GPU (включая MIG-профили) и интеграции MLOps-практик в процессы продуктовых команд.В 2022 году в некоторых командах разработки уже существовали проекты с применением ИИ, но как отдельные компоненты, не хватало единой платформы управления. По мере роста количества и сложности бизнес-задач возникла необходимость в создании ML-платформы как сервиса с едиными стандартами авторизации. Мы изучили доступные инструменты, попытались объединить их в одном Kubernetes-кластере, столкнулись с рядом ограничений — и в итоге пришли к архитектуре на базе Kubeflow и GPU-оператора. В статье рассказываем, какие сложности были в ходе проекта, как выстроили работу с Kubeflow, настраивали H100 с MIG-разделением и что важно учесть, если вы планируете строить ML-платформу на bare-metal-GPU в корпоративной среде. Читать далее Read more

Facebook Twitter

12:15 12.02.2026

„Ariane 6“ iškėlė 32 palydovus iš Prancūzijos: tai pirmasis tokio tipo paleidimas Europoje

newsare.net

„Ariane 6“ iškėlė 32 palydovus iš Prancūzijos: tai pirmasis tokio tipo paleidimas Europoje

Europos raketa „Ariane 6“ ketvirtadienį pakilo iš Prancūzijos Kuru kosmoso bazės Prancūzijos Gvianoje, gabendama 32 „Amazon Leo“ tinklo palydovus. „Amazon Leo“ siekia konkuruoti su Elono Musko kosminių technologijų bendrovės „SpaceX“ palydovinio ryšio tinklu „Starlink“. Tai pirmasis „Amazon Leo“ paleidimas iš Europos Kuru kosmoso bazės Kuru Prancūzijos Gvianoje, Pietų Amerikos šiaurės rytinėje pakrantėje.

World and Local News

World Science News

Как мы готовили Kubernetes под ML-нагрузки: пошаговый гайд (и что пошло не так)

newsare.net

Как мы готовили Kubernetes под ML-нагрузки: пошаговый гайд (и что пошло не так)

„Ariane 6“ iškėlė 32 palydovus iš Prancūzijos: tai pirmasis tokio tipo paleidimas Europoje

newsare.net

„Ariane 6“ iškėlė 32 palydovus iš Prancūzijos: tai pirmasis tokio tipo paleidimas Europoje

뇌의 정보 처리 방식 적용… 인간 눈보다 4배 빠른 반도체 개발

newsare.net

뇌의 정보 처리 방식 적용… 인간 눈보다 4배 빠른 반도체 개발

남극 빙하에 검출기 5800개… 우주 기원 단서 ‘중성미자’ 찾는다

newsare.net

남극 빙하에 검출기 5800개… 우주 기원 단서 ‘중성미자’ 찾는다

삼성전자, 최고 성능 HBM4 세계 첫 양산-출하

newsare.net

삼성전자, 최고 성능 HBM4 세계 첫 양산-출하

Воняешь слабостью

newsare.net

Воняешь слабостью

Метаанализ выделил 12 значимых факторов риска пищевой аллергии у детей

newsare.net

Метаанализ выделил 12 значимых факторов риска пищевой аллергии у детей

Патологический ген снизил чувствительность нейронов к лептину и привел к перееданию

newsare.net

Патологический ген снизил чувствительность нейронов к лептину и привел к перееданию

Дымчатые мангабеи поели огненноногих белок и заразились оспой обезьян

newsare.net

Дымчатые мангабеи поели огненноногих белок и заразились оспой обезьян

Андроид Unitree G1 выполнил прыжок через барьер с кульбитом

newsare.net

Андроид Unitree G1 выполнил прыжок через барьер с кульбитом

Рынок труда — это галлюцинация: как нейросети нанимают нейросети, пока люди сидят без работы

newsare.net

Рынок труда — это галлюцинация: как нейросети нанимают нейросети, пока люди сидят без работы

PG_EXPECTO v.7: Комплексный статистический анализ ожиданий СУБД PostgreSQL

newsare.net

PG_EXPECTO v.7: Комплексный статистический анализ ожиданий СУБД PostgreSQL

Создание и кастомизация Maven archetype

newsare.net

Создание и кастомизация Maven archetype

У Z-80 4-битная АЛУ. Вот как она работает

newsare.net

У Z-80 4-битная АЛУ. Вот как она работает

Обзор драмы: AI-агент vs. мейнтейнер Matplotlib

newsare.net

Обзор драмы: AI-агент vs. мейнтейнер Matplotlib

В Беларуси будут стимулировать внедрение промышленных роботов

newsare.net

В Беларуси будут стимулировать внедрение промышленных роботов

Как реализовать CTRL + Z на уровне проекта?

newsare.net

Как реализовать CTRL + Z на уровне проекта?

Notepad++: счетчики выделенных слов в StatusBar (python скрипт)

newsare.net

Notepad++: счетчики выделенных слов в StatusBar (python скрипт)

[Перевод] Tesla Optimus: реальность против обещаний

newsare.net

[Перевод] Tesla Optimus: реальность против обещаний

‘유럽 소버린AI’ 佛미스트랄, 1년새 매출 20배 증가

newsare.net

‘유럽 소버린AI’ 佛미스트랄, 1년새 매출 20배 증가

카카오, 작년 매출 8조-영업익 7320억 ‘역대 최대’

newsare.net

카카오, 작년 매출 8조-영업익 7320억 ‘역대 최대’

벤츠 공장에 ‘구글 두뇌’단 로봇?… 앱트로닉, 7000억원 투자 유치

newsare.net

벤츠 공장에 ‘구글 두뇌’단 로봇?… 앱트로닉, 7000억원 투자 유치

Почему копирайтинг снова становится суперсилой в 2026 году

newsare.net

Почему копирайтинг снова становится суперсилой в 2026 году

Блокировка Telegram и война с РКН. Полная хронология событий с 2017 года и что нас ждет дальше + опрос Хабра

newsare.net

Блокировка Telegram и война с РКН. Полная хронология событий с 2017 года и что нас ждет дальше + опрос Хабра

Go 1.26 вышел, пройдемся по всем изменениям…

newsare.net

Go 1.26 вышел, пройдемся по всем изменениям…

[Перевод] Космические дата-центры и 100 ГВт на орбите: где ломается бизнес-модель. Разбор от TechCrunch

newsare.net

[Перевод] Космические дата-центры и 100 ГВт на орбите: где ломается бизнес-модель. Разбор от TechCrunch

На Тайване нашли позвонок питона возрастом 400800 тысяч лет

На Тайване нашли позвонок питона возрастом 400800 тысяч лет