Старший инженер по инфраструктуре ML

По договоренности

  • Марксистская
  • Третьяковская
  • Театральная

Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ.
Сейчас мы в поисках Старшего инженера по инфраструктуре ML.


Вам предстоит:

  • Обеспечивать стабильную, производительную и масштабируемую аппаратную платформу для ML;
  • Оперативно устранять сбои, поддерживать SLA, разрабатывать проактивные меры по предотвращению инцидентов;
  • Выбирать и закупать оборудование, составлять ТЗ, (Техническое проектирование), тестировать и валидировать оборудование (Performance & Compatibility);
  • Активно участвовать в проектах по ML, координировать работы смежных команд, взаимодействовать с поставщиками, подрядчиками и ЦОД;
  • Администрировать кластеры GPU/TPU и распределенных вычислительных систем;
  • Заниматься мониторингом и отслеживанием состояния инфраструктуры;
  • Автоматизировать развертывания и обновления сервисов и рутинных операций;
  • Заниматься оптимизацией затрат на вычислительные ресурсы;
  • Заниматься поддержкой команды Data Science;
  • Вести техническую документацию по архитектуре и процессам, разрабатывать стандарты, best practice, подготавливать отчеты по состоянию инфраструктуры.

Вы нам подходите, если имеете следующий опыт:

  • Обеспечение стабильной, производительной и масштабируемой аппаратной платформы для ML;
  • Оперативное устранение сбоев, поддержка SLA, разработка проактивных мер по предотвращению инцидентов;
  • Выбор и закупка оборудования, составление ТЗ, (Техническое проектирование), тестирование и валидация оборудования (Performance & Compatibility);
  • Активное участие в проектах по ML, координация работ смежных команд, взаимодействие с поставщиками, подрядчиками и ЦОД;
  • Администрирование кластеров GPU/TPU и распределенных вычислительных систем;
  • Мониторинг и отслеживание состояние инфраструктуры;
  • Автоматизация развертывания и обновления сервисов и рутинных операций;
  • Оптимизация затрат на вычислительные ресурсы;
  • Поддержка команды Data Science;
  • Ведение технической документации по архитектуре и процессам, разработка стандартов, best practice, подготовка отчетов по состоянию инфраструктуры.

Будет плюсом:

  • Оптимизация затрат на вычислительные ресурсы;
  • Поддержка команды Data Science;
  • Ведение технической документации по архитектуре и процессам, разработка стандартов, best practice, подготовка отчетов по состоянию инфраструктуры.

Условия для сотрудников:

  • Обучение и развитие: языковые клубы, собственный корпоративный университет, программы развития управленческих навыков и многое другое;
  • Благополучие сотрудников: корпоративный пакет ДМС со стоматологией, корпоративный спорт, консультации психолога и дополнительные возможности аккредитованной IT-компании;
  • Множество сообществ: клуб спикеров, футбола, йоги, шахмат и т.д.;
  • Забота о семьях: создаем условия, в которых легко сочетать карьеру и заботу о близких – от гибкого подхода до масштабных проектов для детей сотрудников;
  • Скидки и партнерские программы: на обучение, страхование, покупки и многое другое;
  • Комфортная рабочая среда: бесплатное питание в офисе, современные офисы рядом с метро, корпоративная техника и портал для сотрудников.

Адрес: Россия, Москва, улица Большая Ордынка, 40с4
Показать на большой карте

Поделиться:

Опубликована 3 дня назад

Похожие вакансии

Функциональные обязанности: Управление инфраструктурой рабочих станций и серверов на базе ОС Linux с использованием SaltStack Установка и настройка ОС семейства Linux Администрирование систем виртуализации на базе oVirt. Администрирование системы рез...
  • Полный день
  • Опыт от 3 лет
Логотип компании Россети ЦифраРоссети Цифра
  • Москва
3 дня назад
Мы — Сколтех. Международный технологический университет новой модели. Внедряем новые технологии, разработанные на основе глубоких исследований. Готовим высококлассных специалистов по самым актуальным направлениям. Создаём новые компании и рабочие мес...
  • Полный день
  • Опыт от 3 лет
Логотип компании The Skolkovo Institute of Science and TechnologyThe Skolkovo Institute of Science and Technology
  • Москва
3 дня назад
Функциональные обязанности: Управление инфраструктурой рабочих станций и серверов на базе ОС Linux с использованием SaltStack Установка и настройка ОС семейства Linux Администрирование систем виртуализации на базе oVirt. Администрирование системы рез...
  • Полный день
  • Опыт от 3 лет
Логотип компании Россети ЦифраРоссети Цифра
  • Москва
3 дня назад
100 000 - 120 000 ₽
Обязанности: Техническое обслуживание и ремонт детских игровых (аркадных) аппаратов, включая профилактику неисправностей и проведение планового технического осмотра (56 игровых аппаратов); замена расходных материалов; калибровка; проведение инструкта...
  • Нестандартный график
  • Опыт от 3 лет
Логотип компании АркадаАркада
  • Москва
час назад
Предполагаемое место работы (на выбор): Завод ЭГГЕР в г. Шуя Ивановской области Завод ЭГГЕР в г. Гагарин Смоленской области Офис ЭГГЕР в г. Москва Основные задачи: Сотрудничество с сетевыми архитекторами группы для проектирования и реализации функцио...
  • Полный день
  • Опыт от 3 лет
Логотип компании ЭГГЕР ДРЕВПРОДУКТЭГГЕР ДРЕВПРОДУКТ
  • Москва
3 дня назад
Российский разработчик продуктов в области информационной безопасности ищет к себе в команду Старшего инженера. Мы — прогрессивная команда IT-специалистов в области разработки средств информационной безопасности, обработки и анализа данных, а также р...
  • Полный день
  • Опыт от 3 лет
Логотип компании NGRSOFTLABNGRSOFTLAB
  • Москва
день назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.