Инженер данных для ИИ

По договоренности

  • Беломорская
  • Речной вокзал
  • Водный стадион

Обязанности:

1. Разработка data-pipeline и инфраструктуры

  • Проектировать архитектуру обработки данных (batch / streaming)
  • Разрабатывать и поддерживать ETL/ELT-процессы
  • Обеспечивать надежную доставку данных в ML/LLM-системы
  • Развивать Data Lake / Data Warehouse
  • 2. Работа с данными для ML/LLM

  • Подготавливать датасеты для обучения, тестирования и инференса
  • Подготавливать данные для RAG (документы, базы знаний, тексты)
  • Выполнять очистку, нормализацию, дедупликацию и обогащение данных
  • Работать с неструктурированными данными (тексты, PDF, логи, аудио)
  • 3. Качество данных и валидация

  • Разрабатывать системы контроля качества данных (data quality)
  • Внедрять проверки в пайплайны (validation, schema checks)
  • Обеспечивать консистентность и целостность данных
  • Анализировать причины деградации качества данных
  • 4. Интеграция и работа с бизнесом

  • Интегрировать данные из ERP, CRM и других систем
  • Взаимодействовать с бизнес-подразделениями
  • Формализовывать и структурировать знания компании
  • Подготавливать документацию в формат, пригодный для ИИ
  • 5. Оптимизация и продакшен

  • Оптимизировать производительность обработки данных
  • Учитывать latency, throughput и стоимость обработки
  • Обеспечивать масштабируемость решений
  • Участвовать в эксплуатации data-сервисов в продакшене
  • 6. Data-процессы и воспроизводимость

  • Строить воспроизводимые пайплайны (данные + код + конфигурации)
  • Версионировать данные и процессы
  • Документировать архитектуру и data-flow
  • Обеспечивать стабильность data lifecycle

Ожидаем от вас знаний и опыта:

  • Архитектуры данных;
  • Data Lake / Data Warehouse;
  • Методов интеграции данных;
  • Подготовки данных для ML;
  • Контроля качества данных;
  • Основ распределенных систем;
  • Разработки data-pipeline;
  • ETL/ELT;
  • Очистки и трансформации данных;
  • Data quality систем;
  • Подготовки датасетов для ML/LLM;
  • Работа с Git;
  • Docker / CI/CD.

​​​Условия:

  • График работы гибридный (посещение офиса 2 дня в неделю);
  • Дополнительная ежеквартальная премия;
  • Оформление в соответствии с ТК РФ в IT аккредитованную компанию;
  • Кафетерий льгот на выбор (питание, спорт-карта, ДМС);
  • 10% скидки на покупки в магазинах, бонусы по корпоративной карте лояльности.

Адрес: Россия, Москва, Смольная, 14
Показать на большой карте

Поделиться:

Опубликована 8 часов назад

Похожие вакансии

до 200 000 ₽
Выше средней на 53%
... центре обеспечения развития строительной отрасли (ГБУ "Мосстройразвитие") открыта вакансия ведущего инженера-проектировщика ... баз данных Организация является учреждением, реализующим и координирующим решение вопросов аналитического ... с интеграцией ИИ-алгоритмов Сопровождение базы данных PostgreSQL Осуществление мониторинга данных на ...
  • Полный день
  • Опыт от 1 года
Логотип компании Среда ВозможностейСреда Возможностей
  • Москва
7 часов назад
Каждый день мы обрабатываем сотни терабайт данных для проведения исследований, АВ-экспериментов, обучения ... Вам предстоит: Погружаться в данные, их природу, качество и способ поставки; Взаимодействовать от лица ... команды с платформой данных для организации транспорта и интеграций; Отвечать за качество данных, на ...
  • Полный день
  • Опыт от 1 года
Логотип компании OzonOzon
  • Москва
8 часов назад
... разрабатываем аналитические системы на базе единой платформы, которые позволяют безопасно работать с данными ... Она обеспечивает высокий уровень потоковой обработки и хранения данных, управления доступом и метаданными ... Обязанности: Проведение тестирования различных компонентов продукта (витрины данных, внешние и внутренние ...
  • Полный день
  • Опыт от 1 года
Логотип компании КриптонитКриптонит
  • Москва
7 часов назад
... данных, улучшению архитектуры и обучению пользователей инструментам и практикам управления данными Мы ... концептуальных, логических и физических моделей данных Опыт описания источников данных и разработки ... правил проверки качества данных Опыт работы с BI-инструментами и системами управления данными Уверенные ...
  • Полный день
  • Опыт от 1 года
Логотип компании МарсМарс
  • Москва
8 часов назад
В задачи на данной позиции будет входить: Обеспечение бесперебойной работы корпоративной инфраструктуры ... сетей передачи данных: Устранение неисправностей и решение проблем с сетью.
  • Полный день
  • Опыт от 1 года
Логотип компании РостелекомРостелеком
  • Москва
7 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.