Инженер данных для ИИ

По договоренности

  • Беломорская
  • Речной вокзал
  • Водный стадион

Обязанности:

1. Разработка data-pipeline и инфраструктуры

  • Проектировать архитектуру обработки данных (batch / streaming)
  • Разрабатывать и поддерживать ETL/ELT-процессы
  • Обеспечивать надежную доставку данных в ML/LLM-системы
  • Развивать Data Lake / Data Warehouse
  • 2. Работа с данными для ML/LLM

  • Подготавливать датасеты для обучения, тестирования и инференса
  • Подготавливать данные для RAG (документы, базы знаний, тексты)
  • Выполнять очистку, нормализацию, дедупликацию и обогащение данных
  • Работать с неструктурированными данными (тексты, PDF, логи, аудио)
  • 3. Качество данных и валидация

  • Разрабатывать системы контроля качества данных (data quality)
  • Внедрять проверки в пайплайны (validation, schema checks)
  • Обеспечивать консистентность и целостность данных
  • Анализировать причины деградации качества данных
  • 4. Интеграция и работа с бизнесом

  • Интегрировать данные из ERP, CRM и других систем
  • Взаимодействовать с бизнес-подразделениями
  • Формализовывать и структурировать знания компании
  • Подготавливать документацию в формат, пригодный для ИИ
  • 5. Оптимизация и продакшен

  • Оптимизировать производительность обработки данных
  • Учитывать latency, throughput и стоимость обработки
  • Обеспечивать масштабируемость решений
  • Участвовать в эксплуатации data-сервисов в продакшене
  • 6. Data-процессы и воспроизводимость

  • Строить воспроизводимые пайплайны (данные + код + конфигурации)
  • Версионировать данные и процессы
  • Документировать архитектуру и data-flow
  • Обеспечивать стабильность data lifecycle

Ожидаем от вас знаний и опыта:

  • Архитектуры данных;
  • Data Lake / Data Warehouse;
  • Методов интеграции данных;
  • Подготовки данных для ML;
  • Контроля качества данных;
  • Основ распределенных систем;
  • Разработки data-pipeline;
  • ETL/ELT;
  • Очистки и трансформации данных;
  • Data quality систем;
  • Подготовки датасетов для ML/LLM;
  • Работа с Git;
  • Docker / CI/CD.

​​​Условия:

  • График работы гибридный (посещение офиса 2 дня в неделю);
  • Дополнительная ежеквартальная премия;
  • Оформление в соответствии с ТК РФ в IT аккредитованную компанию;
  • Кафетерий льгот на выбор (питание, спорт-карта, ДМС);
  • 10% скидки на покупки в магазинах, бонусы по корпоративной карте лояльности.

Адрес: Россия, Москва, Смольная, 14
Показать на большой карте

Поделиться:

Опубликована 21 день назад

Похожие вакансии

Нужны деньги до новой зарплаты? Кредитка Platinum от Т-Банка — до 1 000 000 ₽, 55 дней без %. Доставим сегодня бесплатно.
Получить карту
от 160 000 ₽
Выше средней на 22%
Обязанности: развитие, эксплуатация и диагностика сети передачи данных; обеспечение бесперебойной работы ... сети передачи данных; проведение плановых и аварийно-восстановительных работ на сети передачи данных ... оборудования и программных продуктов. взаимодействие с RIPE; Требования: знание технологий сетей передачи данных ...
  • Полный день
  • Опыт от 1 года
Логотип компании Диджитал НетворкДиджитал Нетворк
  • Москва
2 дня назад
Обязанности: Разработка и поддержка платформ данных; исследование инструментов работы с данными; организация ... Требования: Глубокое понимание big-data стека, принципов рапределенной и стриминговой (Flink) обработки данных ...
  • Полный день
  • Опыт от 1 года
Логотип компании ЗвукЗвук
  • Москва
7 дней назад
... вклад в исторические транспортные проекты России — приглашаем вас присоединиться к нашей команде в роли инженер ... данных! ... схем баз данных (звезда, снежинка); настраивать обмен данных с хранилищем через ETL-процессы; поддерживать ...
  • Полный день
  • Опыт от 1 года
Логотип компании МетрогипротрансМетрогипротранс
  • Москва
8 дней назад
Наши решения позволяют работать с большими объёмами данных, быстро получать информацию, автоматизировать ... принятие управленческих решений и осуществлять опережающее управление на основе данных. ... Обязанности: поддерживать работоспособность ПО Витрин данных в выделенной инфраструктуре ЦОД; производить ...
  • Частичная занятость
  • Опыт от 1 года
Логотип компании РТК-СОФТРТК-СОФТ
  • Москва
3 дня назад
... в реальном времени, а также хранение и управление большими объемами данных в ЦОД, публичных и частных ... Мы находимся в поиске Инженера по продукту СХД готового присоединиться к нашей динамичной команде, специализирующейся ... в области разработки, тестирования и поддержки систем хранения данных.
  • Полный день
  • Опыт от 1 года
Логотип компании QTECHQTECH
  • Москва
2 дня назад
В связи с расширением приглашаем в команду ИТ Инженера баз данных. ... Ключевая задача: спроектировать и реализовать надёжный пайплайн данных из корпоративной PostgreSQL или ... Понимание основ информационной безопасности при передаче данных.
  • Полный день
  • Опыт от 1 года
Логотип компании ПРАВОКАРД - мультисервисная платформаПРАВОКАРД - мультисервисная платформа
  • Москва
14 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.