Инженер данных для ИИ
По договоренности
- Беломорская
- Речной вокзал
- Водный стадион
Обязанности:
1. Разработка data-pipeline и инфраструктуры
- Проектировать архитектуру обработки данных (batch / streaming)
- Разрабатывать и поддерживать ETL/ELT-процессы
- Обеспечивать надежную доставку данных в ML/LLM-системы
- Развивать Data Lake / Data Warehouse
-
2. Работа с данными для ML/LLM
- Подготавливать датасеты для обучения, тестирования и инференса
- Подготавливать данные для RAG (документы, базы знаний, тексты)
- Выполнять очистку, нормализацию, дедупликацию и обогащение данных
- Работать с неструктурированными данными (тексты, PDF, логи, аудио)
-
3. Качество данных и валидация
- Разрабатывать системы контроля качества данных (data quality)
- Внедрять проверки в пайплайны (validation, schema checks)
- Обеспечивать консистентность и целостность данных
- Анализировать причины деградации качества данных
-
4. Интеграция и работа с бизнесом
- Интегрировать данные из ERP, CRM и других систем
- Взаимодействовать с бизнес-подразделениями
- Формализовывать и структурировать знания компании
- Подготавливать документацию в формат, пригодный для ИИ
-
5. Оптимизация и продакшен
- Оптимизировать производительность обработки данных
- Учитывать latency, throughput и стоимость обработки
- Обеспечивать масштабируемость решений
- Участвовать в эксплуатации data-сервисов в продакшене
-
6. Data-процессы и воспроизводимость
- Строить воспроизводимые пайплайны (данные + код + конфигурации)
- Версионировать данные и процессы
- Документировать архитектуру и data-flow
- Обеспечивать стабильность data lifecycle
Ожидаем от вас знаний и опыта:
- Архитектуры данных;
- Data Lake / Data Warehouse;
- Методов интеграции данных;
- Подготовки данных для ML;
- Контроля качества данных;
- Основ распределенных систем;
- Разработки data-pipeline;
- ETL/ELT;
- Очистки и трансформации данных;
- Data quality систем;
- Подготовки датасетов для ML/LLM;
- Работа с Git;
- Docker / CI/CD.
Условия:
- График работы гибридный (посещение офиса 2 дня в неделю);
- Дополнительная ежеквартальная премия;
- Оформление в соответствии с ТК РФ в IT аккредитованную компанию;
- Кафетерий льгот на выбор (питание, спорт-карта, ДМС);
- 10% скидки на покупки в магазинах, бонусы по корпоративной карте лояльности.
Адрес: Россия, Москва, Смольная, 14
Опубликована 8 часов назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX до 200 000 ₽
Выше средней на 53%
... центре обеспечения развития строительной отрасли (ГБУ "Мосстройразвитие") открыта вакансия ведущего инженера-проектировщика ... баз данных Организация является учреждением, реализующим и координирующим решение вопросов аналитического ... с интеграцией ИИ-алгоритмов Сопровождение базы данных PostgreSQL Осуществление мониторинга данных на ...
- Полный день
- Опыт от 1 года
- Москва
7 часов назад
Каждый день мы обрабатываем сотни терабайт данных для проведения исследований, АВ-экспериментов, обучения ... Вам предстоит: Погружаться в данные, их природу, качество и способ поставки; Взаимодействовать от лица ... команды с платформой данных для организации транспорта и интеграций; Отвечать за качество данных, на ...
- Полный день
- Опыт от 1 года
- Москва
8 часов назад
... разрабатываем аналитические системы на базе единой платформы, которые позволяют безопасно работать с данными ... Она обеспечивает высокий уровень потоковой обработки и хранения данных, управления доступом и метаданными ... Обязанности: Проведение тестирования различных компонентов продукта (витрины данных, внешние и внутренние ...
- Полный день
- Опыт от 1 года
- Москва
7 часов назад
... данных, улучшению архитектуры и обучению пользователей инструментам и практикам управления данными Мы ... концептуальных, логических и физических моделей данных Опыт описания источников данных и разработки ... правил проверки качества данных Опыт работы с BI-инструментами и системами управления данными Уверенные ...
- Полный день
- Опыт от 1 года
- Москва
8 часов назад
В задачи на данной позиции будет входить: Обеспечение бесперебойной работы корпоративной инфраструктуры ... сетей передачи данных: Устранение неисправностей и решение проблем с сетью.
- Полный день
- Опыт от 1 года
- Москва
7 дней назад
Вакансия в подборках
Похожие вакансии
до 200 000 ₽