Инженер данных для ИИ
По договоренности
- Беломорская
- Речной вокзал
- Водный стадион
Обязанности:
1. Разработка data-pipeline и инфраструктуры
- Проектировать архитектуру обработки данных (batch / streaming)
- Разрабатывать и поддерживать ETL/ELT-процессы
- Обеспечивать надежную доставку данных в ML/LLM-системы
- Развивать Data Lake / Data Warehouse
-
2. Работа с данными для ML/LLM
- Подготавливать датасеты для обучения, тестирования и инференса
- Подготавливать данные для RAG (документы, базы знаний, тексты)
- Выполнять очистку, нормализацию, дедупликацию и обогащение данных
- Работать с неструктурированными данными (тексты, PDF, логи, аудио)
-
3. Качество данных и валидация
- Разрабатывать системы контроля качества данных (data quality)
- Внедрять проверки в пайплайны (validation, schema checks)
- Обеспечивать консистентность и целостность данных
- Анализировать причины деградации качества данных
-
4. Интеграция и работа с бизнесом
- Интегрировать данные из ERP, CRM и других систем
- Взаимодействовать с бизнес-подразделениями
- Формализовывать и структурировать знания компании
- Подготавливать документацию в формат, пригодный для ИИ
-
5. Оптимизация и продакшен
- Оптимизировать производительность обработки данных
- Учитывать latency, throughput и стоимость обработки
- Обеспечивать масштабируемость решений
- Участвовать в эксплуатации data-сервисов в продакшене
-
6. Data-процессы и воспроизводимость
- Строить воспроизводимые пайплайны (данные + код + конфигурации)
- Версионировать данные и процессы
- Документировать архитектуру и data-flow
- Обеспечивать стабильность data lifecycle
Ожидаем от вас знаний и опыта:
- Архитектуры данных;
- Data Lake / Data Warehouse;
- Методов интеграции данных;
- Подготовки данных для ML;
- Контроля качества данных;
- Основ распределенных систем;
- Разработки data-pipeline;
- ETL/ELT;
- Очистки и трансформации данных;
- Data quality систем;
- Подготовки датасетов для ML/LLM;
- Работа с Git;
- Docker / CI/CD.
Условия:
- График работы гибридный (посещение офиса 2 дня в неделю);
- Дополнительная ежеквартальная премия;
- Оформление в соответствии с ТК РФ в IT аккредитованную компанию;
- Кафетерий льгот на выбор (питание, спорт-карта, ДМС);
- 10% скидки на покупки в магазинах, бонусы по корпоративной карте лояльности.
Адрес: Россия, Москва, Смольная, 14
Опубликована 21 день назад
Похожие вакансии
Нужны деньги до новой зарплаты? Кредитка Platinum от Т-Банка — до 1 000 000 ₽, 55 дней без %. Доставим сегодня бесплатно.
Получить картуот 160 000 ₽
Выше средней на 22%
Обязанности: развитие, эксплуатация и диагностика сети передачи данных; обеспечение бесперебойной работы ... сети передачи данных; проведение плановых и аварийно-восстановительных работ на сети передачи данных ... оборудования и программных продуктов. взаимодействие с RIPE; Требования: знание технологий сетей передачи данных ...
- Полный день
- Опыт от 1 года
- Москва
2 дня назад
Обязанности: Разработка и поддержка платформ данных; исследование инструментов работы с данными; организация ... Требования: Глубокое понимание big-data стека, принципов рапределенной и стриминговой (Flink) обработки данных ...
- Полный день
- Опыт от 1 года
- Москва
7 дней назад
... вклад в исторические транспортные проекты России — приглашаем вас присоединиться к нашей команде в роли инженер ... данных! ... схем баз данных (звезда, снежинка); настраивать обмен данных с хранилищем через ETL-процессы; поддерживать ...
- Полный день
- Опыт от 1 года
- Москва
8 дней назад
Наши решения позволяют работать с большими объёмами данных, быстро получать информацию, автоматизировать ... принятие управленческих решений и осуществлять опережающее управление на основе данных. ... Обязанности: поддерживать работоспособность ПО Витрин данных в выделенной инфраструктуре ЦОД; производить ...
- Частичная занятость
- Опыт от 1 года
- Москва
3 дня назад
... в реальном времени, а также хранение и управление большими объемами данных в ЦОД, публичных и частных ... Мы находимся в поиске Инженера по продукту СХД готового присоединиться к нашей динамичной команде, специализирующейся ... в области разработки, тестирования и поддержки систем хранения данных.
- Полный день
- Опыт от 1 года
- Москва
2 дня назад
В связи с расширением приглашаем в команду ИТ Инженера баз данных. ... Ключевая задача: спроектировать и реализовать надёжный пайплайн данных из корпоративной PostgreSQL или ... Понимание основ информационной безопасности при передаче данных.
- Полный день
- Опыт от 1 года
- Москва
14 дней назад
Вакансия в подборках
Похожие вакансии
от 160 000 ₽