Data Engineer
По договоренности
- Смоленская
- Киевская
- Парк Победы
Velpharm Group – это ведущий игрок в фармацевтической индустрии, специализирующийся на разработке, производстве и дистрибуции лекарственных средств.
Мы стремимся к инновациям и улучшению качества жизни людей по всему миру.
вакансия: Data Engineer
Чем необходимо будет заниматься:
- Проектирование и оптимизация хранилищ данных: создание и настройка схем баз данных для PostgreSQL, MS SQL и ClickHouse, включая партиционирование, кластеризацию и индексацию для повышения производительности.
- Разработка и поддержка ETL-процессов: создание пайплайнов для извлечения, трансформации и загрузки данных с использованием AirFlow (настройка DAG, зависимостей, ретраев) и Kafka для потоковой обработки. Проектировать и реализовывать ETL-слои для информационных потоков.
- Интеграция данных: подключение к различным источникам (API, FTP, S3), обработка и загрузка данных в целевые хранилища.
- Оптимизация запросов: написание и оптимизация SQL-запросов с использованием оконных функций, CTE, JOIN и других конструкций, анализ планов выполнения (EXPLAIN).
- Мониторинг и обеспечение надёжности: настройка алертов, логирование, тестирование пайплайнов, обеспечение отказоустойчивости и масштабируемости систем.
- Работа с инструментами: использование Python для скриптов, dbt для декларативных SQL-трансформаций, настройка интеграций с внешними системами.
- Управление данными и их качеством: Разработка метрик и автоматизированных проверок качества данных (например, выявление дубликатов, аномалий, несогласованных форматов). Внедрение процедур очистки, нормализации и преобразования данных на этапах ETL. Участие в создании стандартов хранения данных (Data Governance), включая классификацию, метаданные, политики доступа и сроки хранения.
- Архитектурное проектирование: Проектирование и поддержка архитектуры хранилищ данных (Data Warehouse / Data Lake) на базе PostgreSQL, ClickHouse. Оптимизация структур данных в ClickHouse (выбор движков таблиц, партиционирование, TTL, репликация). Выбор и реализация процедур инкрементальной загрузки данных из источников. Построение звездных/снежинковых схем для аналитических отчетов и дашбордов. Интеграция с ClickHouse для обеспечения гибкости анализа (например, через внешние таблицы или промежуточные слои).
- Поддержка аналитических процессов: Создание витрин данных (Data Marts) для аналитиков, актуариев и менеджеров. Оптимизация SQL-запросов в ClickHouse для работы с высоконагруженными сценариями (например, расчет резервов убытков, моделирование рисков). Автоматизация регулярной отчетности в части подготовки данных (ежедневные/ежемесячные дашборды для руководства).
Требования к кандидату
- Опыт работы с СУБД: глубокие знания PostgreSQL и MS SQL, понимание особенностей ClickHouse (например, колоночной архитектуры, оптимизации для аналитических запросов).
- Навыки работы с инструментами: практический опыт использования AirFlow для оркестрации пайплайнов, Kafka для потоковой передачи данных.
- Программирование: владение Python (обязателен), желательно знание Scala или Java для работы с распределёнными системами.
- Знание ETL-процессов: понимание принципов извлечения, трансформации и загрузки данных, опыт построения сложных пайплайнов
- Опыт с распределёнными системами: понимание принципов работы Hadoop, Spark (желательно).
- Soft skills: системное мышление, коммуникативные навыки, умение работать в команде, аналитическое мышление.
Дополнительные преимущества
- Опыт работы с облачными платформами (AWS, GCP, Azure).
- Знание принципов Data Governance и управления качеством данных.
- Опыт работы с CI/CD и контейнеризацией (Docker, Kubernetes).
- Понимание бизнес-процессов и умение переводить бизнес-требования в технические решения.
Условия работы
- Формат: полный рабочий день.
- Уровень: Junior/Middle/Senior
-
оформление по ТК РФ с первого дня; офис- Москва-Сити, башня Федерация;
-
график работы: 5/2 (гибрид, удаленный формат обсуждается);
-
корпоративное обучение, возможность профессионального роста;
-
частичная компенсация питания.
Присоединяйтесь к Velpharm Group – будущее фармацевтики начинается здесь!
Адрес: Россия, Москва, Пресненская набережная, 12
Опубликована 3 часа назад
Похожие вакансии
Лига в поисках Data Engineer'а на проект российской продуктовой компании в команду проектирования платформы потоковой обработки данных. Твои задачи: Разрабатывать и модифицировать интеграции в разрезе источников; Развивать и поддерживать информационн...
- Можно удаленно
- Полный день
- Опыт от 1 года
- Москва
3 часа назад
Чем предстоит заниматься: Разработка ETL/ELT пайплайнов по спецификациям от Lead/Senior инженеров Настройка интеграций с источниками данных Разработка SQL-трансформаций и витрин данных Поддержка и мониторинг существующих пайплайнов Участие в тестиров...
- Можно удаленно
- Полный день
- Опыт от 1 года
- Москва
3 дня назад
Мы ищем Data engineer на финтех. проект. Чем предстоит заниматься: Проводить анализ существующих процедур, улучшать качество кода путем рефакторинга, выявлять источники необходимой информации. Проектировать логическую структуру базы данных. Проектиро...
- Можно удаленно
- Полный день
- Опыт от 1 года
- Москва
6 дней назад
Magnit Omni ищет ML Engineer / Senior Data Scientist Мы развиваем персонализацию для миллионов клиентов. Огромный масштаб, мощные данные и прямое влияние на пользовательский опыт — всё это о нашей команде что предстоит делать Строить uplift-модели и ...
- Можно удаленно
- Полный день
- Опыт от 1 года
- Москва
7 часов назад
Чем предстоит заниматься: Сопровождение и анализ существующих процессов загрузки Мониторинг процессов загрузки и выявление аномалий Тестирование и установка доработок в продуктивный контур Разбор обращений пользователей в рамках компетенций второй ли...
- Можно удаленно
- Полный день
- Опыт от 1 года
- Москва
4 часа назад