Data engineer

По договоренности

Москва

Наша команда занимается генеративной аналитикой и исследованиями того, как лучше решать существующие задачи с помощью RAG.

Вы будете: заниматься поиском и внедрением передовых подходов к работе с данными с использованием ИИ. Исследовать, как применение передовых фреймворков для работы с RAG и LLM в целом влияет на результат. Создавать и поддерживать эффективные ETL-пайплайны, чтобы поставлять в систему свежие данные для работы с ними с помощью RAG. Предлагать улучшения и варианты оптимизации существующей инфраструктуры, чтобы работать еще быстрее и с бóльшим количеством данных.

Обязанности

разрабатывать и настраивать механизмы для автоматизированного сбора данных, обеспечивать корректность и полноту сбора, оптимизировать процессы таким образом, чтобы все работало быстрее и без ручного вмешательства
разрабатывать пайплайны для предобработки данных и преобразовывать их в формат, оптимальный для дальнейшего хранения, обработки и использования для RAG
проектировать и реализовывать хранилища, которые позволили бы эффективно решать задачи, связанные с RAG
применять машинное обучение и искусственный интеллект для улучшения результатов работы, поддерживать корректную работу системы – мониторинг, диагностика и устранение неполадок, исправление старых багов.

Требования

умение проектировать DWH, Data Lake, Data Management Platform
опыт построения и развития высоконагруженных систем
опыт разработки и оптимизации пайплайнов (batch, streaming) для обработки больших объемов данных (100TB - 1PB+)
продвинутый уровень владения Python и SQL
опыт работы с движками для распределенной обработки данных (Spark, Trino)
опыт работы с очередями сообщений (Kafka, RabbitMQ)
опыт работы с MPP базами данных и понимание их внутреннего устройства (ClickHouse, Greenplum, Vertica)
базовые навыки DevOps (Docker, Kubernetes, Ansible, Terraform, CI/CD
навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом
опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов
инструментальное владение AI для анализа, генерации и автоматизации.

Условия

комфортный современный офис рядом с м. Кутузовская
гибридный формат работы
ежегодный пересмотр зарплаты, годовая премия
корпоративный спортзал и зоны отдыха
система обучения для профессионального и карьерного развития
расширенный полис ДМС с первого дня работы и страхование для семьи
программа ипотеки для сотрудников
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
вознаграждение за рекомендацию друзей в команду Сбера.

Откликнуться

Опубликована 11 часов назад

Data Engineer

В связи с активным развитием проектов в компании открыта вакансия DATA ENGINEER в офис в Москве.

Полный день
Опыт от 3 лет

ИЦ АЙ-ТЕКО

Москва

2 дня назад

Откликнуться

Senior Data Engineer

... основная часть которых представляет собой разработку развлекательных онлайн-сервисов, находится в поиске Data ... Engineer!

Полный день
Опыт от 3 лет

Employcity

Москва

11 часов назад

Откликнуться

Data Engineer (SafeHub)

Ищем Data Engineer c уклоном в Data Science, которому предстоит заниматься извлечением, подготовкой и ... Мы предлагаем карьерный рост как в Data Engineering, так и в Data Science направлениях. ... Требования высшее образование опыт работы от 2х лет в роли Data Engineer, Data Analyst или ETL-разработчика ...