Data Scientist / Machine Learning Engineer (специалист по машинному обучению и большим данным)
По договоренности
Требования:
- глубокое понимание теоретических основ машинного обучения, математической статистики и методов оптимизации;
- свободное владение Python и основными библиотеками для data science: * ML-фреймворки: Scikit-Learn, XGBoost/LightGBM/CatBoost * Глубокое обучение: PyTorch и/или TensorFlow * Обработка данных: Pandas, NumPy, Polars;
- опыт работы с большими данными (BigData): * Обработка: Apache Spark (PySpark), Hadoop (HDFS) * Аналитические СУБД: ClickHouse или аналоги (Vertica, Greenplum);
- опыт построения и поддержки ML-пайплайнов с использованием оркестраторов: Airflow, Dagster, Prefect или аналоги;
- понимание принципов контейнеризации и оркестрации (Docker, Kubernetes);
- опыт работы с инструментами для визуализации данных: Tableau, Power BI, Yandex DataLens или аналоги;
-
экспертиза в области Machine Learning & AI;
- практический опыт реализации проектов в ключевых domains: * Классическое ML (регрессия, классификация, кластеризация) * Обработка естественного языка (NLP) * Компьютерное зрение (Computer Vision);
- понимание архитектурных принципов построения современных GenAI-решений, включая работу с LLM (Large Language Models) и паттернами RAG (Retrieval-Augmented Generation);
- опыт работы с геологическими, геофизическими данными или данными дистанционного зондирования Земли (ДЗЗ);
- знание открытых и корпоративных источников и баз геологических данных является значительным преимуществом;
- наличие успешного опыта внедрения корпоративных AI/ML-решений «под ключ» в нефтегазовой, геологоразведочной или смежных областях;
- опыт работы с облачными платформами (Yandex Cloud, AWS, GCP, Azure) и их ML-сервисами;
- умение доносить сложные технические концепции до нетехнических специалистов.
Обязанности:
- разработка, обучение, тестирование и производственная оптимизация моделей машинного обучения для анализа геолого-геофизических данных;
- создание и внедрение end-to-end ML-сервисов и пайплайнов обработки данных;
- полный цикл разработки AI/ML-решений: от исследования и прототипирования до внедрения в production и мониторинга;
- разработка и поддержка ML-инфраструктуры и платформенных решений для геологического отдела;
- глубокий анализ больших объемов данных, написание и поддержка эффективных скриптов на Python и SQL;
- исследование и экспериментирование с новыми подходами и техниками в области искусственного интеллекта для решения бизнес-задач.
Условия:
- работа в офисе (ЦАО), пешая доступность от метро;
- трудоустройство в соответствии с ТК РФ;
- корпоративные льготы: новогодние детские подарки, программы лояльности от партнеров, материальная поддержка сотрудников в различных жизненных ситуациях;
- культурные мероприятия: тимбилдинги, день работника нефтяной и газовой промышленности, конкурсы для детей сотрудников, Новый год;
- программы заботы о здоровье: ДМС со стоматологией для сотрудника и детей, льготное страхование для родственников, дистанционные (телемедицинские) онлайн-консультации врачей.
Опубликована 24 дня назад
Похожие вакансии
О команде и задаче: Мы создаем технологии беспилотного вождения. У нас накоплены петабайты данных с проездов, которые нужно превратить в полезный датасет для обучения. Твоя задача — не просто сидеть в Jupyter, а построить «фабрику» по автоматической ...
- Полный день
- Опыт от 5 лет
- Москва
7 дней назад
... и исследованиями в области искусственного интеллекта, нейронных сетей и машинного обучения в поиске Machine ... Learning Engineer.
- Полный день
- Опыт от 5 лет
- Москва
17 дней назад
О команде: Планирование движения автономного автомобиля и предсказание движения всех участников вокруг него - это сложная и крайне важная задача, учитывающая множество факторов. Качественно планируя и предугадывая будущее такой автомобиль сможет обес...
- Полный день
- Опыт от 5 лет
- Москва
7 дней назад
... другие) для оптимизации вычислительных графов совместная работа с командами CUDA operators и Distributed Learning ...
- Полный день
- Опыт от 5 лет
- Москва
9 дней назад
МТТЕХ - центр разработки Московского транспорта. Мы создаём ИТ-решения, которыми ежедневно пользуются миллионы пассажиров: от оплаты и планирования маршрутов до беспилотного трамвая Наш технологический стек: S3 / S3-compatible storage Trino Parquet S...
- Полный день
- Опыт от 5 лет
- Москва
3 дня назад