Data Scientist
По договоренности
Мы создаем технологии автономного вождения. У нас накоплены петабайты данных с проездов, которые нужно превратить в полезный датасет для обучения. Твоя задача — не просто сидеть в Jupyter, а провести анализ и реализовать пайплайны для тегирования сложных дорожных ситуаций.
Чем предстоит заниматься:
- Разработка пайплайнов и эвристик: разработка пайплайнов с использованием методов математической статистики, ML/DL, CV, LLM/VLM и программирования (Python, SQL) для тегирования данных;
- Пайплайны обработки данных: Оборачивание разработанных алгоритмов обработки в воспроизводимые пайплайны для массовой обработки исторических и новых данных (Dagster);
- Работа с данными: Организация эффективного чтения/записи результатов в S3, версионирование экспериментов и датасетов через ClearML.
Что мы ждем от кандидата:
Python & ML Core & CV:
- Отличное знание Python, PyTorch;
- База по Computer Vision (детектирование, сегментация, трекинг объектов).
Работа с данными: - Опыт обработки больших объёмов данных: pandas, numpy, Scikit-learn, XGBoost, SQL или аналоги;
- Опыт использования библиотек визуализации (Matplotlib, Seaborn);
- Умение работать с Docker.
Инструментарий: - Опыт работы с системами трекинга экспериментов (ClearML / MLFlow);
- Опыт работы с оркестраторами: Dagster;
- JupyterHub, как среда для прототипирования.
Будет плюсом:
- ML: Понимание архитектур трансформеров и опыт работы с LLM / VLM (CLIP, LLaVA, GPT-4V API или open-source аналоги);
- Опыт в Autonomous Driving: Понимание сенсорики (Lidar, Radar, Camera) и специфики данных (rosbag, pcap и т.д.);
- Data Engineering: Опыт работы с Spark для препроцессинга данных, ClickHouse/Metabase для поиска и записи данных.
Адрес: Россия, Москва, проспект Андропова, 10А
Опубликована 22 дня назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX Приглашаем Data Scientist в нашу команду Мы ищем специалиста, который поможет нам оптимизировать ключевые ... Опыт работы на позиции Data Scientist (Machine Learning или Deep Learning Engineer) от 3-4 лет.
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
... прогнозов; Проектирование аналитических витрин данных; участие во внедрении AI-моделей; взаимодействие с data-инженерами ...
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
Мы - команда из 9 человек (DA, DS, Dev), занимаемся полным циклом разработки, внедрения и оценки эффекта от AI для сети отделений Сбера в процессах управления рисками. Ключевое направление – развитие Copilot-а для сотрудника банка (виртуального ассис...
- Полный день
- Опыт от 3 лет
- Москва
час назад
Команда Sberspace ищет Data Scientist для работы над проектом по созданию поискового AI-ассистента, который ...
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
Основные задачи: Работа с данными (очистка данных, исследование, feature engineering) Выдвижение и проверка гипотез Обсуждение задачи с бизнес заказчиками Разработка прогнозных моделей машинного обучения на основе табличных данных (прогноз продаж, пр...
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
Мы разрабатываем и внедряем сложные ML-решения для автоматизации и интеллектуальной аналитики в сфере автоиндустрии. Ваши модели будут напрямую влиять на ключевые бизнес-процессы и приниматься миллионами пользователей. Обязанности выявление бизнес-по...
- Полный день
- Опыт от 3 лет
- Москва
день назад