Data Scientist (NLP/ LLM)
По договоренности
- Авиамоторная
- Площадь Ильича
- Тургеневская
Центр «Технологии искусственного интеллекта» МГТУ им. Н.Э. Баумана приглашает на работу Data Scientist (NLP/ LLM).
На базе Центра ведется разработка масштабной высоконагруженной информационной платформы для крупного федерального заказчика, реализуются проекты коммерческой разработки, а также наукоемкие разработки с применением искусственного интеллекта.
Ваши задачи:
- Классификация и идентификация задач ИИ.
- Разработка математических моделей с применением различных методов машинного обучения.
- Исследования и разработка решений в различных областях ИИ: обработка естественного языка, рекомендательные системы и системы поддержки принятия решений, распознавание/синтез речи и др. Фокус на работу с большими языковыми моделями (LLM)
- Определение метрик качества построенных моделей, интерпретация результатов исследования/моделирования.
- Поиск специализированной информации в открытых источниках, документации, библиотеках и репозиториях.
Мы ожидаем от Вас:
- Высшее техническое образование в области ИТ и /или повышение квалификации в области Data Science.
- Знание классических алгоритмов машинного обучения и основных архитектур нейросетей.
- Опыт проектирования решений в сфере ИИ.
- Понимание архитектуры и принципов разработки приложений.
- Написание «чистого» программного кода.
- Уверенные знания в области построения алгоритмов ML и AI, понимание типов данных.
- Навыки предобработки и преобразования датасетов.
- Понимание архитектуры современных LLM, опыт работы с LLM, дообучение на специфичных данных
Технологический стек:
- Владение Python и основными ML-библиотеками (Pandas, Sklearn, Tensorflow, Keras, PyTorch, XGBoost или аналоги).
- Опыт работы с NLP-библиотеками: pymorphy2, NLTK, Gensim, spaCy, regexp.
- Опыт работы с LLM, prompt-engineering, fine-tuning.
- Опыт работы с Hugging Face Transformers.
- Опыт работы с векторными БД (Chroma или аналоги).
Приветствуется:
- Опыт научно-исследовательской деятельнсоти.
- Опыт работы с kafka, hadoop, spark, Flask, Docker.
- Знание сферы MLOps.
- SQL.
Мы предлагаем Вам:
- Работа в IT- Центре на базе МГТУ им. Н.Э. Баумана.
- Амбициозные и интересные задачи с достойным вознаграждением.
- Возможность дополнительного обучения по программам повышения квалификации.
- Оформление по ТК РФ.
- Полная занятость, гибридный график.
- Удобный офис в пешей доступности от станции метро Бауманская.
- Заработная плата обсуждается по результатам собеседования.
Адрес: Россия, Москва, 2-я Бауманская улица, 5с1
Опубликована 14 часов назад
Похожие вакансии
... прогнозов; Проектирование аналитических витрин данных; участие во внедрении AI-моделей; взаимодействие с data-инженерами ...
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Привет! Мы РегионКонсалт - меняем рынок взыскания с помощью технологий. Если тебе нравится находить закономерности в данных, строить математические и ML-модели и видеть, как твой код напрямую влияет на бизнес — нам по пути. О нас Мы не просто коллект...
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
Ищем Senior Data Scientist-ов в Блок «Люди и Культура» со специализацией в решении задач в области ИИ-агентов ... Будет плюсом: опыт работы со стеком Big Data (GreenPlum, Hadoop).
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
Сейчас мы находимся в поиске Data Scientist на проект финтеха. ... Требования к кандидату: Опыт от 2 лет в роли Data Scientist; Уверенный Python; LLM Expert: глубокое понимание ...
- Полный день
- Опыт от 3 лет
- Москва
7 дней назад
... математической статистики, алгоритмов классического ML и архитектур нейросетей опыт работы от 5 лет в роли Data ...
- Полный день
- Опыт от 3 лет
- Москва
14 часов назад