Data Scientist (NLP/ LLM)
По договоренности
- Авиамоторная
- Площадь Ильича
- Тургеневская
Центр «Технологии искусственного интеллекта» МГТУ им. Н.Э. Баумана приглашает на работу Data Scientist (NLP/ LLM).
На базе Центра ведется разработка масштабной высоконагруженной информационной платформы для крупного федерального заказчика, реализуются проекты коммерческой разработки, а также наукоемкие разработки с применением искусственного интеллекта.
Ваши задачи:
- Классификация и идентификация задач ИИ.
- Разработка математических моделей с применением различных методов машинного обучения.
- Исследования и разработка решений в различных областях ИИ: обработка естественного языка, рекомендательные системы и системы поддержки принятия решений, распознавание/синтез речи и др. Фокус на работу с большими языковыми моделями (LLM)
- Определение метрик качества построенных моделей, интерпретация результатов исследования/моделирования.
- Поиск специализированной информации в открытых источниках, документации, библиотеках и репозиториях.
Мы ожидаем от Вас:
- Высшее техническое образование в области ИТ и /или повышение квалификации в области Data Science.
- Знание классических алгоритмов машинного обучения и основных архитектур нейросетей.
- Опыт проектирования решений в сфере ИИ.
- Понимание архитектуры и принципов разработки приложений.
- Написание «чистого» программного кода.
- Уверенные знания в области построения алгоритмов ML и AI, понимание типов данных.
- Навыки предобработки и преобразования датасетов.
- Понимание архитектуры современных LLM, опыт работы с LLM, дообучение на специфичных данных
Технологический стек:
- Владение Python и основными ML-библиотеками (Pandas, Sklearn, Tensorflow, Keras, PyTorch, XGBoost или аналоги).
- Опыт работы с NLP-библиотеками: pymorphy2, NLTK, Gensim, spaCy, regexp.
- Опыт работы с LLM, prompt-engineering, fine-tuning.
- Опыт работы с Hugging Face Transformers.
- Опыт работы с векторными БД (Chroma или аналоги).
Приветствуется:
- Опыт научно-исследовательской деятельнсоти.
- Опыт работы с kafka, hadoop, spark, Flask, Docker.
- Знание сферы MLOps.
- SQL.
Мы предлагаем Вам:
- Работа в IT- Центре на базе МГТУ им. Н.Э. Баумана.
- Амбициозные и интересные задачи с достойным вознаграждением.
- Возможность дополнительного обучения по программам повышения квалификации.
- Оформление по ТК РФ.
- Полная занятость, гибридный график.
- Удобный офис в пешей доступности от станции метро Бауманская.
- Заработная плата обсуждается по результатам собеседования.
Адрес: Россия, Москва, 2-я Бауманская улица, 5с1
Опубликована 24 дня назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX ... прогнозов; Проектирование аналитических витрин данных; участие во внедрении AI-моделей; взаимодействие с data-инженерами ...
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
... базы знаний Мы ждём от тебя: Опыт коммерческой разработки от 3 лет в области прикладного ML/NLP или Data ...
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
Реализуем стратегический проект Блока по созданию Цифровых двойников компаний. Мы строим систему поддержки принятия решений в бизнесе корпоративных клиентов на основе мультиагентной GenAI-архитектуры. Ключевая задача - понять, какие факторы действите...
- Полный день
- Опыт от 3 лет
- Москва
12 часов назад
Дивизион "Моделирование и исследование данных" отвечает за компетенцию Data Science в Блоке. ... Сейчас мы ищем в команду Data Scientist’а.
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
Мы в поиске специалистов по Data Science уровня Middle+/Senior для совместной работы с нашими консультантами ...
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
400 000 - 500 000 ₽
Выше средней на 103%
Ищем в команду Data Scientist, который умеет доводить такие системы до результата — через корректное ...
- Полный день
- Опыт от 3 лет
- Москва
12 часов назад