Data Scientist в области языковых моделей (Middle)

от 351 000 ₽

Выше средней на 30%
  • Автозаводская
  • Шаболовская
  • Ленинский проспект

Мы, команда компании «ИНИТИ», предлагаем специалистам по профилю «Data Scientist в области языковых моделей (Middle)» присоединиться к числу своих сотрудников и работать из любой точки мира.

Компания состоит в реестре российских аккредитованных IT-компаний, что в числе прочего подразумевает под собой отсрочку от призыва на военную службу, а также льготную ипотеку.

По результатам собеседования соискателю может быть предложена возможность трудоустройства за пределами РФ.

Обязанности:

  • Сбор, предобработка и анализ текстовых данных для обучения моделей.
  • Помощь в дообучении языковых моделей (LLM) под специфические задачи компании.
  • Разработка пайплайнов для подготовки текстовых данных, включая очистку, токенизацию и создание пользовательских токенов.
  • Проведение экспериментов с различными моделями и конфигурациями для повышения качества.
  • Создание отчетов о результатах экспериментов.

Требования:

  • Опыт работы с текстовыми данными, включая предобработку
  • Уверенные знания Python, библиотек для работы с данными (pandas, numpy, matplotlib) и библиотек для обработки текста (transformers, Hugging Face).
  • Базовые знания методов машинного обучения
  • Знания классических и современных методов работы с текстовыми данными (например, TF-IDF, embeddings и т.п.).
  • Опыт работы с крупными текстовыми датасетами.

Приветствуется:

  • Опыт работы с языковыми моделями GPT, BERT или их аналогами.
  • Навыки разработки в распределенных системах обработки данных.
  • Знание современных подходов к обучению LLM.

Условия:

  • оформление по ТК
  • удаленный режим работы из любой точки мира
  • график работы (09:00-18:00) (сб, вс - выходные)
  • возможно согласование рабочего графика (смещение рабочего дня, перенос рабочего дня на выходной)
  • дополнительная неделя отпуска
  • испытательный срок 1-3 мес
  • начальный уровень з/п определяется, исходя из результатов собеседования

Сравнение со средней зарплатой в похожих вакансиях:

200k

300k

125k

250k

492k


Адрес: Россия, Москва, Духовской переулок, 17с15
Показать на большой карте

Поделиться:

Опубликована 6 дней назад

Похожие вакансии

Мы создаём продукт, который меняет то, как FMCG и retail-компании планируют и управляют своим бизнесом — от продаж до маркетинга. Нам нужен специалист по анализу данных, разбирающийся в существующих алгоритмах моделирования продаж и умеющий найти и п...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании АДВАДВ
  • Москва
6 дней назад
Сейчас мы ищем Data Scientist / Risk Analyst в команду управления кредитным риском (Customer Value Management ... Поддержку сильной команды специалистов и возможность развиваться в направлении риск-моделирования и data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Finstar Financial GroupFinstar Financial Group
  • Москва
2 дня назад
Находимся в поиске Data Scientist NLP Мы – РТК ИТ, аккредитованная ИТ компания, оказывающая полный комплекс ... Поддержка, мониторинг и улучшение качества NLP-моделей после деплоя Нам важны: - Опыт работы в роли Data ... scientist от 2 лет; - Работа с одним из фреймворков PyTorch/TensorFlow; - Реализация и работа с RAG ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Ростелеком Информационные ТехнологииРостелеком Информационные Технологии
  • Москва
5 дней назад
Полный цикл: от анализа данных, до внедрения моделей/правил и мониторинга их работы Глубокий exploratory data ... для анализа данных и машинного обучения (pandas/polars, scikit-learn, xgboost, tf/torch) Опыт с big data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AdvivaAdviva
  • Москва
4 дня назад
Вместе с масштабным развитием IT-направления мы формируем культуру Trust and Safety, гарантируя непрерывную безопасность и доверие между компанией, её сотрудниками, пользователями и клиентами. Команда "Рейтинги и отзывы" — важная часть этого направле...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
день назад
Big Data является одним из приоритетных направлений нашей компании. ... В 2017 году, в рамках компании создан новый департамент по разработке продуктов на основе Big Data.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании X5 TechX5 Tech
  • Москва
5 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.