Data Scientist (NLP)

По договоренности


Находимся в поиске Data Scientist NLP

Мы – РТК ИТ, аккредитованная ИТ компания, оказывающая полный комплекс услуг по разработке и внедрению программных решений.

Каждый день на наших проектах задействовано 4200+ сотрудников, у нас 70+ направлений разработки различных решений. За 11 лет нашей работы мы успешно реализовали более 60 ИТ-продуктов.

Мы создаем передовую платформу, которая позволяет эффективно обучать, тонко настраивать и разворачивать крупномасштабные языковые модели (LLM) и другие NLP-решения. Наша цель — предоставить командам исследователей и бизнес-пользователям инструментарий для работы с современными моделями ИИ в условиях ограниченного доступа к облачным ресурсам.

Мы предлагаем:

- Удаленную работу с гибким началом рабочего дня (на территории РФ);
- Оформление по ТК РФ в аккредитованной ИТ-компании;
- Оклад и годовая премия;
- Кафетерий льгот с возможностью выбора категорий (ДМС или компенсация затрат на медицинские услуги, спорт и т.д.).

Вам предстоит:

- Разработка, обучение, дообучение и применение моделей NLP (Text Classification, NER, Summarization, Question Answering);
- Работа с крупными языковыми моделями (LLM): fine-tuning, адаптация и применение в прикладных сценариях;
- Построение и оптимизация пайплайнов предобработки текстов и векторизации данных;
- Анализ качества моделей, подбор метрик и улучшение производительности в условиях ограниченных вычислительных ресурсов;
- Совместная работа с командой МЛ инженеров и продуктовой командами для внедрения решений в бизнес-процессы;
- Поддержка, мониторинг и улучшение качества NLP-моделей после деплоя.

Нам важны:

- Опыт работы в роли Data scientist от 2 лет;
- Работа с одним из фреймворков PyTorch/TensorFlow;
- Знание основных подходов для предобработки и векторизации текста;
- Наличие опыта решения задач NLP для текста (Text Classification, NER, Text Summarization, QA);
- Знакомство и понимание основных принципов современных SOTA моделей NLP;
- Владение: git, docker, sql и одним из фреймворков для реализации api.

Будет плюсом:
- Практический опыт до обучения и работы с open source LLM;
- Публикации по NLP;
- Собственные проекты по NLP.


Поделиться:

Опубликована 22 дня назад

Похожие вакансии

... анализ причин эффективности или неэффективности Требования Не менее 3 лет коммерческого опыта в области Data ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании AdvivaAdviva
  • Москва
5 дней назад
Сейчас мы в поисках Technical manager / Data Scientist в команду динамического ценообразования, который ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании КуперКупер
  • Москва
4 дня назад
В «Ренессанс Банке» мы любим, что делаем, и создаем возможности для реализации идей. Нашли новое решение – доработали, заметили проблему клиента – помогли, появилась идея – воплотили. Мы так устроены! Тебе это близко? Становись частью команды тех, кт...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании Ренессанс БанкРенессанс Банк
  • Москва
11 дней назад
О проекте: Мы ищем Data Scientist для разработки интеллектуальной системы, которая полностью автоматизирует ...
  • Можно удаленно
  • Подработка
  • Опыт от 1 года
Логотип компании АйТи Фо ЮАйТи Фо Ю
  • Москва
15 дней назад
Чтобы эти цифры стали выше, а наши пользователи — счастливей, мы ищем NLP|LLM Data Scientist в команду ... Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow ... Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation.
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании СберЗдоровьеСберЗдоровье
  • Москва
13 дней назад
Группа «Самолет» — ведущий российский застройщик и работодатель в строительной отрасли, основанный в 2012 году. Мы проектируем современные кварталы и формируем новую среду жизни, учитывая потребности регионов. Бэк-офис — это команда профессионалов ра...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании Компания СамолетКомпания Самолет
  • Москва
18 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.