Middle Data Scientist, NLP, Ozon Банк

По договоренности

  • Марксистская
  • Третьяковская
  • Маяковская

Ozon Банк — компания, в которой тесно переплетаются финансы и IT. Мы создаём новые для рынка продукты и сервисы для физических и юридических лиц. Гордимся атмосферой в командах: каждый сотрудник может влиять на процессы и пути к результату.

Сейчас мы ищем middle NLP DS в команду, которая занимается всеми NLP-задачами в компании. Мы создаём RAG для различных бизнес-направлений, чат-бот поддержки, реализуем speech-to-text решения, OCR с использованием LLM, кодогенерацию. А также работаем с любыми другими запросами от бизнеса, связанными с текстовыми данными.

Модели напрямую влияют на доходность компании и определяют итоговую прибыль. Мы развиваем мощности нашего ЦОД для прикладных и исследовательских задач и самостоятельно прорабатываем и запускаем решения в прод.

Наш стек: Vertica, PostgreSQL, Clickhouse, Labelstudio, pytorch + accelerate, tritonserver в k8s, QDrant, Elasticsearch, Langchain

Вам предстоит:

– Активно участвовать во всех проектах команды

– Решать задачи для чат-бота поддержки

– На первом этапе использовать модели для поддержки операторов (суммаризация, парафраз, RAG), затем — переходить к полной автоматизации с помощью LLM

– Развивать вместе с командой STT- и TTS-направления для обработки звонков

Мы ожидаем:

– Опыт работы в Data Science от 2 лет

– Умение внятно излагать мысли и представлять результаты своей работы

– Уверенный Python, умение разбираться в чужом коде

– Понимание основных принципов, алгоритмов и метрик классического ML

– Опыт решения бизнес-задач с использованием классических и трансформерных NLP-моделей

– Понимание, какая NLP-модель для каких случаев подойдёт лучше

– LLM — понимание принципов работы, а также ограничений в применении тех или иных моделей

Будет плюсом:

- Навыки prompt engineering-а и использования structured outputs и function calling у моделей

– Потенциально будем разворачивать агентские системы, поэтому будет плюсом опыт работы с такими фреймворками — например, smolagents

– Опыт деплоя трансформерных моделей с использованием какого-либо фреймворка: vllm, sglang

– Понимание того, как работает в таких фрейворках обработка запросов и как её можно ускорить

– Опыт с tritonserver и tensorrt-LLM


Адрес: Россия, Москва
Показать на большой карте

Поделиться:

Опубликована месяц назад

Похожие вакансии

Находимся в поиске Data Scientist (Speech) Мы – РТК ИТ, аккредитованная ИТ компания, оказывающая полный ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании Ростелеком Информационные ТехнологииРостелеком Информационные Технологии
  • Москва
день назад
DL Опыт в построении рекомендательных систем в продакшене (ALS, LightFM, NCF etc) Опыт работы с big data ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании OzonOzon
  • Москва
день назад
Мы ищем талантливого Data Scientist в команду, которая разрабатывает ML - модели для HR блока.
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании ГазпромбанкГазпромбанк
  • Москва
4 дня назад
Domclick.ru - единственный в России продукт, обеспечивающий полный цикл операций с недвижимостью. Доступен на всех популярных платформах (Web, iOS, Android). Решаем любые вопросы с недвижимостью, делая сложное простым, с заботой о каждом клиенте. Про...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании ДомкликДомклик
  • Москва
4 дня назад
Находимся в поиске Data Scientist NLP Мы – РТК ИТ, аккредитованная ИТ компания, оказывающая полный комплекс ... Нам важны: - Опыт работы в роли Data scientist от 2 лет; - Работа с одним из фреймворков PyTorch/TensorFlow ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании Ростелеком Информационные ТехнологииРостелеком Информационные Технологии
  • Москва
6 дней назад
В команду Machine learning ищем Data Scientist (middle+).
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании MoneyCatMoneyCat
  • Москва
10 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.