Middle Data Scientist

По договоренности

  • Приморская
  • Василеостровская
  • Горный институт

Привет! Мы, команда лаборатории прикладного искусственного интеллекта в ФИЦ РАН, создаем решения, объединяющие фундаментальные исследования, образование и индустрию. Работаем совместно с внешними командами, в том числе из Сбера и РАНХиГС. Ищем коллегу на позицию младшего графического дизайнера для работы над представлением наших решений.

ЗАДАЧИ:

  • Работать с LLM и RAG: Разрабатывать и внедрять подходы по улучшению качества ответов языковых моделей за счет retrieval-augmented generation. Оптимизировать стратегии поиска и реранжирования.

  • Создавать интеллектуальных агентов: Проектировать и реализовывать агентов на современных фреймворках (Pydantic AI, LangGraph).

  • Решать классические NLP-задачи: Извлечение и связывание именованных сущностей (NER/NEL) из неструктурированных русскоязычных текстов.

  • Моделировать: Обучать и оценивать классификаторы и ранжирующие модели, обеспечивая их стабильную работу в продакшене.

  • Анализировать данные и качество: Проводить глубокую оценку качества ML-пайплайнов, выдвигать и проверять гипотезы по улучшению метрик. Готовить данные и признаки для обучения моделей.

ТРЕБОВАНИЯ:

  • Обязательно наличие профильного высшего образования
  • Уверенный Python (ООП, API, чистый код) и SQL (sqlalchemy/alembic).

  • Сильные NLP-навыки и опыт работы с русским текстом: решение задач NER/NEL, понимание морфологии и синтаксиса.

  • Опыт построения LLM-агентов на современных фреймворках (LangGraph, Pydantic AI или аналоги).

  • Понимание retrieval-подходов (RAG, семантический поиск) и опыт работы с векторными БД.

  • Хорошее понимание ML: классификация, ранжирование, метрики, подготовка признаков.

БУДЕТ ПЛЮСОМ:

  • Опыт файн-тюнинга/инференса BERT / RoBERTa, работа с GigaChat.

  • Знакомство с ELK и современными архитектурами LLM (MoE/Dense).

НАШ СТЕК:

  • NLP: Natasha, Pymorphy, DeepPavlov, Transformers

  • Агенты и пайплайны: Pydantic AI, LangGraph

  • Backend / Data: SQLAlchemy, Alembic

УСЛОВИЯ:

  • Работа в офисе, возможен гибрид
  • Обсуждаемая заработная плата

Адрес: Россия, Санкт-Петербург, 14-я линия Васильевского острова, 39
Показать на большой карте

Поделиться:

Опубликована 21 час назад

Похожие вакансии

... рейтинге hh.ru, приглашает в команду управления процессного анализа и развития клиентского сервиса Data ... Scientist.
  • Полный день
  • Опыт от 1 года
Логотип компании Банк Санкт-ПетербургБанк Санкт-Петербург
  • Санкт-Петербург
4 дня назад
от 120 000 ₽
... реляционными БД (PostgreSQL): проектирование схем, оптимизация сложных запросов Построение отказоустойчивых data-пайплайнов ... Работа с ML-жизненным циклом (понимание и реализация) Тесное взаимодействие с Data Scientist для интеграции ...
  • Полный день
  • Опыт от 1 года
Логотип компании Комитет по вопросам законности, правопорядка и безопасностиКомитет по вопросам законности, правопорядка и безопасности
  • Санкт-Петербург
25 дней назад
Сейчас, в связи с активным развитием, мы ищем к себе в команду Data engineer. ... Будет преимуществом: Опыт управления качеством данных и управления данными (Data Governance); Опыт работы ...
  • Полный день
  • Опыт от 1 года
Логотип компании BI ConsultBI Consult
  • Санкт-Петербург
10 дней назад
Колл Солюшенс – компания клиентской поддержки бизнеса, продаж и развития регионов на международных рынках IT и финансовых технологий. Работаем с клиентами из 10 стран, услуги предоставляем на их родном языке. Ищем в команду Аналитика данных, основным...
  • Полный день
  • Опыт от 1 года
Логотип компании Колл СолюшенсКолл Солюшенс
  • Санкт-Петербург
12 дней назад
... разрабатывать витрины данных Проектировать, разрабатывать и поддерживать процессы ETL для загрузки данных в/из Data ... Lake Оптимизировать работу существующих дата-пайплайнов Интегрировать новые источники данных в Data ...
  • Полный день
  • Опыт от 1 года
Логотип компании МарсМарс
  • Санкт-Петербург
13 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.