Senior Data Scientist (NLP/LLM)

По договоренности

  • Черкизовская
  • Преображенская площадь
  • Сокольники

Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10.

Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков. Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж.

Cian.ru — это большой и сложный продукт, в котором представлено несколько типов недвижимости и типов сделки, а также есть множество сервисов, информационных материалов и собственное медиа.

Ежемесячная аудитория около 20 млн. человек. Растить число пользователей и решать их проблемы помогают уже больше 1300 человек.

В Циан большая команда ML - DS, DE, своя MLOps-платформа.

Команда разделена на продуктовые стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес-направления. С процессами интеграции моделей в продакшн нам помогает команда MLOps-платформы. В команде настроены процессы перфоманс ревью, регулярного обмена опытом, выделяем время на исследовательскую работу.

Мы ищем Senior Data Scientist в команду SmartSearch, которая будет драйвить развитие поискового стека — от классических моделей поиска и ранжирования до нейронных и мультимодальных решений, доведённых до стабильного high-load продакшена.

Сейчас мы активно работаем над тем, чтобы AI играл ключевую роль в процессе поиска недвижимости, чтобы сделать его по-настоящему умным и удобным.

Стек:

  • Пишем преимущественно на Python (Transformers, PyTorch, Numpy, Pandas, Sklearn, CatBoost).

  • Активно используем экосистему Hadoop (PySpark, Hive, Kafka), у нас свой большой кластер

  • Для автоматизации запусков наших пайплайнов используем Airflow

  • Для технических метрик — Grafana, для бизнес-метрик — FineBI.

Основные задачи:

  • Развивать текстовый поиск Циан: query understanding, retrieval, ranking, re-ranking

  • Улучшать качество подсказок и автокомплита

  • Работать с классическими и нейросетевыми моделями поиска: BM25, dense / hybrid retrieval

  • Развивать мультимодальный поиск (текст + изображения + гео)

Требования к кандидату:

  • 3+ лет опыта работы с NLP / поиском / ранжированием

  • Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др.

  • Опыт работы с NLP задачами Генерация/Классификация/NER от исследований до продакшена

  • Классический ML: бустинги, линейные модели.

  • Python: пишет легко читаемый и поддерживаемый код

  • SQL запросы на продвинутом уровне (оконные функции, оптимизация запросов)

  • Способен самостоятельно коммуницировать с заказчиками и смежниками.

Будет плюсом:

  • Практический опыт работы с векторными БД и ANN-алгоритмами, понимание поисковых движков

  • Работа с мультимодальными представлениями

  • Знаком с Apache стек: HDFS/Kafka/Spark (DF API)

  • Имеет базовые знания CV: классификация, детекция, сегментация

  • Опыт использования LLM как части поискового пайплайна, а не единственного решения

Что мы предлагаем:

  • Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе – кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки;
  • Технический рост. У нас есть успешные примеры роста с точки зрения ML, а также инженерии (разработка, архитектура приложений и сервисов) : есть возможность консультироваться с командой и брать инициативу по реализации крупных и сложных проектов.
  • Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/ hard skills на практике, обучении, конференциях;

Адрес: Россия, Москва, Электрозаводская улица, 27с8
Показать на большой карте

Поделиться:

Опубликована 23 дня назад

Похожие вакансии

Требования: Опыт работы в Data Science не менее 4 лет, включая проекты с ML/Deep Learning.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Электронная торговая площадка ГазпромбанкаЭлектронная торговая площадка Газпромбанка
  • Москва
8 часов назад
Мы в поиске Senior Data Scientist в команду, занимающуюся применением DL подходов в задачах Lamoda. ... статистики, теории вероятности, алгоритмов и структур данных Стэк технологий: Python, PyTorch, Big data ... Культура code review и принятия решений на основании данных Сильные кросс-функциональные команды middle и senior ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Lamoda TechLamoda Tech
  • Москва
10 дней назад
Мы в поиске Senior Data Scientist в команду Advertising DMP (Data Management Platform), который поможет ... Стэк технологий: Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL. ... Почему у нас классно: Полный жизненный цикл разработки data-driven продуктов с применением ML - от генерации ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Lamoda TechLamoda Tech
  • Москва
10 дней назад
250 000 - 350 000 ₽
Выше средней на 20%
... работы с SQL Понимание статистики, машинного обучения и методов валидации Опыт работы по imbalance data ... преимуществом Опыт внедрения моделей в продакшн Работа с ML pipelines Знание PySpark или работа с Big Data ... Опыт работы по альтернативным данным (open banking, behavioral data) Мы предлагаем Конкурентная заработная ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Уткин Сергей ВладимировичУткин Сергей Владимирович
  • Москва
16 дней назад
250 000 - 350 000 ₽
Выше средней на 20%
Компания «Про.Потолок» приглашает в команду Senior ML Engineer / Data Scientist (Computer Vision & ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Про.ПотолокПро.Потолок
  • Москва
12 дней назад
300 000 - 500 000 ₽
Выше средней на 60%
Computer Vision. Разработка и оптимизация алгоритмов для распознавания и классификации патологий на КТ-снимках. О компании Нейровижн - это инновационная компания, специализирующаяся на разработке и интеграции передовых продуктов и решений в области к...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании НЕЙРОВИЖННЕЙРОВИЖН
  • Москва
20 дней назад

Похожие вакансии

Логотип компании Электронная торговая площадка ГазпромбанкаЭлектронная торговая площадка Газпромбанка
250 000 - 350 000 ₽
Логотип компании Уткин Сергей ВладимировичУткин Сергей Владимирович
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.