Senior Data Scientist (NLP/LLM)

По договоренности

  • Черкизовская
  • Преображенская площадь
  • Сокольники

Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10.

Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков. Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж.

Cian.ru — это большой и сложный продукт, в котором представлено несколько типов недвижимости и типов сделки, а также есть множество сервисов, информационных материалов и собственное медиа.

Ежемесячная аудитория около 20 млн. человек. Растить число пользователей и решать их проблемы помогают уже больше 1300 человек.

В Циан большая команда ML - DS, DE, своя MLOps-платформа.

Команда разделена на продуктовые стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес-направления. С процессами интеграции моделей в продакшн нам помогает команда MLOps-платформы. В команде настроены процессы перфоманс ревью, регулярного обмена опытом, выделяем время на исследовательскую работу.

Мы ищем Senior Data Scientist в команду “Поиск 3.0”

Команда "Поиск 3.0" занимается развитием AI-продуктов Циан: улучшает текстовый поиск, чтобы пользователи находили идеальные варианты быстрее, и развивает Циан-помощника, делая его умнее и полезнее.

Мы используем современные NLP-модели (включая LLM), оптимизируем работу с карточками объектов и внедряем ИИ-решения, которые помогают тысячам пользователей каждый день.

Сейчас мы активно работаем над тем, чтобы AI играл ключевую роль в процессе поиска недвижимости, чтобы сделать его по-настоящему умным и удобным.

Стек:

  • Пишем преимущественно на Python (Transformers, PyTorch, Numpy, Pandas, Sklearn, CatBoost).

  • Активно используем экосистему Hadoop (PySpark, Hive, Kafka), у нас свой большой кластер

  • Для автоматизации запусков наших пайплайнов используем Airflow

  • Для технических метрик — Grafana, для бизнес-метрик — FineBI.

Основные задачи:

  • NLP задачи как в виде обучения моделей, так и в виде разработки вспомогательных сущностей на python.

  • Решение задач машинного обучения и написания кода для нагруженных сервисов на Python.

  • Развитие текстовой строки новых AI механик на Циан. Одна из целей команды - под ключ закрыть потребность общаться с человеком.

  • Промпт тюнинг LLM с использованием API и внутренних сетей и fine tuning своих LLM

Требования к кандидату:

  • Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др.

  • Python: пишет легко читаемый и поддерживаемый код

  • SQL запросы на продвинутом уровне — оконные функции, оптимизация запросов

  • Знаком с Apache стек: HDFS/Kafka/Spark (DF API)

  • Опыт разработки NLP моделей: от tfidf до llm ( работа с pytorch, transformers)

  • Опыт в DL: обучение/дообучение собственных глубоких нейросетей

  • Классический ML: бустинги, линейные модели.

  • Имеет базовые знания CV: классификация, детекция, сегментация.

  • Понимает ценность MLOps, и ценность переиспользования уже готовых решений внутри компании.

  • Имеет кругозор или непосредственный опыт в реализации проектов для C и B пользователей.

  • Способен самостоятельно коммуницировать с заказчиками и смежниками.

Что мы предлагаем:

  • Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе – кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки;

  • Технический рост. У нас есть успешные примеры роста с точки зрения ML, а также инженерии (разработка, архитектура приложений и сервисов) : есть возможность консультироваться с командой и брать инициативу по реализации крупных и сложных проектов.

  • Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/ hard skills на практике, обучении, конференциях;

  • ДМС с первого рабочего дня (со стоматологией, госпитализацией, страховкой выезжающего за пределы нашей страны);

  • 5 day off в год, помимо основного отпуска;

  • Кафетерий льгот;


Адрес: Россия, Москва, Электрозаводская улица, 27с8
Показать на большой карте

Поделиться:

Опубликована месяц назад

Похожие вакансии

Мы в поиске Senior Data Scientist в команду, занимающуюся применением DL подходов в задачах Lamoda. Наша цель – с помощью глубокого обучения научиться понимать стиль, сходство, атрибуты одежды, а также предпочтения миллионов пользователей. Помимо это...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Lamoda TechLamoda Tech
  • Москва
17 дней назад
Мы в поиске Senior Data Scientist в команду Advertising DMP (Data Management Platform), который поможет нам развивать платформу данных для персонализации маркетинга и рекламы Ламода: разрабатывать ML-инструменты и предиктивные модели, которые позволя...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Lamoda TechLamoda Tech
  • Москва
18 дней назад
Обязанности: Проведение исследований и анализ экспериментов с данными (структурированными и неструктурированными: текст, изображения, видео, аудио). Разработка и внедрение моделей машинного и глубокого обучения (TensorFlow, PyTorch, scikit-learn). Оп...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Электронная торговая площадка ГазпромбанкаЭлектронная торговая площадка Газпромбанка
  • Москва
24 дня назад
Привет! Мы - коммуникационная группа Okkam. Наша специализация — услуги в области маркетинга, рекламы и консалтинга. В России мы уже 25 лет создаем связи между брендами и людьми, профессионально объединяя медиа, креатив и IT технологии. У нас ничего ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании OkkamOkkam
  • Москва
18 дней назад
Ozon Банк — компания, в которой тесно переплетаются финансы и IT. Мы создаём новые для рынка продукты и сервисы для физических и юридических лиц. Гордимся атмосферой в командах: каждый сотрудник может влиять на процессы и пути к результату. Мы ищем п...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании OzonOzon
  • Москва
12 дней назад
Обязанности: Разработка и реализация подходов для решения задач в области компьютерного зрения (CV), совместное формирование требований с командой; Планирование экспериментов, обучение моделей, оценка их качества и интеграция в пайплайны; Работа с да...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании РУСАЛРУСАЛ
  • Москва
20 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.