- Работа в Москве
- Удаленно
- Senior data scientist
- Senior Data Scientist (NLP/LLM)
Senior Data Scientist (NLP/LLM)
По договоренности
- Черкизовская
- Преображенская площадь
- Сокольники
Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10.
Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков. Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж.
Cian.ru — это большой и сложный продукт, в котором представлено несколько типов недвижимости и типов сделки, а также есть множество сервисов, информационных материалов и собственное медиа.
Ежемесячная аудитория около 20 млн. человек. Растить число пользователей и решать их проблемы помогают уже больше 1300 человек.
В Циан большая команда ML - DS, DE, своя MLOps-платформа.
Команда разделена на продуктовые стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес-направления. С процессами интеграции моделей в продакшн нам помогает команда MLOps-платформы. В команде настроены процессы перфоманс ревью, регулярного обмена опытом, выделяем время на исследовательскую работу.
Мы ищем Senior Data Scientist в команду “Поиск 3.0”
Команда "Поиск 3.0" занимается развитием AI-продуктов Циан: улучшает текстовый поиск, чтобы пользователи находили идеальные варианты быстрее, и развивает Циан-помощника, делая его умнее и полезнее.
Мы используем современные NLP-модели (включая LLM), оптимизируем работу с карточками объектов и внедряем ИИ-решения, которые помогают тысячам пользователей каждый день.
Сейчас мы активно работаем над тем, чтобы AI играл ключевую роль в процессе поиска недвижимости, чтобы сделать его по-настоящему умным и удобным.
Стек:
-  Пишем преимущественно на Python (Transformers, PyTorch, Numpy, Pandas, Sklearn, CatBoost). 
-  Активно используем экосистему Hadoop (PySpark, Hive, Kafka), у нас свой большой кластер 
-  Для автоматизации запусков наших пайплайнов используем Airflow 
-  Для технических метрик — Grafana, для бизнес-метрик — FineBI. 
Основные задачи:
-  NLP задачи как в виде обучения моделей, так и в виде разработки вспомогательных сущностей на python. 
-  Решение задач машинного обучения и написания кода для нагруженных сервисов на Python. 
-  Развитие текстовой строки новых AI механик на Циан. Одна из целей команды - под ключ закрыть потребность общаться с человеком. 
-  Промпт тюнинг LLM с использованием API и внутренних сетей и fine tuning своих LLM 
Требования к кандидату:
-  Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др. 
-  Python: пишет легко читаемый и поддерживаемый код 
-  SQL запросы на продвинутом уровне — оконные функции, оптимизация запросов 
-  Знаком с Apache стек: HDFS/Kafka/Spark (DF API) 
-  Опыт разработки NLP моделей: от tfidf до llm ( работа с pytorch, transformers) 
-  Опыт в DL: обучение/дообучение собственных глубоких нейросетей 
-  Классический ML: бустинги, линейные модели. 
-  Имеет базовые знания CV: классификация, детекция, сегментация. 
-  Понимает ценность MLOps, и ценность переиспользования уже готовых решений внутри компании. 
-  Имеет кругозор или непосредственный опыт в реализации проектов для C и B пользователей. 
-  Способен самостоятельно коммуницировать с заказчиками и смежниками. 
Что мы предлагаем:
-  Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе – кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки; 
-  Технический рост. У нас есть успешные примеры роста с точки зрения ML, а также инженерии (разработка, архитектура приложений и сервисов) : есть возможность консультироваться с командой и брать инициативу по реализации крупных и сложных проектов. 
-  Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/ hard skills на практике, обучении, конференциях; 
-  ДМС с первого рабочего дня (со стоматологией, госпитализацией, страховкой выезжающего за пределы нашей страны); 
-  5 day off в год, помимо основного отпуска; 
-  Кафетерий льгот; 
Опубликована 23 дня назад