- Работа в Санкт-Петербурге
- Удаленно
- Data scientist
- Data Scientist / Researcher
Data Scientist / Researcher
По договоренности
- Горьковская
- Невский проспект
- Сенная площадь
Наша компания занимается разработкой и развитием масштабной AI-системы, которая анализирует различные источники данных — внутренние архивы, архивы, веб, соцсети и многое другое — с целью выявления событий, акторов, геоданных и связей между ними.
Система формирует динамическую базу знаний и временные ряды для анализа корреляций, визуализации взаимосвязей и прогнозирования.
Вы будете работать с многоуровневой архитектурой данных (ETL, временные базы, векторные представления, графовые модели), участвовать в построении пайплайнов обработки и интеграции ML-моделей (NLP, NER, ASR, OCR, CV), а также создании инструментов для анализа, визуализации и поиска/
Мы решаем комплексные задачи: от построения data flow и feature store — до проектирования семантических графов и оркестрации пайплайнов моделей.
Ищем сотрудника на вакансию Data Scientist / Researcher, способного анализировать сложные данные и строить модели, которые влияют на развитие бизнеса.
Обязанности:
-  Проведение исследования данных, построение гипотез, выявление корреляций и связей между переменными 
-  Построение графов связей и визуализация сложных структур данных 
-  Разработка и внедрение статистических и ML моделей (классификация, кластеризация, прогнозирование) 
-  Анализ и подготовка данных для обучения моделей и прототипирование новых методов 
-  Построение и оптимизация пайплайнов на Python (Pandas, Scikit-learn, NLP toolkit) 
-  Работа с графовыми базами данных (Neo4j), TimescaleDB, и моделями временных рядов (Prophet) 
-  Использование NetworkX для анализа сетевых структур, а также библиотеки XGBoost для задач предсказания 
-  Необходимый стек: 
-  Python, Pandas, Scikit-learn, XGBoost, Prophet 
-  NetworkX, Neo4j, TimescaleDB 
-  NLP инструменты (управление моделями, обработка текста) 
-  Работа с графами связей, временными рядами и ML-моделями 
-  Требования: 
-  Опыт проведения аналитических исследований и построения ML моделей 
-  Навыки построения гипотез и тестирования статистических связей 
-  Опыт работы с графовыми базами данных (Neo4j), TimescaleDB 
-  Знание Python, навыки работы с Pandas, Scikit-learn, NetworkX 
-  Навыки визуализации данных и генерации прототипов 
-  Высшее образование в области математики, статистики, информатики или связанных областях 
- Условия:
-  Возможность публикаций и участия в конференциях 
-  Работа с крупными массивами данных и сложные аналитические задачи 
-  Использование передовых инструментов и технологий 
-  Участие в развитии компании, возможность влиять на продукт и процессы компании 
-  Достойная, конкурентноспособная заработная плата 
-  Удаленная работа, Гибкий график 
-  Возможность профессионального развития 
Опубликована 13 дней назад