Data Engineer (Python/Django/ML)

По договоренности

  • ВДНХ
  • Алексеевская
  • Рижская

"Hello, Doc!" (hellodoc.app) — активно развивающаяся компания в сфере онлайн медицины. С начала 2019 года мы занимаемся развитием мобильных приложений для врачей и пациентов, чтобы сделать их общение эффективным и удобным, а доступ к медицинским услугам доступным и понятным. Сегодня это уже более 400 000 пациентов и более 30 000 профи.

Мы ищем активного, целеустремлённого разработчика, который хочет расти и развивать online медицину вмести с нами.

Обязанности:

  • Построение и оптимизация Data Pipeline:
  • Проектирование и поддержка ETL/ELT-процессов в Yandex Cloud (Airflow, S3).
  • Организация хранения данных: работа с PostgreSQL (операционные данные) и ClickHouse (аналитика, большие объёмы результатов).
  • Автоматизация загрузки, очистки и нормализации разрозненных данных от партнёров и лабораторий — снижение доли ручной обработки с текущих 95%.
  • Обеспечение целостности и консистентности данных при масштабировании (новые регионы, препараты, позиции).
  • Работа с внешними данными и справочниками:

Сбор данных из внешних источников: парсинг, фильтрация, валидация, обновление и хранение.

Интеграция и поддержка актуальности внешних медицинских справочников: МКБ, справочники Минздрава, базы лабораторных исследований, реестры препаратов.

Создание и поддержка маппинга между внутренними данными и внешними стандартами (18 000+ тестов и позиций).

Мониторинг изменений во внешних источниках и своевременное обновление локальных витрин.

  • Разработка логики и инструментов для продукта (MedTech):

Структурирование медицинских данных для использования в продукте: связи «отклонение → рекомендация», «жалоба → чек-ап».

Разработка внутренних инструментов на Django (Admin/Interface), позволяющих врачам и экспертам самостоятельно управлять правилами, справочниками и данными — без участия разработчиков.

Реализация бизнес-логики для системы рекомендаций: автоматическое сопоставление результатов анализов с требованиями Минздрава и клиническими протоколами.

Автоматизация формирования заказов и чекапов на основе выявленных закономерностей и правил.

  • Поддержка ML и аналитики:

Подготовка и витринизация данных для ML-моделей, экспертных систем и отчётности.

Взаимодействие с командой ML и предметными экспертами (врачами) для перевода бизнес-требований в технические спецификации.

Участие в разработке гибридных систем: экспертные правила + LLM/GPT (управление контекстом, подготовка базы знаний, контроль качества генерации).

  • Архитектура и процессы:

Переход от «файликов сопоставления» к централизованной, документированной логической модели данных.

Самостоятельная проработка задач: трансформация размытых бизнес-пожеланий в конкретные, измеримые технические решения.

Оптимизация запросов и затрат на инфраструктуру в Yandex Cloud.

Документирование пайплайнов, справочников и бизнес-правил для передачи знаний внутри команды.

Требования:
  • Hard Skills:

Уверенное знание Python (на уровне написания сложных скриптов, сервисов и фоновых задач).

  • Опыт работы с Django (написание ад-панелей, CRUD-интерфейсов для внутренних инструментов).
  • Глубокое знание SQL, опыт работы с PostgreSQL и колоночными БД (ClickHouse).
  • Опыт оркестрации пайплайнов (Airflow).
  • Опыт работы с облачными хранилищами (S3, предпочтительно Yandex Cloud).
  • Понимание принципов построения DWH/Data Lake и витрин данных.

Опыт и компетенции:

  • Опыт работы в команде с ML-инженерами/дата-сайентистами (понимание жизненного цикла модели, подготовка фичей, верификация данных).
  • Умение работать с неструктурированными или «грязными» данными, приводить их к единому стандарту.
  • Опыт разработки инструментов автоматизации для бизнес-пользователей (чтобы они могли менять настройки и правила самостоятельно).
  • Опыт работы с внешними источниками данных: парсинг, нормализация, поддержка актуальности.
  • Способность работать в условиях неопределённости (задачи часто формулируются общими пожеланиями, нужна самостоятельность и проактивность).

Будет плюсом:

  • Опыт в MedTech / HealthTech (понимание терминов: МКБ, МИС, лабораторные анализы, клинические протоколы).
  • Опыт внедрения правил бизнес-логики в код (Expert Systems, rule-based системы).
  • Навыки работы с LLM/API (интеграция GPT/YaGPT для обработки текстов, генерации рекомендаций, управления контекстом).
  • Опыт работы с медицинскими справочниками и нормативными источниками (Минздрав, ФФОМС, зарубежные базы).
Условия:
  • Что получите в работе:

Возможность построить data-инфраструктуру «с нуля» в растущем MedTech-продукте.

Реальное влияние на продукт: ваши решения напрямую ускорят работу врачей и повысят качество рекомендаций.

Работу с интересными задачами на стыке данных, медицины и AI.

Команду, которая ценит самостоятельность и нацелена на измеримый бизнес-результат.

  • Удалённая занятость.
  • График работы 5/2, с 10:00 до 19:00.

Адрес: Россия, Москва, проспект Мира, 102с31
Показать на большой карте

Поделиться:

Опубликована 10 часов назад

Похожие вакансии

ДЛЯ НАС ЦЕННО: Опыт работы Data Engineer от 3 лет; SQL продвинутый уровень: сложные запросы, оптимизация ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании М.Видео-ЭльдорадоМ.Видео-Эльдорадо
  • Москва
10 часов назад
В связи с активным расширением мы в поиске senior инженера данных в проект импортозамещения оперативного хранилища данных с применением концепции LakeHouse. ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ: Создание ядра (загрузка, мониторинг и реконсиляция данных) для авто...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании РСХБ-ИнтехРСХБ-Интех
  • Москва
10 часов назад
300 000 - 350 000 ₽
Выше средней на 30%
Часто применяем подходы BigData, Data Science, актуальные подходы к программному анализу данных и прогнозированию ... Сейчас мы приглашаем опытного Data engineer на проектную основу!
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ЛИАНЛИАН
  • Москва
3 дня назад
Сейчас мы приглашаем в свою команду Data Engineer, который будет отвечать за совершенствование нашего ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Онлайн-школа ТетрикаОнлайн-школа Тетрика
  • Москва
5 дней назад
... разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data ... опыт работы в роли Data Engineer от 3-х лет; опыт работы в роли Tech Lead/Team Lead от 1-го года; опыт ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
3 дня назад

Похожие вакансии

Логотип компании М.Видео-ЭльдорадоМ.Видео-Эльдорадо
Логотип компании РСХБ-ИнтехРСХБ-Интех
300 000 - 350 000 ₽
Логотип компании ЛИАНЛИАН
Логотип компании Онлайн-школа ТетрикаОнлайн-школа Тетрика
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.