Вакансии проекта «Инфраструктура научно-исследовательских данных»

 

Центр перспективных управленческих решений объявляет набор на позиции, связанные с работой с данными (парсинг, скрепинг, обработка, управление базами данных).

Нас интересуют прежде всего middle-специалисты, которым было бы интересно развиваться в сфере работы с государственными данными.

Резюме можно присылать на почту [email protected].

 

1. Дата-аналитик

 

Задачи:

  • Сбор и предварительная обработка данных из открытых источников и источников с регламентированным доступом;
  • Работа с базами данных;
  • Работа с необработанными массивами государственных данных и государственными информационными системами;
  • Структурирование данных, обеспечение их гармонизации.

 

Требования:

  • Опыт работы с данными от 0,5 лет; приветствуется опыт работы с данным государственного сектора;
  • Уверенные знания SQL на уровне сложных запросов;
  • Продвинутое знание и использование методов промышленного веб-скрепинга и парсинга данных (на уровне любого из указанных языков программирования: Python / C# / Java / JavaScript);
  • Знание методов обработки и заполнения пропусков данных (MCAR, MAR, MNAR);
  • Продвинутые навыки работы с REST API / JSON-RPC, SOAP-запросами;
  • Умение находить решения нетривиальных задач, готовность обучаться и обучать участников команды.

 

Адрес для отправки резюме: [email protected]

 

 2. Дата-инженер

 

Задачи:

  • Разработка и оптимизация ETL процессов, структурирование разрозненных данных и поиск решений по их гармонизации;
  • Разработка архитектуры баз данных и построение витрин данных;
  • Контроль качества данных.

 

Требования:

  • Опыт работы с данными от 1 года;
  • Уверенные знания SQL и любых наиболее используемых реляционных СУБД (Postgres, MySQL, SQLite);
  • Знание теории реляционных баз данных и деталей реализации СУБД;
  • Опыт проектирования OLAP структур и хранилищ данных;
  • Умение писать чистый и поддерживаемый код;
  • Опыт работы с ETL-решениями;
  • Опыт написания технической документации;
  • Приветствуется опыт работы с данным государственного сектора;
  • Опыт работы с MPP-решениями (Greenplum, Teradata, Hadoop (Spark)), NoSQL, Python рассматривается как преимущество;
  • Готовность работать в команде и обучаться новому.

 

Адрес для отправки резюме: [email protected]