Мы развиваем собственный Аналитический центр Data Science и Machine learning , и приглашаем в команду Data Scientist на ключевые проекты.
Работа ведется в командах 5-6 человек, включает в себя бизнес-аналитиков, data scientist, data engineer, руководитель направления.
Наши задачи:
- Разработка статистических моделей/алгоритмов и их реализация на R, Python;
- Оптимизация инструментов и подходов к решению задач;
- Прогнозирование промо продаж компании до различных разрезов;
- Прогнозирование регулярных продаж компании до различных разрезов;
- Разработка рекомендательных систем на основе данных карт лояльности компании.
Ожидания:
- Навыки работы с современными аналитическими пакетами на R/Python;
- Умение работать со стеком технологий BigData (Hadoop, Spark, Hive);
- Опыт работы с промышленными хранилищами данных (Oracle, Teradata, SAP) будет плюсом;
- Хорошие знания и опыт работы в прикладной статистики;
- Знание процессов и моделей торговых компаний будет плюсом;
- Знания в области методов разделения данных для проведения корректной оценки моделей машинного обучения;
- Знания в области использования валидации данных и подбора параметров настройки для моделей машинного обучения;
- Знания в области оценки данных на предмет аномалий, пропусков, нормализации данных, восстановления и препроцессинга данных;
- Понимание и умение использовать более сложные методы решения задач машинного обучения: деревья, линейные модели (лассо, гребневая), метод опорных векторов, метод различные кластеризации, методы снижения размерности;
- Опыт использования в анализе временного ряда моделей ARIMA/SARIMA;
- Опыт предобработки исходных данных и нормализации целевой переменной для повышения качества моделей;
- Опыт использования основных методов кластеризации для создания разметки данных;
- Опыт использования базовых методов классификации (формирование рекомендаций) для новых объектов в данных;
- Понимание и умение объяснить задачи, связанные с моделированием в машинном обучении
Мы предлагаем:
- Место работы г. Краснодар
- Современная платформа данных: Teradata, SPSS, стек Hadoop, Tableau, QlikView;
- Объемы основных транзакционных данных 120+ ТБ;
- Объемы в Hadoop (в разработке) 1,5 ПБ;
- Прототипы аналитики в реальном времени, высоконагруженные сервисы;
- Участие в разработке цифровых продуктов (моб. приложение, оборудование в магазинах и пр.);