Рабочие места для анализа данных в облаке DataLine
Компания DataLine запустила в своем облаке готовые шаблоны виртуальных машин для Data Science, из которых можно развернуть готовую среду для обучения моделей и экспериментов с данными. Теперь заказчики в своем виртуальном дата-центре могут быстро организовать рабочее место аналитика данных на базе ОС Ubuntu 18.04.
Шаблон включает необходимые инструменты для анализа данных:
• Jupyter Notebook и JupyterLab;
• менеджер пакетов conda с Python 3;
• библиотеки для машинного обучения, линейной алгебры и статистики: NumPy, scikit-learn, SciPy, CatBoost, LightGBM, XGBoost, TensorFlow, PyTorch;
• систему управления контейнерами Docker;
• другие средства, облегчающие работу аналитика.
После развертывания шаблона аналитик получает полный доступ в операционную систему и может добавлять необходимые компоненты.
Рабочее место в облаке, отмечают в DataLine, имеет то преимущество, что скорость обучения моделей не зависит от скорости локального компьютера. У заказчика есть возможность выбрать нужное количество процессоров, оперативной памяти, быстрого дискового хранилища. Облако работает на серверах с процессорами Intel Xeon 6254 v6 с частотой 3,1 ГГц и поддержкой инструкций AVX-512. Для обучения сложных моделей в рамках частных решений клиенты могут получить серверы с графическими ускорителями для вычислений.