Непрерывная аналитика - Continuous analytics

Непрерывная аналитика это наука о данных процесс, который оставляет ETL и сложная партия конвейеры данных в пользу облако -родной и микросервисы парадигмы. Непрерывный обработка данных обеспечивает взаимодействие в режиме реального времени и немедленную аналитику с меньшими ресурсами.

Определенный

Аналитика это применение математика и статистика к большим данным. Специалисты по обработке данных пишут аналитические программы для поиска решений бизнес-проблем, таких как прогнозирование. требовать или установив оптимальную цену. Непрерывный подход запускает несколько механизмов без сохранения состояния, которые одновременно обогащают, агрегируют, делают выводы и воздействуют на данные. Специалисты по обработке данных, информационные панели и клиентские приложения получают доступ к одним и тем же необработанным данным или производным данным в реальном времени с надлежащей безопасностью на основе личных данных, маскировка данных и управление версиями в реальном времени.

Традиционно специалисты по анализу данных не участвовали в ЭТО команды разработчиков, как и обычные Ява программисты. Это связано с тем, что их навыки выделяли их в собственном отделе, обычно не связанном с ИТ, то есть математикой, статистикой и наукой о данных. Поэтому логично заключить, что их подход к написанию программный код не обладает такой же эффективностью, как традиционная команда программистов. В частности, традиционное программирование приняло подход непрерывной доставки к написанию кода и гибкая методология. Это выпускает программное обеспечение в непрерывном цикле, называемом итерации.

Таким образом, непрерывная аналитика является расширением модели разработки программного обеспечения с непрерывной доставкой на большое количество данных команда разработчиков аналитики. Задача специалиста по непрерывной аналитике состоит в том, чтобы найти способы включить написание кода аналитики и установку программного обеспечения для работы с большими данными в гибкую модель разработки с автоматическим запуском модульных и функциональных тестов и построение системы среды с помощью автоматизированных инструментов.

Сделать эту работу - значит получить специалисты по данным писать свой код в том же репозиторий кода что обычные программисты используют, чтобы программное обеспечение могло извлечь его оттуда и запустить в процессе сборки. Это также означает сохранение конфигурации кластера больших данных (наборы виртуальные машины ) в каком-то репозитории. Это упрощает отправку аналитического кода, программного обеспечения и объектов для работы с большими данными таким же автоматизированным способом, как и процесс непрерывной интеграции.[1][2]

внешняя ссылка

Рекомендации

  1. ^ «Определение непрерывной аналитики». Южно-тихоокеанский обзор. Южно-тихоокеанский обзор. Получено 17 мая 2016.
  2. ^ Пушкарев, Степан. «Снесите стену между наукой о данных и DevOps». LinkedIN. LinkedIN. Получено 17 мая 2016.