Смешивание данных - Data blending

Смешивание данных это процесс, посредством которого большое количество данных из нескольких источников[1] объединены в единый хранилище данных или же набор данных.[2] Это касается не только слияния разных форматы файлов или разрозненные источники данных, но также и разные виды данных.[3] Смешивание данных позволяет бизнес-аналитикам справляться с увеличением объема данных, которые им необходимы для принятия важных бизнес-решений на основе хорошего качества. бизнес-аналитика.[4]

Смешивание данных было описано как отличное от интеграция данных из-за требований аналитики данных очень быстро объединить источники, слишком быстро для практического вмешательства со стороны специалисты по данным.[5]

Вызовы

Самый распространенный вопрос о настраиваемых метаданных: «Как этот набор данных может смешиваться (присоединяться или объединяться) с другими моими наборами данных?»[6] Исследование Forrester Consulting, проведенное в 2015 году, показало, что 52 процента компаний объединяют 50 или более источников данных, а 12 процентов объединяют более 1000 источников.[7]

Смотрите также

Рекомендации

  1. ^ Alteryx Analytics выводит на рынок возможности прогнозирования и больших данных
  2. ^ Смешивание данных - это процесс объединения данных из нескольких источников в функциональный набор данных.
  3. ^ Полное руководство по смешиванию данных
  4. ^ «Смешивание данных». Trifacta.com. 24 августа 2017 года.
  5. ^ Что такое смешивание данных и какие инструменты делают его проще?
  6. ^ Хеер, Джеффри; Hellerstein, Джозеф; Кандел, Шон; Раттенбери, Тай (июль 2017 г.). Принципы обработки данных. http://shop.oreilly.com/product/0636920045113.do: O'Reilly Media.CS1 maint: location (связь)
  7. ^ «Мэшапы данных для аналитики». Пентахо.