Apache Impala - Apache Impala
Разработчики) | Фонд программного обеспечения Apache |
---|---|
изначальный выпуск | 28 апреля 2013 г. |
Стабильный выпуск | 3.3.0 / 22 августа 2019 г.[1] |
Репозиторий | Репозиторий Импалы |
Написано в | C ++, Ява |
Операционная система | Кроссплатформенность |
Тип | Реляционный Hadoop -аналитика |
Лицензия | Лицензия Apache 2.0 |
Интернет сайт | импала |
Apache Impala является Открытый исходный код массовая параллельная обработка (MPP) Механизм запросов SQL для данных, хранящихся в компьютерный кластер Бег Apache Hadoop.[2] Impala была описана как эквивалент с открытым исходным кодом Google F1, которая вдохновила его на разработку в 2012 году.[3]
Описание
Apache Impala - это механизм запросов, работающий на Apache Hadoop. О проекте было объявлено в октябре 2012 г. бета-тест распределение[4][5] и стал общедоступным в мае 2013 года.[6]
Impala привносит в Hadoop технологию масштабируемых параллельных баз данных, позволяя пользователям решать проблемы с низкой задержкой. SQL запросы к данным, хранящимся в HDFS и Apache HBase без необходимости перемещения или преобразования данных. Impala интегрирована с Hadoop для использования тех же форматов файлов и данных, метаданных, структур безопасности и управления ресурсами, которые используются в Уменьшение карты, Apache Hive, Апачская свинья и другое программное обеспечение Hadoop.
Impala предлагается аналитикам и специалистам по обработке данных для анализа данных, хранящихся в Hadoop, с помощью SQL или бизнес-аналитика инструменты. В результате крупномасштабная обработка данных (через MapReduce) и интерактивные запросы могут выполняться в одной и той же системе с использованием одних и тех же данных и метаданных, что устраняет необходимость переносить наборы данных в специализированные системы и / или собственные форматы просто для выполнения анализа.
Возможности включают:
- Поддерживает HDFS и Apache HBase место хранения,
- Читает форматы файлов Hadoop, включая текст, LZO, SequenceFile, Авро, RCFile, и Паркет,
- Поддерживает безопасность Hadoop (Kerberos аутентификация ),
- Детализированная авторизация на основе ролей с Apache Sentry,
- Использует метаданные, ODBC драйвер и синтаксис SQL из Apache Hive.
В начале 2013 г. столбцовый формат файла называется Паркет было объявлено для архитектур, включая Impala.[7]В декабре 2013 г. Веб-сервисы Amazon объявил о поддержке Impala.[8]В начале 2014 г. MapR добавлена поддержка Impala.[9]В 2015 году был анонсирован еще один формат - Kudu, который Cloudera предложил пожертвовать Фонд программного обеспечения Apache вместе с Импалой.[10]Импала перешла на проект верхнего уровня Apache (TLP) 28 ноября 2017 г.[11]
Смотрите также
- Apache Drill - аналогичный проект с открытым исходным кодом, вдохновленный Dremel
- Дремель - аналогичный инструмент от Google
- Престо - движок SQL-запросов с открытым исходным кодом, созданный Facebook и поддерживаемый Терадата
Рекомендации
- ^ «Выпуск 3.3.0». Получено 23 августа 2019.
- ^ «Апач Импала». Получено 15 сентября 2017.
- ^ Кейд Мец (24 октября 2012 г.). "Человек вылетает из Google, перестраивает сверхсекретную машину запросов". Проводной журнал. Получено 10 октября, 2016.
- ^ Ларри Дигна (24 октября 2012 г.). «Cloudera стремится предоставить Hadoop запросы в режиме реального времени, большие данные». Между строк блог. ZDNet. Получено 20 января, 2014.
- ^ Эндрю Бруст (25 октября 2012 г.). «Impala от Cloudera привносит Hadoop в SQL и BI». ZDNet. Получено 20 января, 2014.
- ^ Марсель Корнакер, Джастин Эриксон (1 мая 2013 г.). «Cloudera Impala 1.0: это здесь, это реально, это уже стандарт для SQL в Hadoop». Архивировано из оригинал 13 апреля 2014 г.. Получено 10 апреля, 2014.
- ^ «Паркет: столбчатое хранилище для Hadoop». Веб-сайт проекта. 2013. Получено 20 января, 2014.
- ^ «Объявление о поддержке Impala с помощью Amazon Elastic MapReduce». Amazon.com. 12 декабря 2013 г.. Получено 20 января, 2014.
- ^ «Импала для MapR». MapR.com. 2 февраля 2014 г.. Получено 10 апреля, 2014.
- ^ Дэвид Рамель (18 ноября 2015 г.). "Cloudera пожертвует Apache проекты по работе с большими данными Impala и Kudu". Тенденции разработки приложений. Получено 10 октября, 2016.
- ^ «Apache Software Foundation объявляет Apache® Impala ™ проектом высшего уровня». 28 ноября 2017 г.. Получено 30 ноября, 2017.
внешняя ссылка
- Apache Impala сайт проекта
- Импала GitHub исходный код проекта