Язык данных Perl - Perl Data Language

Язык данных Perl (PDL)
ПарадигмаМножество
РазработчикКарл Глейзбрук, Ярле Бринчманн, Туомас Лукка, и Кристиан Соллер
Впервые появился1996 (1996)
Стабильный выпуск
2.020 / 12 декабря 2019; 11 месяцев назад (2019-12-12)[1]
Операционные системыКроссплатформенность
ЛицензияСтандартная общественная лицензия GNU, Художественная лицензия
Интернет сайтPDL.perl.org
Под влиянием
APL, IDL, Perl

Язык данных Perl (сокращенно PDL) представляет собой набор бесплатно программное обеспечение расширения программирования массива для Язык программирования Perl. PDL расширяет структуры данных, встроенные в Perl, за счет включения больших многомерные массивы, и добавляет функции для управления этими массивами как векторными объектами. Он также предоставляет инструменты для обработка изображений, машинное обучение, компьютерное моделирование физических систем, а также графическое построение и представление. Простые операции автоматически векторизуются в полных массивах, поддерживаются операции более высокой размерности (например, умножение матриц).

Языковой дизайн

PDL - это векторизованный программирование массива язык: синтаксис выражения является разновидностью стандартного математического вектор обозначение, так что пользователь может комбинировать и работать с большими массивами с простыми выражениями. В этом отношении PDL следует по стопам Язык программирования APL, и его сравнивали с коммерческими языками, такими как MATLAB и Интерактивный язык данных, и на другие бесплатные языки, такие как NumPy и Октава.[2] В отличие от MATLAB и IDL, PDL обеспечивает большую гибкость в индексировании и векторизации: например, если подпрограмма обычно работает с двумерным матрица массив, передав ему 3-D куб данных обычно вызывает одну и ту же операцию с каждым двумерным слоем куба.[3]

PDL заимствует из Perl по крайней мере три основных типа программной структуры: императивное программирование, функциональное программирование, и конвейерное программирование формы можно комбинировать. Подпрограммы могут быть загружены либо через встроенный автозагрузка механизм или через обычный механизм модуля Perl. PDL-подобная функциональность включается в разработку Раку.[4]

Графика

Сюжет, созданный с использованием PDL

Верный клей язык Корни Perl, PDL заимствует из нескольких различных модулей для поддержки графики и построения графиков. NetPBM обеспечивает ввод-вывод файла изображения (хотя FITS поддерживается изначально). Gnuplot, PLplot, PGPLOT, и Прима модули поддерживаются для приложений 2-D графики и построения графиков, а также Gnuplot и OpenGL поддерживаются для трехмерного построения и рендеринга.

Ввод / вывод

PDL предоставляет средства для чтения и записи многих форматов открытых данных, включая JPEG, PNG, Гифка, PPM, MPEG, ПОДХОДИТ, NetCDF, GRIB, необработанные двоичные файлы и таблицы ASCII с разделителями. Программисты PDL могут использовать CPAN Библиотеки ввода-вывода Perl для чтения и записи данных в сотнях стандартных и нишевых форматов файлов.

Машинное обучение

PDL можно использовать для машинное обучение. Он включает модули, которые используются для выполнения классической кластеризации k-средних или общих и обобщенных методов линейного моделирования, таких как ANOVA, линейная регрессия, PCA и логистическая регрессия. Примеры использования PDL для задач регрессионного моделирования включают в себя оценку связи между уровнем образования и родовыми различиями родителей,[5] сравнение профилей взаимодействия РНК-белок, требующих нормализации на основе регрессии[6] и анализ спектров галактик.[7]

perldl

Установка PDL обычно сопровождается интерактивным ракушка известный как perldl, который можно использовать для выполнения простых вычислений, не требуя от пользователя создания файла программы Perl. Типичный сеанс perldl будет выглядеть примерно так:

perldl> $ x = PDL [[1, 2], [3, 4]];perldl> $ y = PDL [[5, 6, 7],[8, 9, 0]];perldl> $ z = $ x Икс $ y;perldl> п $ z;[ [21 24  7] [47 54 21]]

Команды, используемые в оболочке, представляют собой операторы Perl, которые можно использовать в программе с PDL модуль включен. Икс является перегруженный оператор за матричное умножение, и п в последней команде есть ярлык для Распечатать.

Выполнение

Ядро PDL написано на C. Большая часть функциональности написана на PP, метаязык для PDL, который обрабатывает векторизацию простых фрагментов C и связывает их с основным языком Perl через Perl's XS компилятор. Некоторые модули написаны на Фортран, с уровнем интерфейса C / PP. Многие из поставляемых функций написаны на самом PDL. PP доступен пользователю для написания расширений языка C для PDL. Существует также встроенный модуль (Inline :: Pdlpp), который позволяет вставлять определения функций PP непосредственно в сценарий Perl; соответствующий код компилируется на низком уровне и доступен как подпрограмма Perl.

PDL API использует базовую объектно-ориентированную функциональность Perl 5: PDL определяет новый тип скалярного объекта Perl (одноименно называется «PDL», произносится «piddle»), который действует как скаляр Perl, но содержит обычный напечатанный множество числовых или символьных значений. Все стандартные операторы Perl перегружены, поэтому их можно прозрачно использовать с объектами PDL, а PDL можно смешивать и сопоставлять с обычными скалярами Perl. Базовые модули предоставляют несколько сотен объектных методов для работы с PDL.

Версия раку

В Раку, PDL указан как признак в Сводке 9.[8] По состоянию на январь 2013 г. эта функция еще не реализована в Ракудо.

Смотрите также

Рекомендации

  1. ^ «Выпущен PDL 2.020». 12 декабря 2019.
  2. ^ «Возвращение Perl на первое место в области научных и финансовых вычислений».
  3. ^ «Онлайн-документация PDL (раздел PDL :: Threading)».
  4. ^ «Re: RFC 169 (v1) Предлагаемый синтаксис для доступа к матричным элементам и нарезки».
  5. ^ Abdellaoui A, Hottenga JJ, Willemsen G, Bartels M, van Beijsterveldt T, Ehli EA, Davies GE, Brooks A, Sullivan PF, Penninx BW, de Geus EJ, Boomsma DI (март 2015 г.). «Уровень образования влияет на уровни гомозиготности через миграцию и ассортативное спаривание». PLOS One. 10 (3): e0118935. Дои:10.1371 / journal.pone.0118935. ЧВК  4347978. PMID  25734509.
  6. ^ Ван Т., Се И, Сяо Г (январь 2014 г.). «dCLIP: вычислительный подход для сравнительного анализа CLIP-seq». Геномная биология. 15 (1): R11. Дои:10.1186 / gb-2014-15-1-r11. ЧВК  4054096. PMID  24398258.
  7. ^ Санчес С.Ф., Перес Э., Санчес-Бласкес П., Гонсалес Дж.Дж., Росалес-Ортега Ф.Ф., Кано-Ди аз М., Лопес-Коба С., Марино Р.А., Хиль-де-Пас А., Молла М., Лопес-Санчес А.Р., Баррекас Иракс -Ballesteros J (апрель 2016 г.). «Pipe3D, конвейер для анализа данных интегральной полевой спектроскопии: I. Новая философия подгонки FIT3D». Revista Mexicana de Astronomía y Astrofísica. 52: 21–53. Bibcode:2016RMxAA..52 ... 21S.
  8. ^ http://perlcabal.org/syn/S09.html#PDL_support

внешняя ссылка