PackCC - PackCC
Разработчики) | Арихиро Ёсида |
---|---|
Написано в | C |
Операционная система | Кроссплатформенность |
Тип | Генератор парсеров |
Лицензия | Лицензия MIT |
Интернет сайт | github |
PackCC это генератор парсеров за C. Его основные особенности заключаются в следующем:
- Создает синтаксический анализатор на письменном языке C из грамматики, описанной в ПЭГ,
- Повышает эффективность парсера за счет парсинг packrat,
- Поддерживает прямые и косвенные леворекурсивный грамматические правила,
- Создает потокобезопасный и повторно въезжающий парсер
- Состоит из единого компактного исходного файла.
Грамматика выходного синтаксического анализатора может быть описана в PEG (Parsing Expression Grammar). PEG - это язык синтаксического анализа сверху вниз, и аналогичен регулярное выражение грамматика. По сравнению с языком синтаксического анализа снизу вверх, например Yacc Во-первых, PEG гораздо более интуитивно понятен и не может быть двусмысленным. ПЭГ не требует токенизация быть отдельным шагом, и правила токенизации можно записать так же, как и любые другие правила грамматики.
Сгенерированный синтаксический анализатор может очень эффективно анализировать входные данные посредством синтаксического анализа пакетов. Парсинг packrat - это парсинг с рекурсивным спуском алгоритм, который ускоряется с помощью мемоизация. Используя синтаксический анализ packrat, любой ввод можно анализировать за линейное время. Однако без него результирующий синтаксический анализатор мог бы демонстрировать экспоненциальную временную производительность в худшем случае из-за неограниченной возможности просмотра вперед.
В отличие от обычных парсеров packrat, PackCC может поддерживать прямые и косвенные леворекурсивный грамматические правила.[1] Это делает правила грамматики более интуитивно понятными.
Сгенерированный код украшен и максимально прост для понимания. На самом деле, он использует много операторов goto, но потоки управления гораздо более отслеживаемы, чем штормы goto спагетти, генерируемые некоторыми другими генераторами синтаксического анализатора.
Сам PackCC находится под лицензией MIT, но сгенерированный код может распространяться по любой лицензии или использоваться в проприетарном программном обеспечении.
Пример входного файла
Калькулятор настольный. Обратите внимание, что включены леворекурсивные грамматические правила.
%префикс "вычисление"утверждение <- _ е:выражение _ EOL { printf("answer =% d п", е); } / ( !EOL . )* EOL { printf("ошибка п"); }выражение <- е:срок { $$ = е; }срок <- л:срок _ '+' _ р:фактор { $$ = л + р; } / л:срок _ '-' _ р:фактор { $$ = л - р; } / е:фактор { $$ = е; }фактор <- л:фактор _ '*' _ р:унарный { $$ = л * р; } / л:фактор _ '/' _ р:унарный { $$ = л / р; } / е:унарный { $$ = е; }унарный <- '+' _ е:унарный { $$ = +е; } / '-' _ е:унарный { $$ = -е; } / е:начальный { $$ = е; }начальный <- < [0-9]+ > { $$ = атой($1); } / '(' _ е:выражение _ ')' { $$ = е; }_ <- [ \т]*EOL <- ' n' / '\р\п' / 'р' / ';'%%int главный() { calc_context_t *ctx = calc_create(НОЛЬ); пока (calc_parse(ctx, НОЛЬ)); calc_destroy(ctx); возвращаться 0;}
Примечания
- ^ «Парсеры Packrat могут поддерживать левую рекурсию» Авторы: А. Варт, Дж. Р. Дуглас и Т. Миллштейн.