Слежение за автобусом - Bus snooping
Слежение за автобусом или же автобус нюхает это схема, по которой контроллер когерентности (snooper) в тайник отслеживает или отслеживает автобусные транзакции, и его цель - поддерживать согласованность кеша в распределенные системы с общей памятью.[нужна цитата ] Кэш, содержащий контроллер когерентности (snooper), называется шпионский кеш. Эта схема была введена Равишанкаром и Гудманом в 1983 году.[1]
Как это устроено
Когда определенные данные совместно используются несколькими кэшами, и процессор изменяет значение общих данных, изменение должно быть распространено на все другие кеши, в которых есть копия данных. Это распространение изменений предотвращает нарушение системой согласованность кеша. Уведомление об изменении данных может быть выполнено с помощью отслеживания шины. Все слежки отслеживают каждую транзакцию в шине. Если на шине появляется транзакция, изменяющая блок общего кэша, все наблюдатели проверяют, есть ли в их кэшах одинаковая копия общего блока. Если в кэше есть копия совместно используемого блока, соответствующий анализатор выполняет действие для обеспечения согласованности кеша. Действие может быть румянец или признание недействительным блока кеша. Это также включает изменение состояния блока кеша в зависимости от протокола согласованности кеша.[2]
Типы протоколов отслеживания
В зависимости от способа управления локальной копией операции записи существует два типа протоколов отслеживания:
Запись-недействительный
Когда процессор выполняет запись в блок совместно используемого кэша, все общие копии в других кэшах становятся признан недействительным через слежение за автобусом. Этот метод гарантирует, что только одна копия данных может быть исключительно прочитана и записана процессором. Все остальные копии в других кэшах становятся недействительными. Это наиболее часто используемый протокол отслеживания. MSI, MESI, MOSI, MOESI, и MESIF протоколы относятся к этой категории.
Запись-обновление
Когда процессор выполняет запись в блок совместно используемого кэша, все общие копии других кешей обновляются посредством отслеживания шины. Этот метод передает данные записи во все кэши по шине. Он требует большего трафика шины, чем протокол записи-недействительности. Вот почему этот метод необычен. Дракон и Светлячок протоколы относятся к этой категории.[3]
Выполнение
Одна из возможных реализаций следующая:
В кеше будет три лишних биты:
- V - действительный
- D - грязный бит, означает, что данные в кеше не такие, как в памяти
- S - общий
Каждая строка кэша находится в одном из следующих состояний: «грязный» (обновлен локальным процессором), «действительный», «недействительный» или «общий». Строка кэша содержит значение, и его можно читать или записывать. Запись в строке кэша изменяет значение. Каждое значение находится либо в основной памяти (доступ к которой очень медленный), либо в одном или нескольких локальных кэшах (что происходит быстро). Когда блок впервые загружается в кеш, он помечается как «действительный».
При промахе чтения из локального кеша запрос чтения передается по шине. Все контроллеры кеша следить за автобусом. Если кто-то кэшировал этот адрес и находится в состоянии «грязный», он изменяет состояние на «действительный» и отправляет копию запрашивающему узлу. «Действительное» состояние означает, что строка кэша является текущей. В случае неудачной локальной записи (делается попытка записать это значение, но оно не находится в кэше) отслеживание шины гарантирует, что любые копии в других кэшах будут установлены как «недействительные». «Недействительный» означает, что копия существовала в кеше, но уже не актуальна.
Например, начальное состояние может выглядеть так:
Тег | ID | V | D | S --------------------- 1111 | 00 | 1 | 0 | 00000 | 01 | 0 | 0 | 00000 | 10 | 1 | 0 | 10000 | 11 | 0 | 0 | 0
После записи адреса 1111 00 он изменится на:
Тег | ID | V | D | S --------------------- 1111 | 00 | 1 | 1 | 00000 | 01 | 0 | 0 | 00000 | 10 | 1 | 0 | 10000 | 11 | 0 | 0 | 0
Логика кэширования контролирует шину и определяет, запрашивается ли кэшированная память. Если кеш грязный и общий и шина запрашивает эту память, отслеживающие элементы предоставят значение из кеша, а затем уведомят каждый блок, которому нужна эта память, что память была обновлена. Когда другие устройства получают уведомление об обновленном кэше, они отключат действительный бит для своего кеша этой переменной. Таким образом, исходный кеш будет помечен как эксклюзивный (бит S будет равен нулю)
При признании недействительным адреса, помеченного как грязный (т.е. один кеш будет иметь грязный адрес, а другой кеш записывает), кеш будет игнорировать этот запрос. Новый кеш будет помечен как грязный, действительный и эксклюзивный, и теперь этот кеш будет отвечать за адрес.[1]
Выгода
Преимущество использования слежения за шиной состоит в том, что он быстрее, чем механизм согласованности на основе каталогов. Совместно используемые данные помещаются в общий каталог, который поддерживает согласованность между кешами в системе на основе каталогов. Слежение за автобусом обычно выполняется быстрее, если их достаточно пропускная способность, потому что все транзакции - это запрос / ответ, который видят все процессоры.[2]
Недостаток
Недостаток слежения за автобусом ограничен масштабируемость. Частое отслеживание кеш-памяти вызывает "гонку" при доступе со стороны процессора, что может увеличить время доступа к кеш-памяти и энергопотребление. Каждый из запросов должен транслироваться всем узлам в системе. Это означает, что размер (физической или логической) шины и пропускная способность оно должно расти по мере того, как система становится больше.[2] Поскольку отслеживание шины плохо масштабируется, больше когерентный кеш NUMA (ccNUMA) системы, как правило, используют протоколы согласованности на основе каталогов.
Snoop-фильтр
Когда транзакция шины происходит с конкретным блоком кеша, все средства отслеживания должны отслеживать транзакцию шины. Затем шпионы ищут соответствующие тег кеша чтобы проверить, есть ли у него такой же блок кеша. В большинстве случаев кеши не имеют блока кеширования, поскольку хорошо оптимизированная параллельная программа не разделяет много данных между потоками. Таким образом, поиск тега кеша с помощью анализатора обычно является ненужной работой для кеша, у которого нет блока кеша. Но поиск тегов нарушает доступ процессора к кэш-памяти и вызывает дополнительное потребление энергии.
Один из способов уменьшить ненужное отслеживание - использовать фильтр отслеживания. Фильтр отслеживания определяет, нужно ли отслеживателю проверять свой тег кеша или нет. Отслеживающий фильтр представляет собой структуру на основе каталогов и отслеживает весь согласованный трафик, чтобы отслеживать состояния когерентности блоков кеша. Это означает, что фильтр отслеживания знает кеши, в которых есть копия блока кеша. Таким образом, это может предотвратить ненужное отслеживание кэшей, в которых нет копии блока кеша. В зависимости от расположения отслеживающего фильтра есть два типа фильтров. Один из них - это фильтр источника, который расположен на стороне кеша и выполняет фильтрацию до того, как когерентный трафик достигнет общей шины. Другой - это фильтр назначения, который расположен на стороне шины и блокирует ненужный когерентный трафик, исходящий из общей шины. Фильтр отслеживания также подразделяется на включающий и исключающий. Включенный фильтр отслеживания отслеживает наличие блоков кэша в кэшах. Однако эксклюзивный фильтр отслеживания отслеживает отсутствие блоков кэша в кэшах. Другими словами, попадание во включающий фильтр отслеживания означает, что соответствующий блок кэша удерживается кешами. С другой стороны, попадание в эксклюзивный фильтр отслеживания означает, что ни один кеш не имеет запрошенного блока кэша.[4]
Рекомендации
- ^ а б Равишанкар, Чинья; Гудман, Джеймс (28 февраля 1983 г.). Реализация кэша для нескольких микропроцессоров (PDF). С. 346–350.
- ^ а б c Ян Солихин (2016). Основы параллельной компьютерной архитектуры. С. 239–246.
- ^ Хеннесси, Джон Л; Паттерсон, Дэвид А. (2011). Компьютерная архитектура: количественный подход. стр.355 –356. ISBN 978-0123838728.
- ^ Ульфснес, Расмус (июнь 2013 г.). Разработка Snoop-фильтра для протоколов когерентности кэша на основе Snoop. Норвежский университет науки и технологий.
внешняя ссылка
- Джим Плюскеллик. Централизованные архитектуры с общей памятью.
- Snoop-фильтр.