Пользовательский агент - User agent
В вычисление, а пользовательский агент это программное обеспечение ( программный агент ) действуя от имени Пользователь, например веб-браузер который «извлекает, отображает и облегчает взаимодействие конечных пользователей с веб-контентом».[1] Читатель электронной почты - это почтовый пользовательский агент.
Во многих случаях пользовательский агент действует как клиент в сетевой протокол используется в коммуникациях в клиент – сервер распределенных вычислений система. В частности, Протокол передачи гипертекста (HTTP) идентифицирует клиентское программное обеспечение, отправляющее запрос, используя заголовок пользовательского агента, даже если пользователь не управляет клиентом. В Протокол инициирования сеанса Протокол (SIP) (на основе HTTP) последовал за этим использованием. В SIP термин пользовательский агент относится к обеим конечным точкам сеанса связи.[2]
Идентификация пользовательского агента
Когда программный агент работает в сетевом протоколе, он часто идентифицирует себя, тип своего приложения, Операционная система, поставщик программного обеспечения или версия программного обеспечения, предоставив характеристический идентификатор нить своему действующему партнеру. В HTTP,[3] ГЛОТОК,[2] и NNTP[4] протоколы, эта идентификация передается в поле заголовка Пользователь-агент. Боты, такие как поисковые роботы, часто также включают URL и / или Адрес электронной почты таким образом Веб-мастер можете связаться с оператором бота.
Использование в HTTP
В HTTP Строка User-Agent часто используется для согласование содержания, где исходный сервер выбирает подходящий контент или рабочие параметры для ответа. Например, строка User-Agent может использоваться веб-сервером для выбора вариантов на основе известных возможностей конкретной версии клиентского программного обеспечения. Концепция адаптации контента встроена в стандарт HTTP в RFC 1945 «ради адаптации ответов, чтобы избежать ограничений конкретных пользовательских агентов».
Строка User-Agent является одним из критериев, по которым поисковые роботы могут быть исключены из доступа к определенным частям веб-сайта с помощью Стандарт исключения роботов (robots.txt файл).
Как и во многих других заголовках HTTP-запросов, информация в строке «User-Agent» вносит свой вклад в информацию, которую клиент отправляет на сервер, поскольку строка может значительно отличаться от пользователя к пользователю.[5]
Формат для веб-браузеров, управляемых человеком
Формат строки User-Agent в настоящее время указан в разделе 5.5.3 HTTP / 1.1 Семантика и контент. Формат строки User-Agent в HTTP - это список токенов продукта (ключевых слов) с дополнительными комментариями. Например, если продукт пользователя называется WikiBrowser, строка его пользовательского агента может быть WikiBrowser / 1.0 Gecko / 1.0. Первым указывается «самый важный» компонент продукта.
Части этой строки следующие:
- название и версия продукта (WikiBrowser / 1.0)
- верстка и версия (Геккон / 1.0)
Во время первого браузерная война, многие веб-серверы были настроены для отправки веб-страниц, требующих расширенных функций, в том числе кадры, клиентам, которые были идентифицированы как некоторая версия Mozilla только.[6] Другие браузеры считались устаревшими продуктами, например Мозаика, Виолончель, или же Самба, и будет отправлен простой HTML-документ.
По этой причине большинство веб-браузеров используют строковое значение User-Agent следующим образом:
Mozilla / [версия] ([информация о системе и браузере]) [платформа] ([сведения о платформе]) [расширения]. Например, в Safari на iPad использовалось следующее:
Mozilla / 5.0 (iPad; U; CPU OS 3_2_1, например Mac OS X; en-us) AppleWebKit / 531.21.10 (KHTML, например Gecko) Mobile / 7B405
Компоненты этой строки следующие:
- Mozilla / 5.0: Ранее использовалось для обозначения совместимости с механизмом рендеринга Mozilla.
- (iPad; U; CPU OS 3_2_1, например Mac OS X; en-us): Подробная информация о системе, в которой работает браузер.
- AppleWebKit / 531.21.10: Платформа, которую использует браузер.
- (KHTML, например, Gecko): Сведения о платформе браузера.
- Мобильный / 7B405: Это используется браузером для обозначения конкретных улучшений, доступных непосредственно в браузере или через третьих лиц. Примером этого является Microsoft Live Meeting, которая регистрирует расширение, чтобы служба Live Meeting знала, установлено ли уже программное обеспечение, что означает, что она может упростить процесс присоединения к собраниям.
Перед переходом на Хром кодовая база, Опера был наиболее широко используемым веб-браузером, в котором строка User-Agent не начиналась с «Mozilla» (вместо этого начиналась с «Opera»). С 15 июля 2013 г.[7] Строка User-Agent Opera начинается с «Mozilla / 5.0» и, чтобы избежать столкновения с устаревшими правилами сервера, больше не включает слово «Opera» (вместо этого используется строка «OPR» для обозначения версии Opera).
Формат для автоматических агентов (ботов)
Инструменты автоматического сканирования Интернета могут использовать упрощенную форму, где важным полем является контактная информация в случае возникновения проблем. По соглашению в имя агента входит слово «бот».[8] Например:
Googlebot / 2.1 (+ http: //www.google.com/bot.html)
Ожидается, что автоматические агенты будут следовать правилам в специальном файле с именем "robots.txt ".
Подмена пользовательского агента
Популярность различных продуктов для веб-браузеров менялась на протяжении всей истории Интернета, и это повлияло на дизайн веб-сайтов таким образом, что веб-сайты иногда проектируются так, чтобы они хорошо работали только с определенными браузерами, а не в соответствии с едиными стандартами, установленными Консорциум World Wide Web (W3C) или Инженерная группа Интернета (IETF). Веб-сайты часто включают код для определения версии браузера, чтобы настроить дизайн страницы, отправляемой в соответствии с полученной строкой пользовательского агента. Это может означать, что менее популярные браузеры не отправляют сложный контент (даже если они могут правильно с ним работать) или, в крайних случаях, отказываются от всего контента.[9] Таким образом, в различных браузерах есть возможность плащ или же обман их идентификация для принудительного использования определенного содержимого на стороне сервера. Например, браузер Android идентифицирует себя как Сафари (среди прочего) для обеспечения совместимости.[10][11]
Другие клиентские программы HTTP, например менеджеры загрузки и автономные браузеры, часто имеют возможность изменять строку пользовательского агента.
Спам-боты и Веб-скребки часто используют поддельные пользовательские агенты.
Результатом спуфинга пользовательского агента может быть то, что статистика использования веб-браузера неточны.
Обнюхивание пользовательского агента
Обнюхивание пользовательского агента Это практика, когда веб-сайты показывают различный или скорректированный контент при просмотре с помощью определенных пользовательских агентов. Примером этого является Сервер Microsoft Exchange Функция Outlook Web Access 2003 года. При просмотре в Internet Explorer 6 или новее отображается больше функциональных возможностей по сравнению с той же страницей в любых других браузерах. Обнюхивание пользовательского агента считается плохой практикой, поскольку оно поощряет дизайн, специфичный для браузера, и наказывает новые браузеры с неопознанными идентификаторами пользовательского агента. Вместо этого W3C рекомендует создавать стандартную разметку HTML,[12] обеспечение правильного рендеринга в максимально возможном количестве браузеров и проверка конкретных функций браузера, а не конкретных версий или брендов браузеров.[13]
Веб-сайты, предназначенные для отображения на мобильных телефонах, часто полагаются на сниффинг пользовательского агента, поскольку мобильные браузеры часто сильно отличаются друг от друга.
Обозначения стойкости шифрования
Веб-браузеры, созданные в США, например Netscape Navigator и Internet Explorer, ранее использовали буквы U, I и N для обозначения шифрование сила в строке пользовательского агента. До 1996 года, когда правительство США запретило экспортировать шифрование с ключами длиной более 40 бит, поставщики поставляли различные версии браузеров с разной степенью шифрования. «U» означает «США» (версия со 128-битным шифрованием), «I» означает «международный» - браузер имеет 40-битное шифрование и может использоваться в любой точке мира, а «N» означает (де-факто) для «Нет» (без шифрования).[14] После отмены экспортные ограничения, большинство производителей поддерживают 256-битное шифрование.
Прекращение поддержки заголовка User-Agent
В 2020 г. Google объявили, что они прекращают поддержку заголовка User-Agent в своих Гугл Хром браузер. Они заявили, что другие крупные поставщики веб-браузеров поддержали этот шаг, но не знают, когда другие поставщики последуют их примеру.[15] Google заявил, что новая функция называется Подсказки для клиентов заменит функциональность строки User-Agent.[16]
Смотрите также
- Стандарт исключения роботов
- Поисковый робот
- Универсальный файл ресурсов беспроводной связи (WURFL)
- Профиль агента пользователя (UAProf)
- Обнюхивание браузера
- Движок веб-браузера
Рекомендации
- ^ "Определение W3C агента пользователя". www.w3.org. 16 июня 2011 г.. Получено 2018-10-20.
- ^ а б RFC 3261, SIP: протокол инициирования сеанса, IETF, Интернет-сообщество (2002 г.)
- ^ RFC 7231, Протокол передачи гипертекста (HTTP / 1.1): семантика и содержание, IETF, The Internet Society (июнь 2014 г.)
- ^ Формат статьи Netnews. IETF. Ноябрь 2009. с. 3.2.13. Дои:10.17487 / RFC5536. RFC 5536.
- ^ Питер Экерсли. "Версии браузера несут в среднем 10,5 бит идентифицирующей информации ", Фонд электронных рубежей, 27 января 2010. Проверено 25 августа 2011.
- ^ История строки пользовательского агента браузера. WebAIM.
- ^ "Строки пользовательского агента Opera: Opera 15 и выше". dev.opera.com. 15 июля 2013 г.. Получено 2014-05-05.
- ^ "https://www.rankwatch.com/blog/handle-bot-herding-and-spider-wrangling-for-rankings/"
- ^ Бурштейн жалуется: «... Мне отказали, пока я не вернусь с Netscape»
- ^ «Браузер Android сообщает о себе как Apple Safari». Архивировано из оригинал 6 августа 2011 г.. Получено 9 августа, 2011.
- ^ «Объяснение строки агента пользователя: браузер Android Webkit». UserAgentString.com. Получено 29 июля 2012.
Mozilla / 5.0 (Linux; U; Android 2.2; en-sa; HTC_DesireHD_A9191 Build / FRF91) AppleWebKit / 533.1 (KHTML, как Gecko) Версия / 4.0 Mobile Safari / 533.1
- ^ Пембертон, Стивен. «Служба проверки разметки W3C». W3C. Получено 2011-10-18.
- ^ Клэри, Боб (10 февраля 2003 г.). «Обнаружение браузера и кроссбраузерная поддержка». Центр разработчиков Mozilla. Mozilla. Получено 2009-05-30.
- ^ Завински, Джейми (28 марта 1998 г.). "строки агента пользователя (устарело)". mozilla.org. Получено 2010-01-08.
- ^ «Прекращение поддержки Chrome для агента пользователя». InfoQ. Получено 2020-03-25.
- ^ Чимпану, Каталин. "Google постепенно откажется от строк пользовательского агента в Chrome". ZDNet. Получено 2020-03-25.