Регулярные выражения для url адресов

Регулярные выражения для url адресов

Получение частей URL (регулярное выражение)

Как я могу извлечь следующие части, используя регулярные выражения:

  1. Субдомен (тест)
  2. Домен (example.com)
  3. Путь без файла (/dir/subdir/)
  4. Файл (file.html)
  5. Путь с файлом (/dir/subdir/file.html)
  6. URL без пути (http://test.example.com)
  7. (добавьте любые другие, которые вы считаете полезными)

Регулярное выражение должно работать правильно, даже если я введу следующий URL:

ОТВЕТЫ

Ответ 1

вы могли бы более подробно проанализировать хост (‘.’ delimited).

Что может сделать I — это что-то вроде этого:

дальнейший синтаксический анализ «остальное» должен быть как можно более конкретным. Выполнение этого в одном регулярном выражении, ну, немного сумасшедшее.

Ответ 2

Я понимаю, что опаздываю на вечеринку, но есть простой способ разрешить браузеру анализировать URL-адрес для вас без регулярного выражения:

Ответ 3

Я опаздываю на вечеринку на несколько лет, но я удивлен, что никто не упомянул, что спецификация Uniform Resource Identifier содержит раздел для разбора URI с помощью регулярное выражение. Регулярное выражение, написанное Бернерсом-Ли и др., Представляет собой:

Цифры во второй строке выше предназначены только для удобства чтения; они указывают контрольные точки для каждого подвыражения (то есть каждый парные скобки). Мы ссылаемся на значение, соответствующее подвыражению как $. Например, сопоставление указанного выражения с

http://www.ics.uci.edu/pub/ietf/uri/#Related

приводит к следующим подвыражениям:

Для чего это стоит, я обнаружил, что мне пришлось скрывать косые черты в JavaScript:

Ответ 4

Я нашел, что самый высокий голосовой ответ (hometoast answer) не работает отлично для меня. Две проблемы:

  • Он не может обрабатывать номер порта.
  • Хеш-часть сломана.

Ниже приведена модифицированная версия:

Положение частей выглядит следующим образом:

Редактировать сообщение пользователем anon:

Ответ 5

Мне нужно регулярное выражение для соответствия всем URL-адресам и сделало это:

Он соответствует всем URL-адресам, любому протоколу, даже URL-адресам, например

Результат (в JavaScript) выглядит следующим образом:

Ответ 6

Я пытался решить это в javascript, с которым следует обращаться:

поскольку (в Chrome, по крайней мере) он анализирует:

Однако это не перекрестный браузер (https://developer.mozilla.org/en-US/docs/Web/API/URL), поэтому я собрал это вместе, чтобы вытащить те же части, что и выше:

Кредит для этого регулярного выражения отправляется в https://gist.github.com/rpflorence, который разместил этот jsperf http://jsperf.com/url-parsing (изначально найденный здесь: https://gist.github.com/jlong/2428561#comment-310066), который придумал регулярное выражение, изначально основанное на.

Детали находятся в следующем порядке:

Существует также небольшая библиотека, которая обертывает ее и предоставляет параметры запроса:

Если у вас есть улучшения, пожалуйста, создайте запрос на растяжение с большим количеством тестов, и я соглашусь и объединиться с благодарностью.

Ответ 7

Это не прямой ответ, но большинство веб-библиотек имеют функцию, которая выполняет эту задачу. Функция часто называется чем-то похожей на CrackUrl . Если такая функция существует, используйте ее, она почти гарантированно будет более надежной и эффективной, чем любой ручной код.

Ответ 8

Он поддерживает HTTP/FTP, субдомены, папки, файлы и т.д.

Я нашел его из быстрого поиска google:

Ответ 9

субдомен и домен сложны, поскольку субдомен может иметь несколько частей, а также домен верхнего уровня, http://sub1.sub2.domain.co.uk/

(Markdown не очень дружит с регулярными выражениями)

Ответ 10

Эта улучшенная версия должна работать надежно, как синтаксический анализатор.

Ответ 11

Предложите гораздо более читаемое решение (в Python, но применимо к любому регулярному выражению):

Ответ 12

Из моего ответа на аналогичный вопрос. Работает лучше, чем некоторые из упомянутых других, потому что у них были некоторые ошибки (например, не поддерживающие имя пользователя/пароль, не поддерживающие односимвольные имена файлов, сломанные идентификаторы).

Ответ 13

Вы можете получить все http/https, хост, порт, путь, а также запрос, используя объект Uri в .NET. просто сложная задача — разбить хост на субдомен, доменное имя и TLD.

Нет никакого стандарта для этого и не может просто использовать синтаксический анализ строк или RegEx для получения правильного результата. Во-первых, я использую функцию RegEx, но не все URL-адреса могут правильно разбирать субдомен. Практический путь — использовать список TLD. После определения TLD для URL-адреса левая часть является доменом, а остальные — поддоменью.

Однако список должен поддерживать его, поскольку возможны новые TLD. В настоящий момент я знаю, что publicsuffix.org поддерживает последний список, и вы можете использовать инструменты domainname-parser из кода google для анализа открытого списка суффикса и получения поддомена, домена и TLD с помощью объекта DomainName: domainName.SubDomain, domainName.Domain и domainName.TLD.

Ответ 14

К сожалению, это не работает с некоторыми URL-адресами. Возьмем, к примеру, этот: http://www.example.org/&value=329

Также значение & value = 329

Или даже без каких-либо параметров (простой URL-адрес)!

Я понимаю, что регулярное выражение ожидает некоторый серьезный сложный/длинный URL-адрес, но он также должен работать на простых, верно?

Ответ 15

Вот один из них, который является полным и не полагается на какой-либо протокол.

Печать

Ответ 16

Ничто из этого не помогло мне. Вот что я в итоге использовал:

Ответ 17

Мне нравится регулярное выражение, которое было опубликовано в «Javascript: The Good Parts». Он не слишком короткий и не слишком сложный. Эта страница на github также имеет код JavaScript, который ее использует. Но это адаптировано для любого языка. https://gist.github.com/voodooGQ/4057330

Ответ 18

Java предлагает класс URL, который сделает это. Объекты URL запроса.

С одной стороны PHP предлагает parse_url().

Ответ 19

Я бы рекомендовал не использовать regex. Вызов API, такой как WinHttpCrackUrl(), менее подвержен ошибкам.

Ответ 20

Использование http://www.fileformat.info/tool/regex.htm hometoast regex отлично работает.

Но вот сделка, я хочу использовать разные шаблоны регулярных выражений в разных ситуациях в моей программе.

Например, у меня есть этот URL, и у меня есть перечисление, в котором перечислены все поддерживаемые URL-адреса в моей программе. Каждый объект в перечислении имеет метод getRegexPattern, который возвращает шаблон регулярного выражения, который затем будет использоваться для сравнения с URL-адресом. Если конкретный шаблон регулярного выражения возвращает true, то я знаю, что этот URL-адрес поддерживается моей программой. Таким образом, каждое перечисление имеет собственное регулярное выражение в зависимости от того, где он должен выглядеть внутри URL.

Предложение Hometoast замечательно, но в моем случае, я думаю, что это не помогло бы (если только я не скопирую одно и то же регулярное выражение во всех перечислениях).

Вот почему я хотел получить ответ, чтобы дать регулярное выражение для каждой ситуации отдельно. Хотя +1 для hometoast.;)

Ответ 21

Я знаю, что вы претендуете на язык-агностик на этом, но можете ли вы рассказать нам, что используете, чтобы мы знали, какие у вас есть возможности регулярного выражения?

Если у вас есть возможности для неадаптирующих совпадений, вы можете изменить выражение hometoast, чтобы подвыражения, которые вы не заинтересованы в захвате, настроены следующим образом:

Вам все равно придется копировать и вставлять (и слегка модифицировать) Regex на несколько мест, но это имеет смысл — вы не просто проверяете, существует ли подвыражение, а скорее, если оно существует как часть URL. Использование модификатора non-capture для подвыражений может дать вам то, что вам нужно, и не более того, что, если я правильно вас читаю, — это то, что вы хотите.

Как маленькая, маленькая заметка, выражение hometoast не нужно помещать скобки вокруг ‘s’ для ‘https’, так как у него только один символ. Квантеры определяют количественно один символ (или класс символов или подвыражение), непосредственно предшествующий им. Итак:

будет соответствовать «http» или «https» просто отлично.

Ответ 22

regexp, чтобы получить URL-путь без файла.

Это может быть полезно для добавления относительного пути к этому URL-адресу.

Ответ 23

Будет представлен следующий результат:
1: https://
2: www.thomas-bayer.com
3:/
4: axis2/services/BLZService? Wsdl

наслаждаться..
Йоси Лев

Ответ 24

Регулярное выражение для полного разбора довольно ужасает. Я включил названные обратные ссылки для удобочитаемости и разбил каждую часть на отдельные строки, но все равно выглядит следующим образом:

Вещью, требующей, чтобы она была настолько подробной, заключается в том, что, за исключением протокола или порта, любая из частей может содержать объекты HTML, что делает очерчивание фрагмента довольно сложным. Таким образом, в последних нескольких случаях — хост, путь, файл, запрос и фрагмент, мы разрешаем любой объект html или любой символ, который не является ? или # . Регулярное выражение для объекта html выглядит следующим образом:

Когда это извлечено (я использовал синтаксис уса для его представления), он становится немного более разборчивым:

В JavaScript, конечно, вы не можете использовать именованные обратные ссылки, поэтому регулярное выражение становится

и в каждом совпадении протокол 1 , хост 2 , порт 3 , путь 4 , файл 5 , строка запроса 6 и фрагмент 7 .

Ответ 25

Я попробовал несколько из них, которые не покрывали моих потребностей, особенно самые высокие, проголосовавшие, которые не улавливали URL-адрес без пути (http://example.com/)

также отсутствие названий групп сделало его непригодным в недоступном (или, возможно, умениях jinja2 отсутствуют).

так что это моя версия, слегка измененная с тем, что источник является самой высокой проголосовавшей версией здесь:

Примеры регулярных выражений

Приведенные ниже примеры показывают, как использовать и составлять простые регулярные выражения. Каждый пример содержит искомый текст, одно или несколько соответствующих ему регулярных выражений, а также примечания, поясняющие использование специальных символов и форматов.

Важно! Поддерживается только синтаксис RE2, который немного отличается от PCRE. Обратите внимание, что регулярные выражения по умолчанию вводятся с учетом регистра.

Пример 2: (W|^)сборникs<0,3>законов<0,1>(W|$)

  • W соответствует любому символу, кроме букв, цифр и знака подчеркивания. Этот элемент исключает из поиска символы в начале или конце фразы.
  • В примере 2 элемент s соответствует пробелу, а <0,3>указывает на то, что между словами сборник и законов может быть от 0 до 3 пробелов.
  • ^ соответствует началу новой строки. Этот элемент позволяет искать с помощью регулярного выражения фразы, которые находятся в начале строки и перед которыми отсутствуют символы.
  • $ соответствует окончанию строки. Этот элемент позволяет искать с помощью регулярного выражения фразы, которые находятся в конце строки и после которых отсутствуют символы.
  • В примере 3 (s) соответствует букве и, а <0,1>указывает на то, что эта буква может встречаться 0 или 1 раз в конце слова «сборник». Таким образом, регулярное выражение ищет словосочетание сборник законов и сборники законов. Другой вариант: вместо <0,1>можно использовать символ «?».
  • туфта
  • проклятие
  • убирайся
  • бред
  • черт возьми
  • зараза

Элемент (. ) объединяет все слова, а класс символов W применяется ко всем словам в круглых скобках.

(?i) делает выражение нечувствительным к регистру.

W соответствует любому символу, кроме букв, цифр и знака подчеркивания. Этот элемент исключает из поиска символы в начале или конце слова или фразы из списка.

^ соответствует началу новой строки. Этот элемент позволяет искать с помощью регулярного выражения слова, которые находятся в начале строки и перед которыми отсутствуют символы.

$ соответствует окончанию строки. Этот элемент позволяет искать с помощью регулярного выражения слова, которые находятся в конце строки и после которых отсутствуют символы.

Знак | соответствует оператору «или»; таким образом, регулярное выражение будет искать каждое слово из списка по отдельности.

s соответствует пробелу. Этот символ используется для разделения слов в фразе.

  • ви@гра
  • веагра
  • ве@гра
  • в№@гр@
  • Элемент W не используется, так как до и после любых вариантов написания слова виагра могут быть расположены другие символы. Например, регулярное выражение будет искать слово виагра в следующем тексте:

виагра!! или ***виагра***

  • [ие№] соответствует символам и, е и на позиции второго знака в слове.
  • W соответствует любому символу, кроме букв, цифр и знака подчеркивания. Этот элемент исключает из поиска символы в начале или конце адреса электронной почты.
  • ^ соответствует началу новой строки. Этот элемент позволяет искать с помощью регулярного выражения адреса, которые находятся в начале строки и перед которыми отсутствуют символы.
  • $ соответствует окончанию строки. Этот элемент позволяет искать с помощью регулярного выражения адреса, которые находятся в конце строки и после которых отсутствуют символы.
  • Элемент [w.-] соответствует любому словообразующему символу (a-z, A-Z, 0-9 и знаку подчеркивания), точке или дефису. Эти символы используются чаще всего в первой части адреса электронной почты. Обратите внимание, что элемент -, обозначающий дефис, должен находиться в конце списка символов, заключенных в квадратные скобки.
  • Знак перед дефисом и точкой исключает эти символы из поиска, т. е. указывает, что тире и точка не являются специальными символами регулярного выражения. Обратите внимание, что экранировать точку, которая находится в квадратных скобках, не нужно.
  • <0,25>указывает на то, что перед символом @ может находиться набор символов, состоящий из 0–25 знаков. Настройки соответствия содержания в электронной почте поддерживают в регулярных выражениях наборы символов длиной до 25 знаков.
  • Элемент (…) объединяет домены, а разделяющий их символ | соответствует оператору «или».
  • Знак перед каждой точкой исключает ее из поиска, т. е. указывает, что точка не является специальным символом регулярного выражения.
  • В примере 1 отсутствуют символы после последней точки, поэтому регулярное выражение будет искать все IP-адреса, которые начинаются с цифр 192.168.1., вне зависимости от последующих цифр.
  • В примере 2 элемент d соответствует любой цифре от 0 до 9 после последней точки, а <1,3>указывает, что за последней точкой может следовать от 1 до 3 цифр. В этом случае регулярное выражение будет искать все полные IP-адреса, которые начинаются с цифр 192.168.1. Обратите внимание, что такое регулярное выражение также будет находить недопустимые IP-адреса, например 192.168.1.999.
  • PO nn-nnnnn
  • PO-nn-nnnn
  • PO# nn nnnn
  • PO#nn-nnnn
  • PO nnnnnn
  • W соответствует любому символу, кроме букв, цифр и знака подчеркивания. Этот элемент исключает из поиска символы в начале или конце номера.
  • ^ соответствует началу новой строки. Этот элемент позволяет искать с помощью регулярного выражения номера, которые находятся в начале строки и перед которыми отсутствуют символы.
  • $ соответствует окончанию строки. Этот элемент позволяет искать с помощью регулярного выражения номера, которые находятся в конце строки и после которых отсутствуют символы.
  • Элемент [#-] соответствует знаку решетки или дефису после букв «po», а <0,1>указывает, что любой из этих символов может входить в искомую строку 0 или 1 раз. Обратите внимание, что элемент -, обозначающий дефис, должен находиться в конце списка символов, заключенных в квадратные скобки.
  • Элемент s соответствует пробелу, а <0,1>указывает, что он может входить в искомую строку 0 или 1 раз.
  • Элемент d соответствует любой цифре от 0 до 9, а <2>указывает, что на этой позиции в числе должно быть ровно 2 цифры.

Неиспользуемые символы в регулярных выражениях

Регулярные выражения со следующими символами не поддерживаются, так как могут привести к задержкам при обработке вашего письма:

Перенаправление. Регулярные выражения

Регулярное выражение представляет собой группу символов, используемых для поиска шаблона внутри фрагмента текста.

В контексте перенаправления простой URL-адрес соответствует точно одному URL-адресу. URL-адрес регулярного выражения может соответствовать многим URL-адресам.

В дополнение к сопоставлению многих URL-адресов регулярное выражение может извлекать информацию из исходного URL-адреса и копировать его на целевой URL-адрес.

Несколько примеров могут оказаться полезными. Переадресация с исходным URL-адресом /my-url будет соответствовать только запросам /my-url .

Переадресация с исходным URL-адресом /my-url/.* будет соответствовать запросам:

  • /my-url/this
  • /my-url/that

Важная часть /my-url/.* есть .* . Это часть регулярного выражения URL-адреса и эквивалентна выражению «соответствие, /my-url/ за которым следует любая последовательность символов».

Синтаксис регулярного выражения

Таким образом, регулярные выражения, например, .* кажутся действительно полезными. Но что это значит?

В этом случае . означает «любой символ», а * значит — любое число предыдущего выражения. То есть любое количество символов.

Но подождите, это становится намного сложнее!

Регулярные выражения допускают очень подробные и сложные шаблоны, выходящие за рамки этой страницы. Если вы хотите получить более подробную информацию, ищите «регулярные выражения» и соглашайтесь на длительный сеанс чтения.

Извлечение исходной информации

Мало того, что регулярное выражение соответствует многим URL-адресам, оно также может извлекать информацию из исходного URL-адреса и копировать ее на целевой URL-адрес.

Почему вы хотите это сделать? Давайте посмотрим на другой пример. Скажите, что у вас есть сайт, на котором находятся некоторые страницы под /oldpage/ каталогом, и вы переместили их /newpage/ .

  • /oldpage/bananas/
  • /oldpage/best-post-in-the-world/ ​

И вы хотите перенести их на:

  • /newpage/bananas/
  • /newpage/best-post-in-the-world/

То есть, вы хотите изменить , /oldpage/ на /newpage/ , но сохранить bananas и best-post-in-the-world .

Для этого вы можете создать регулярное выражение, например /oldpage/(.*) .

Обратите внимание, что .* окружены скобками. Это говорит, что перенаправление «захватывает» данные. Тогда нужно указать целевой URL /newpage/$1 .

Здесь $1 заменяется содержимым захваченного (.*) . Так что:

/oldpage/bananas => /oldpage/(bananas) => /newpage/$1 => /newpage/bananas

Бесконечные петли

Часто встречающаяся проблема с регулярным выражением — это бесконечное перенаправление . То есть вы создаете регулярное выражение, которое перенаправляет на URL-адрес, который сам попадает в одно и то же регулярное выражение. Затем это перенаправляется снова и снова и снова, пока браузер не остановится с ERR_TOO_MANY_REDIRECTS сообщением (или эквивалентом).

Например, скажем, у нас есть это перенаправление:

Если вы получите доступ к /index.php/banana то, он будет перенаправлен на /portal/index.php/banana . Но подождите! Сам URL /portal/index.php/banana совпадает с исходным регулярным выражением в виде index.php/banana совпадений . /portal/index.php/(.*)

Если мы используем ^ символ carat, мы можем исправить совпадение до начала URL-адреса:

Здесь указано ^ регулярное выражение, которое применяется только при совпадении в начале URL-адреса. Это предотвращает его соответствие в другом месте URL-адреса и останавливает бесконечное перенаправление.

Тестирование регулярных выражений

Существует множество ресурсов для регулярных выражений, а некоторые из наиболее полезных — тестеры регулярных выражений. С их помощью вы можете экспериментировать с шаблоном и настраивать его так, чтобы он точно соответствовал вам.

Обратите внимание, что Redirection использует регулярные выражения PHP . Они обычно известны как PCRE и могут быть не такими же, как другие библиотеки регулярных выражений.

Хороший ресурс для понимания регулярных выражений можно найти здесь .

Общие регулярные выражения

Следующие регулярные выражения обычно используются для WordPress:

Перенаправление дня и имени :

Пример: /2017/01/01/thing/ => /thing/

Перенаправить все URL-адреса, /blog/ кроме тех, которые начинаются с /blog/ :

Регулярные выражения в PHP

Регулярные выражения ( сокращенно — regex ) представляют собой последовательности символов, которые формируют шаблоны поиска. В основном они используются в шаблонах сопоставления со строками.

  • Все началось в 1940 — 1960-х годах, когда множество умных людей говорили о регулярных выражениях;
  • 1970-е годы g / re / p;
  • 1980 Perl и Генри Спенсер;
  • 1997 PCRE (регулярные выражения, совместимые с Perl). Именно тогда начался взлет того, что мы называем регулярные выражения. PCRE предоставляет библиотеки почти для каждого языка.

Общее использование регулярных выражений в PHP

PHP включает в себя три основные функции для работы с PCRE — preg_match , preg_match_all и preg_replace .

Выражение возвращает 1 , если соответствие установлено, 0 — если нет, и false — если возникает ошибка:

Регулярного выражения пример, который возвращает количество найденных совпадений:

Выражение возвращает замененную строку или массив ( на основе объекта $subject ):

Общее использование регулярных выражений в JavaScript

Регулярные выражения в JavaScript выглядят почти так же, как и в PHP .

Возвращает массив совпадений или null , если совпадений не найдено:

Регулярное выражение, которое возвращает строку с выполненными заменами:

Особенности регулярных выражений в JavaScript
  • Точка никогда не соответствует новой строке:
  • Те же методы для сравнения соответствия и замены через регулярное выражение, что и без них.
Принципы составления шаблонов регулярных выражений

Рассмотрим пример, в котором нужно найти адреса электронной почты в базе кода. Наша цель: /[w.+-]+@[a-z0-9-]+(.[a-z0-9-]+)*/i

Регулярные выражения состоят из двух типов символов:

  • специальные символы: []? * + <> () ^ $ / .
  • Литералы.

Представьте себе входные строки как болты, а шаблон — как набор разъемов для них (в соответствующем порядке).

При проверке регулярных выражений нужно знать, как работают специальные символы:

  • Символ обратной косой черты может заменять другой специальный символ в регулярном выражении:
  • Точка и w — .

Совпадение со всеми символами, кроме новых строк. Если хотите проверить на соответствие точке, и только точке — , на соответствие буквам, цифрам и нижнему подчеркиванию — w

  • Квадратные скобки [] .

Совпадение с символами внутри скобок. Поддерживает диапазоны. Некоторые примеры:
o [abc] — соответствует любым a, b или c.
o [a-z] прописные буквы.
o [0-9] любая цифра.
o [a-zA-Z] — соответствует любому буквенному символу в нижнем или верхнем регистре.
• Опционально ? Соответствие 0 или 1.
• Звездочка *.

Звездочка обозначает 0 или более символов.

Соответствие 1 или более символам.

Минимальное и максимальное значения. Некоторые примеры синтаксиса регулярных выражений:
o <1,>не менее 1.
o <1,3>от 1 до 3.
o <1,64>от 1 до 64.

Добавим все это, чтобы получить регулярное выражение для адресов электронной почты:

URL-списки

URL-списки содержат правила обработки URL-запросов. Их основой является набор выражений, по которым проверяются URL-адреса, запрашиваемые пользователями. С их помощью можно, например, определить рекламу, сайты определенной тематики, конкретные веб-проекты и т.п. URL-списки используются в различных настройках программы, в частности, в правилах пользователей и правилах HTTP-прокси.

Перечень URL-списков, созданных в системе, находится в разделе Объекты -> URL-списки консоли администратора. Раздел состоит из двух частей. В верхней отображается список URL-списков. Нижняя часть состоит из двух вкладок. На вкладке URL списки отображаются основные параметры выбранного URL-списка, а на вкладке Список — список его выражений.

Также в разделе Объекты есть блок URL-списки , состоящий из двух вкладок. На вкладке Информация отображается общее количество созданных в системе URL-списков, а на вкладке Действия — ссылки на некоторые операции.

В рамках управления URL-списками в Traffic Inspector реализованы следующие операции:

  • создание/изменение URL-списка;
  • проверка выражения;
  • загрузка обновлений;
  • удаление URL-списка.

Для создания нового или изменения существующего URL-спсика выполните следующие действия:

  1. Откройте окно свойств нового или существующего URL-списка. Сделать это можно с помощью контекстного меню раздела Объекты -> URL-списки консоли администратора или в блоке URL-списки , который размещен на главной странице раздела Объекты .
  2. На вкладке Описание введите наименование создаваемого списка и, при необходимости, произвольные примечания. Здесь же выберите тип списка.
    • Вхождение подстроки — при использовании данного варианта Traffic Inspector будет проверять, входят ли в URL-адреса указанные на вкладке Список строки. Его удобно использовать для поиска четко определенных подстрок. Например, если в список добавить значение » foto «, то URL-адрес при вхождении этой подстроки в любую его часть будет соответствовать списку (например, http://foto.ru, http://company.com/foto, http://company.com/pics/foto.jpg и т.д.).
    • Регулярные выражения — при использовании данного варианта строки в списке представляют собой регулярные выражения. Это позволяет задавать значительно более сложные условия с использованием специального синтаксиса (подробнее о синтаксисе регулярных выражений см. в п. . ). Они позволяют определять искомые подстроки более точно, с учетом дополнительных факторов, что обеспечивает меньшее количество ложных срабатываний.

    При необходимости на вкладке можно выключить чувствительность к регистру. В этом случае анализ URL-адресов будет осуществляться без учета регистра символов.

    1. При необходимости включите автоматическое обновление списка с внешнего источника по протоколу HTTP. При включении задайте адрес списка, из которого будут загружаться обновления, а также в специальном окне настройте расписание загрузки.
    2. На вкладке Список настройте список выражений. Создавать его можно вручную, при этом каждое выражение пишется в отдельной строке. Также список может быть загружен из предварительно подготовленного файла.

    Замечание! Функция загрузки с внешнего источника доступна только в том случае, если были настроены параметры на вкладке Автозагрузка .

    Список может быть выгружен в виде текстового файла.

    Замечание! HTTP-прокси при обработке запроса передает URL вида /?. Другие части полного URL не передаются — префикс протокола (http//), IP-порт, логин и т.д. Это необходимо учитывать при формировании списка, а также его тестовой проверке.

    1. Сохраните внесенные изменения. При закрытии окна свойств производится проверка синтаксиса регулярных выражений. Если при этом будут найдены ошибки, то отобразится сообщение, на какой строке списка это произошло. В верхней части окна редактирования списка есть поле, где отображается номер редактируемой строки.

    В Traffic Inspector реализована функция проверки выражения, которая позволяет проверить, соответствует URL-адрес указанному URL-списку или нет. Проверка осуществляется в специальном окне, вызвать которое можно с вкладки Список окна свойства URL-списка или с помощью контекстного меню раздела Объекты -> URL-списки консоли администратора.

    В окне введите тестируемый URL-адрес и запустите проверку. Если адрес попал в список, то отображается номер первой строки (нумерация с «1»), где это условие выполнилось.

    Данная функция позволяет сразу загрузить обновления списка выражений URL-списка, не дожидаясь срабатывания расписания. Ее запуск осуществляется с вкладки Список окна свойства URL-списка или с помощью контекстного меню раздела Объекты -> URL-списки консоли администратора.

    Замечание! Функция обновления доступна только в том случае, если были настроены параметры на вкладке Автозагрузка окна свойств URL-списка .

    Удаление URL-списка осуществляется с помощью контекстного меню раздела Объекты -> URL-списки консоли администратора.

    Замечание! URL-список не может быть удален, если он используется в других настройках программы. При удалении такого URL-списка будет выведено сообщение об ошибке с указанием использующей его настройки.

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

Adblock
detector