Получение частей URL (регулярное выражение)
Как я могу извлечь следующие части, используя регулярные выражения:
- Субдомен (тест)
- Домен (example.com)
- Путь без файла (/dir/subdir/)
- Файл (file.html)
- Путь с файлом (/dir/subdir/file.html)
- URL без пути (http://test.example.com)
- (добавьте любые другие, которые вы считаете полезными)
Регулярное выражение должно работать правильно, даже если я введу следующий URL:
ОТВЕТЫ
Ответ 1
вы могли бы более подробно проанализировать хост (‘.’ delimited).
Что может сделать I — это что-то вроде этого:
дальнейший синтаксический анализ «остальное» должен быть как можно более конкретным. Выполнение этого в одном регулярном выражении, ну, немного сумасшедшее.
Ответ 2
Я понимаю, что опаздываю на вечеринку, но есть простой способ разрешить браузеру анализировать URL-адрес для вас без регулярного выражения:
Ответ 3
Я опаздываю на вечеринку на несколько лет, но я удивлен, что никто не упомянул, что спецификация Uniform Resource Identifier содержит раздел для разбора URI с помощью регулярное выражение. Регулярное выражение, написанное Бернерсом-Ли и др., Представляет собой:
Цифры во второй строке выше предназначены только для удобства чтения; они указывают контрольные точки для каждого подвыражения (то есть каждый парные скобки). Мы ссылаемся на значение, соответствующее подвыражению как $. Например, сопоставление указанного выражения с
http://www.ics.uci.edu/pub/ietf/uri/#Related
приводит к следующим подвыражениям:
Для чего это стоит, я обнаружил, что мне пришлось скрывать косые черты в JavaScript:
Ответ 4
Я нашел, что самый высокий голосовой ответ (hometoast answer) не работает отлично для меня. Две проблемы:
- Он не может обрабатывать номер порта.
- Хеш-часть сломана.
Ниже приведена модифицированная версия:
Положение частей выглядит следующим образом:
Редактировать сообщение пользователем anon:
Ответ 5
Мне нужно регулярное выражение для соответствия всем URL-адресам и сделало это:
Он соответствует всем URL-адресам, любому протоколу, даже URL-адресам, например
Результат (в JavaScript) выглядит следующим образом:
Ответ 6
Я пытался решить это в javascript, с которым следует обращаться:
поскольку (в Chrome, по крайней мере) он анализирует:
Однако это не перекрестный браузер (https://developer.mozilla.org/en-US/docs/Web/API/URL), поэтому я собрал это вместе, чтобы вытащить те же части, что и выше:
Кредит для этого регулярного выражения отправляется в https://gist.github.com/rpflorence, который разместил этот jsperf http://jsperf.com/url-parsing (изначально найденный здесь: https://gist.github.com/jlong/2428561#comment-310066), который придумал регулярное выражение, изначально основанное на.
Детали находятся в следующем порядке:
Существует также небольшая библиотека, которая обертывает ее и предоставляет параметры запроса:
Если у вас есть улучшения, пожалуйста, создайте запрос на растяжение с большим количеством тестов, и я соглашусь и объединиться с благодарностью.
Ответ 7
Это не прямой ответ, но большинство веб-библиотек имеют функцию, которая выполняет эту задачу. Функция часто называется чем-то похожей на CrackUrl . Если такая функция существует, используйте ее, она почти гарантированно будет более надежной и эффективной, чем любой ручной код.
Ответ 8
Он поддерживает HTTP/FTP, субдомены, папки, файлы и т.д.
Я нашел его из быстрого поиска google:
Ответ 9
субдомен и домен сложны, поскольку субдомен может иметь несколько частей, а также домен верхнего уровня, http://sub1.sub2.domain.co.uk/
(Markdown не очень дружит с регулярными выражениями)
Ответ 10
Эта улучшенная версия должна работать надежно, как синтаксический анализатор.
Ответ 11
Предложите гораздо более читаемое решение (в Python, но применимо к любому регулярному выражению):
Ответ 12
Из моего ответа на аналогичный вопрос. Работает лучше, чем некоторые из упомянутых других, потому что у них были некоторые ошибки (например, не поддерживающие имя пользователя/пароль, не поддерживающие односимвольные имена файлов, сломанные идентификаторы).
Ответ 13
Вы можете получить все http/https, хост, порт, путь, а также запрос, используя объект Uri в .NET. просто сложная задача — разбить хост на субдомен, доменное имя и TLD.
Нет никакого стандарта для этого и не может просто использовать синтаксический анализ строк или RegEx для получения правильного результата. Во-первых, я использую функцию RegEx, но не все URL-адреса могут правильно разбирать субдомен. Практический путь — использовать список TLD. После определения TLD для URL-адреса левая часть является доменом, а остальные — поддоменью.
Однако список должен поддерживать его, поскольку возможны новые TLD. В настоящий момент я знаю, что publicsuffix.org поддерживает последний список, и вы можете использовать инструменты domainname-parser из кода google для анализа открытого списка суффикса и получения поддомена, домена и TLD с помощью объекта DomainName: domainName.SubDomain, domainName.Domain и domainName.TLD.
Ответ 14
К сожалению, это не работает с некоторыми URL-адресами. Возьмем, к примеру, этот: http://www.example.org/&value=329
Также значение & value = 329
Или даже без каких-либо параметров (простой URL-адрес)!
Я понимаю, что регулярное выражение ожидает некоторый серьезный сложный/длинный URL-адрес, но он также должен работать на простых, верно?
Ответ 15
Вот один из них, который является полным и не полагается на какой-либо протокол.
Печать
Ответ 16
Ничто из этого не помогло мне. Вот что я в итоге использовал:
Ответ 17
Мне нравится регулярное выражение, которое было опубликовано в «Javascript: The Good Parts». Он не слишком короткий и не слишком сложный. Эта страница на github также имеет код JavaScript, который ее использует. Но это адаптировано для любого языка. https://gist.github.com/voodooGQ/4057330
Ответ 18
Java предлагает класс URL, который сделает это. Объекты URL запроса.
С одной стороны PHP предлагает parse_url().
Ответ 19
Я бы рекомендовал не использовать regex. Вызов API, такой как WinHttpCrackUrl(), менее подвержен ошибкам.
Ответ 20
Использование http://www.fileformat.info/tool/regex.htm hometoast regex отлично работает.
Но вот сделка, я хочу использовать разные шаблоны регулярных выражений в разных ситуациях в моей программе.
Например, у меня есть этот URL, и у меня есть перечисление, в котором перечислены все поддерживаемые URL-адреса в моей программе. Каждый объект в перечислении имеет метод getRegexPattern, который возвращает шаблон регулярного выражения, который затем будет использоваться для сравнения с URL-адресом. Если конкретный шаблон регулярного выражения возвращает true, то я знаю, что этот URL-адрес поддерживается моей программой. Таким образом, каждое перечисление имеет собственное регулярное выражение в зависимости от того, где он должен выглядеть внутри URL.
Предложение Hometoast замечательно, но в моем случае, я думаю, что это не помогло бы (если только я не скопирую одно и то же регулярное выражение во всех перечислениях).
Вот почему я хотел получить ответ, чтобы дать регулярное выражение для каждой ситуации отдельно. Хотя +1 для hometoast.;)
Ответ 21
Я знаю, что вы претендуете на язык-агностик на этом, но можете ли вы рассказать нам, что используете, чтобы мы знали, какие у вас есть возможности регулярного выражения?
Если у вас есть возможности для неадаптирующих совпадений, вы можете изменить выражение hometoast, чтобы подвыражения, которые вы не заинтересованы в захвате, настроены следующим образом:
Вам все равно придется копировать и вставлять (и слегка модифицировать) Regex на несколько мест, но это имеет смысл — вы не просто проверяете, существует ли подвыражение, а скорее, если оно существует как часть URL. Использование модификатора non-capture для подвыражений может дать вам то, что вам нужно, и не более того, что, если я правильно вас читаю, — это то, что вы хотите.
Как маленькая, маленькая заметка, выражение hometoast не нужно помещать скобки вокруг ‘s’ для ‘https’, так как у него только один символ. Квантеры определяют количественно один символ (или класс символов или подвыражение), непосредственно предшествующий им. Итак:
будет соответствовать «http» или «https» просто отлично.
Ответ 22
regexp, чтобы получить URL-путь без файла.
Это может быть полезно для добавления относительного пути к этому URL-адресу.
Ответ 23
Будет представлен следующий результат:
1: https://
2: www.thomas-bayer.com
3:/
4: axis2/services/BLZService? Wsdl
наслаждаться..
Йоси Лев
Ответ 24
Регулярное выражение для полного разбора довольно ужасает. Я включил названные обратные ссылки для удобочитаемости и разбил каждую часть на отдельные строки, но все равно выглядит следующим образом:
Вещью, требующей, чтобы она была настолько подробной, заключается в том, что, за исключением протокола или порта, любая из частей может содержать объекты HTML, что делает очерчивание фрагмента довольно сложным. Таким образом, в последних нескольких случаях — хост, путь, файл, запрос и фрагмент, мы разрешаем любой объект html или любой символ, который не является ? или # . Регулярное выражение для объекта html выглядит следующим образом:
Когда это извлечено (я использовал синтаксис уса для его представления), он становится немного более разборчивым:
В JavaScript, конечно, вы не можете использовать именованные обратные ссылки, поэтому регулярное выражение становится
и в каждом совпадении протокол 1 , хост 2 , порт 3 , путь 4 , файл 5 , строка запроса 6 и фрагмент 7 .
Ответ 25
Я попробовал несколько из них, которые не покрывали моих потребностей, особенно самые высокие, проголосовавшие, которые не улавливали URL-адрес без пути (http://example.com/)
также отсутствие названий групп сделало его непригодным в недоступном (или, возможно, умениях jinja2 отсутствуют).
так что это моя версия, слегка измененная с тем, что источник является самой высокой проголосовавшей версией здесь:
Примеры регулярных выражений
Приведенные ниже примеры показывают, как использовать и составлять простые регулярные выражения. Каждый пример содержит искомый текст, одно или несколько соответствующих ему регулярных выражений, а также примечания, поясняющие использование специальных символов и форматов.
Важно! Поддерживается только синтаксис RE2, который немного отличается от PCRE. Обратите внимание, что регулярные выражения по умолчанию вводятся с учетом регистра.
Пример 2: (W|^)сборникs<0,3>законов<0,1>(W|$)
- W соответствует любому символу, кроме букв, цифр и знака подчеркивания. Этот элемент исключает из поиска символы в начале или конце фразы.
- В примере 2 элемент s соответствует пробелу, а <0,3>указывает на то, что между словами сборник и законов может быть от 0 до 3 пробелов.
- ^ соответствует началу новой строки. Этот элемент позволяет искать с помощью регулярного выражения фразы, которые находятся в начале строки и перед которыми отсутствуют символы.
- $ соответствует окончанию строки. Этот элемент позволяет искать с помощью регулярного выражения фразы, которые находятся в конце строки и после которых отсутствуют символы.
- В примере 3 (s) соответствует букве и, а <0,1>указывает на то, что эта буква может встречаться 0 или 1 раз в конце слова «сборник». Таким образом, регулярное выражение ищет словосочетание сборник законов и сборники законов. Другой вариант: вместо <0,1>можно использовать символ «?».
- туфта
- проклятие
- убирайся
- бред
- черт возьми
- зараза
Элемент (. ) объединяет все слова, а класс символов W применяется ко всем словам в круглых скобках.
(?i) делает выражение нечувствительным к регистру.
W соответствует любому символу, кроме букв, цифр и знака подчеркивания. Этот элемент исключает из поиска символы в начале или конце слова или фразы из списка.
^ соответствует началу новой строки. Этот элемент позволяет искать с помощью регулярного выражения слова, которые находятся в начале строки и перед которыми отсутствуют символы.
$ соответствует окончанию строки. Этот элемент позволяет искать с помощью регулярного выражения слова, которые находятся в конце строки и после которых отсутствуют символы.
Знак | соответствует оператору «или»; таким образом, регулярное выражение будет искать каждое слово из списка по отдельности.
s соответствует пробелу. Этот символ используется для разделения слов в фразе.
- ви@гра
- веагра
- ве@гра
- в№@гр@
- Элемент W не используется, так как до и после любых вариантов написания слова виагра могут быть расположены другие символы. Например, регулярное выражение будет искать слово виагра в следующем тексте:
виагра!! или ***виагра***
- [ие№] соответствует символам и, е и № на позиции второго знака в слове.
- W соответствует любому символу, кроме букв, цифр и знака подчеркивания. Этот элемент исключает из поиска символы в начале или конце адреса электронной почты.
- ^ соответствует началу новой строки. Этот элемент позволяет искать с помощью регулярного выражения адреса, которые находятся в начале строки и перед которыми отсутствуют символы.
- $ соответствует окончанию строки. Этот элемент позволяет искать с помощью регулярного выражения адреса, которые находятся в конце строки и после которых отсутствуют символы.
- Элемент [w.-] соответствует любому словообразующему символу (a-z, A-Z, 0-9 и знаку подчеркивания), точке или дефису. Эти символы используются чаще всего в первой части адреса электронной почты. Обратите внимание, что элемент -, обозначающий дефис, должен находиться в конце списка символов, заключенных в квадратные скобки.
- Знак перед дефисом и точкой исключает эти символы из поиска, т. е. указывает, что тире и точка не являются специальными символами регулярного выражения. Обратите внимание, что экранировать точку, которая находится в квадратных скобках, не нужно.
- <0,25>указывает на то, что перед символом @ может находиться набор символов, состоящий из 0–25 знаков. Настройки соответствия содержания в электронной почте поддерживают в регулярных выражениях наборы символов длиной до 25 знаков.
- Элемент (…) объединяет домены, а разделяющий их символ | соответствует оператору «или».
- Знак перед каждой точкой исключает ее из поиска, т. е. указывает, что точка не является специальным символом регулярного выражения.
- В примере 1 отсутствуют символы после последней точки, поэтому регулярное выражение будет искать все IP-адреса, которые начинаются с цифр 192.168.1., вне зависимости от последующих цифр.
- В примере 2 элемент d соответствует любой цифре от 0 до 9 после последней точки, а <1,3>указывает, что за последней точкой может следовать от 1 до 3 цифр. В этом случае регулярное выражение будет искать все полные IP-адреса, которые начинаются с цифр 192.168.1. Обратите внимание, что такое регулярное выражение также будет находить недопустимые IP-адреса, например 192.168.1.999.
- PO nn-nnnnn
- PO-nn-nnnn
- PO# nn nnnn
- PO#nn-nnnn
- PO nnnnnn
- W соответствует любому символу, кроме букв, цифр и знака подчеркивания. Этот элемент исключает из поиска символы в начале или конце номера.
- ^ соответствует началу новой строки. Этот элемент позволяет искать с помощью регулярного выражения номера, которые находятся в начале строки и перед которыми отсутствуют символы.
- $ соответствует окончанию строки. Этот элемент позволяет искать с помощью регулярного выражения номера, которые находятся в конце строки и после которых отсутствуют символы.
- Элемент [#-] соответствует знаку решетки или дефису после букв «po», а <0,1>указывает, что любой из этих символов может входить в искомую строку 0 или 1 раз. Обратите внимание, что элемент -, обозначающий дефис, должен находиться в конце списка символов, заключенных в квадратные скобки.
- Элемент s соответствует пробелу, а <0,1>указывает, что он может входить в искомую строку 0 или 1 раз.
- Элемент d соответствует любой цифре от 0 до 9, а <2>указывает, что на этой позиции в числе должно быть ровно 2 цифры.
Неиспользуемые символы в регулярных выражениях
Регулярные выражения со следующими символами не поддерживаются, так как могут привести к задержкам при обработке вашего письма:
Перенаправление. Регулярные выражения
Регулярное выражение представляет собой группу символов, используемых для поиска шаблона внутри фрагмента текста.
В контексте перенаправления простой URL-адрес соответствует точно одному URL-адресу. URL-адрес регулярного выражения может соответствовать многим URL-адресам.
В дополнение к сопоставлению многих URL-адресов регулярное выражение может извлекать информацию из исходного URL-адреса и копировать его на целевой URL-адрес.
Несколько примеров могут оказаться полезными. Переадресация с исходным URL-адресом /my-url будет соответствовать только запросам /my-url .
Переадресация с исходным URL-адресом /my-url/.* будет соответствовать запросам:
- /my-url/this
- /my-url/that
Важная часть /my-url/.* есть .* . Это часть регулярного выражения URL-адреса и эквивалентна выражению «соответствие, /my-url/ за которым следует любая последовательность символов».
Синтаксис регулярного выражения
Таким образом, регулярные выражения, например, .* кажутся действительно полезными. Но что это значит?
В этом случае . означает «любой символ», а * значит — любое число предыдущего выражения. То есть любое количество символов.
Но подождите, это становится намного сложнее!
Регулярные выражения допускают очень подробные и сложные шаблоны, выходящие за рамки этой страницы. Если вы хотите получить более подробную информацию, ищите «регулярные выражения» и соглашайтесь на длительный сеанс чтения.
Извлечение исходной информации
Мало того, что регулярное выражение соответствует многим URL-адресам, оно также может извлекать информацию из исходного URL-адреса и копировать ее на целевой URL-адрес.
Почему вы хотите это сделать? Давайте посмотрим на другой пример. Скажите, что у вас есть сайт, на котором находятся некоторые страницы под /oldpage/ каталогом, и вы переместили их /newpage/ .
- /oldpage/bananas/
- /oldpage/best-post-in-the-world/
И вы хотите перенести их на:
- /newpage/bananas/
- /newpage/best-post-in-the-world/
То есть, вы хотите изменить , /oldpage/ на /newpage/ , но сохранить bananas и best-post-in-the-world .
Для этого вы можете создать регулярное выражение, например /oldpage/(.*) .
Обратите внимание, что .* окружены скобками. Это говорит, что перенаправление «захватывает» данные. Тогда нужно указать целевой URL /newpage/$1 .
Здесь $1 заменяется содержимым захваченного (.*) . Так что:
/oldpage/bananas => /oldpage/(bananas) => /newpage/$1 => /newpage/bananas
Бесконечные петли
Часто встречающаяся проблема с регулярным выражением — это бесконечное перенаправление . То есть вы создаете регулярное выражение, которое перенаправляет на URL-адрес, который сам попадает в одно и то же регулярное выражение. Затем это перенаправляется снова и снова и снова, пока браузер не остановится с ERR_TOO_MANY_REDIRECTS сообщением (или эквивалентом).
Например, скажем, у нас есть это перенаправление:
Если вы получите доступ к /index.php/banana то, он будет перенаправлен на /portal/index.php/banana . Но подождите! Сам URL /portal/index.php/banana совпадает с исходным регулярным выражением в виде index.php/banana совпадений . /portal/index.php/(.*)
Если мы используем ^ символ carat, мы можем исправить совпадение до начала URL-адреса:
Здесь указано ^ регулярное выражение, которое применяется только при совпадении в начале URL-адреса. Это предотвращает его соответствие в другом месте URL-адреса и останавливает бесконечное перенаправление.
Тестирование регулярных выражений
Существует множество ресурсов для регулярных выражений, а некоторые из наиболее полезных — тестеры регулярных выражений. С их помощью вы можете экспериментировать с шаблоном и настраивать его так, чтобы он точно соответствовал вам.
Обратите внимание, что Redirection использует регулярные выражения PHP . Они обычно известны как PCRE и могут быть не такими же, как другие библиотеки регулярных выражений.
Хороший ресурс для понимания регулярных выражений можно найти здесь .
Общие регулярные выражения
Следующие регулярные выражения обычно используются для WordPress:
Перенаправление дня и имени :
Пример: /2017/01/01/thing/ => /thing/
Перенаправить все URL-адреса, /blog/ кроме тех, которые начинаются с /blog/ :
Регулярные выражения в PHP
Регулярные выражения ( сокращенно — regex ) представляют собой последовательности символов, которые формируют шаблоны поиска. В основном они используются в шаблонах сопоставления со строками.
- Все началось в 1940 — 1960-х годах, когда множество умных людей говорили о регулярных выражениях;
- 1970-е годы g / re / p;
- 1980 Perl и Генри Спенсер;
- 1997 PCRE (регулярные выражения, совместимые с Perl). Именно тогда начался взлет того, что мы называем регулярные выражения. PCRE предоставляет библиотеки почти для каждого языка.
Общее использование регулярных выражений в PHP
PHP включает в себя три основные функции для работы с PCRE — preg_match , preg_match_all и preg_replace .
Выражение возвращает 1 , если соответствие установлено, 0 — если нет, и false — если возникает ошибка:
Регулярного выражения пример, который возвращает количество найденных совпадений:
Выражение возвращает замененную строку или массив ( на основе объекта $subject ):
Общее использование регулярных выражений в JavaScript
Регулярные выражения в JavaScript выглядят почти так же, как и в PHP .
Возвращает массив совпадений или null , если совпадений не найдено:
Регулярное выражение, которое возвращает строку с выполненными заменами:
Особенности регулярных выражений в JavaScript
- Точка никогда не соответствует новой строке:
- Те же методы для сравнения соответствия и замены через регулярное выражение, что и без них.
Принципы составления шаблонов регулярных выражений
Рассмотрим пример, в котором нужно найти адреса электронной почты в базе кода. Наша цель: /[w.+-]+@[a-z0-9-]+(.[a-z0-9-]+)*/i
Регулярные выражения состоят из двух типов символов:
- специальные символы: []? * + <> () ^ $ / .
- Литералы.
Представьте себе входные строки как болты, а шаблон — как набор разъемов для них (в соответствующем порядке).
При проверке регулярных выражений нужно знать, как работают специальные символы:
- Символ обратной косой черты может заменять другой специальный символ в регулярном выражении:
- Точка и w — .
Совпадение со всеми символами, кроме новых строк. Если хотите проверить на соответствие точке, и только точке — , на соответствие буквам, цифрам и нижнему подчеркиванию — w
- Квадратные скобки [] .
Совпадение с символами внутри скобок. Поддерживает диапазоны. Некоторые примеры:
o [abc] — соответствует любым a, b или c.
o [a-z] прописные буквы.
o [0-9] любая цифра.
o [a-zA-Z] — соответствует любому буквенному символу в нижнем или верхнем регистре.
• Опционально ? Соответствие 0 или 1.
• Звездочка *.
Звездочка обозначает 0 или более символов.
Соответствие 1 или более символам.
Минимальное и максимальное значения. Некоторые примеры синтаксиса регулярных выражений:
o <1,>не менее 1.
o <1,3>от 1 до 3.
o <1,64>от 1 до 64.
Добавим все это, чтобы получить регулярное выражение для адресов электронной почты:
URL-списки
URL-списки содержат правила обработки URL-запросов. Их основой является набор выражений, по которым проверяются URL-адреса, запрашиваемые пользователями. С их помощью можно, например, определить рекламу, сайты определенной тематики, конкретные веб-проекты и т.п. URL-списки используются в различных настройках программы, в частности, в правилах пользователей и правилах HTTP-прокси.
Перечень URL-списков, созданных в системе, находится в разделе Объекты -> URL-списки консоли администратора. Раздел состоит из двух частей. В верхней отображается список URL-списков. Нижняя часть состоит из двух вкладок. На вкладке URL списки отображаются основные параметры выбранного URL-списка, а на вкладке Список — список его выражений.
Также в разделе Объекты есть блок URL-списки , состоящий из двух вкладок. На вкладке Информация отображается общее количество созданных в системе URL-списков, а на вкладке Действия — ссылки на некоторые операции.
В рамках управления URL-списками в Traffic Inspector реализованы следующие операции:
- создание/изменение URL-списка;
- проверка выражения;
- загрузка обновлений;
- удаление URL-списка.
Для создания нового или изменения существующего URL-спсика выполните следующие действия:
- Откройте окно свойств нового или существующего URL-списка. Сделать это можно с помощью контекстного меню раздела Объекты -> URL-списки консоли администратора или в блоке URL-списки , который размещен на главной странице раздела Объекты .
- На вкладке Описание введите наименование создаваемого списка и, при необходимости, произвольные примечания. Здесь же выберите тип списка.
- Вхождение подстроки — при использовании данного варианта Traffic Inspector будет проверять, входят ли в URL-адреса указанные на вкладке Список строки. Его удобно использовать для поиска четко определенных подстрок. Например, если в список добавить значение » foto «, то URL-адрес при вхождении этой подстроки в любую его часть будет соответствовать списку (например, http://foto.ru, http://company.com/foto, http://company.com/pics/foto.jpg и т.д.).
- Регулярные выражения — при использовании данного варианта строки в списке представляют собой регулярные выражения. Это позволяет задавать значительно более сложные условия с использованием специального синтаксиса (подробнее о синтаксисе регулярных выражений см. в п. . ). Они позволяют определять искомые подстроки более точно, с учетом дополнительных факторов, что обеспечивает меньшее количество ложных срабатываний.
- При необходимости включите автоматическое обновление списка с внешнего источника по протоколу HTTP. При включении задайте адрес списка, из которого будут загружаться обновления, а также в специальном окне настройте расписание загрузки.
- На вкладке Список настройте список выражений. Создавать его можно вручную, при этом каждое выражение пишется в отдельной строке. Также список может быть загружен из предварительно подготовленного файла.
- Сохраните внесенные изменения. При закрытии окна свойств производится проверка синтаксиса регулярных выражений. Если при этом будут найдены ошибки, то отобразится сообщение, на какой строке списка это произошло. В верхней части окна редактирования списка есть поле, где отображается номер редактируемой строки.
При необходимости на вкладке можно выключить чувствительность к регистру. В этом случае анализ URL-адресов будет осуществляться без учета регистра символов.
Замечание! Функция загрузки с внешнего источника доступна только в том случае, если были настроены параметры на вкладке Автозагрузка .
Список может быть выгружен в виде текстового файла.
Замечание! HTTP-прокси при обработке запроса передает URL вида
В Traffic Inspector реализована функция проверки выражения, которая позволяет проверить, соответствует URL-адрес указанному URL-списку или нет. Проверка осуществляется в специальном окне, вызвать которое можно с вкладки Список окна свойства URL-списка или с помощью контекстного меню раздела Объекты -> URL-списки консоли администратора.
В окне введите тестируемый URL-адрес и запустите проверку. Если адрес попал в список, то отображается номер первой строки (нумерация с «1»), где это условие выполнилось.
Данная функция позволяет сразу загрузить обновления списка выражений URL-списка, не дожидаясь срабатывания расписания. Ее запуск осуществляется с вкладки Список окна свойства URL-списка или с помощью контекстного меню раздела Объекты -> URL-списки консоли администратора.
Замечание! Функция обновления доступна только в том случае, если были настроены параметры на вкладке Автозагрузка окна свойств URL-списка .
Удаление URL-списка осуществляется с помощью контекстного меню раздела Объекты -> URL-списки консоли администратора.
Замечание! URL-список не может быть удален, если он используется в других настройках программы. При удалении такого URL-списка будет выведено сообщение об ошибке с указанием использующей его настройки.