Что такое URL? |
|
HTML использует URL (Uniform Resource Locator)
- унифицированный локатор ресурсов для представления гипертекстовых ссылок и
ссылок на другие сетевые службы внутри HTML-документа. Первая часть URL (до
двоеточия) описывает метод доступа или сетевую службу. Другая часть URL (после
двоеточия) интерпретируется в зависимости от метода доступа. Обычно, два прямых
слеша после двоеточия обозначают сетевой адрес машины в виде буквенного адреса
или в виде фиксированного IP адреса.
method://machine-name/path/foo.html
Следующий пример представляет собой вызов HTML-документа
index.html с сервера www.softexpress.com с использованием HTTP протокола:
http://www.softexpress.com/index.html
Uniform Resource Locator имеет следующий формат:
method://servername:port/pathname#anchor
Опишем подробно каждый из возможных компонентов URL:
method - имя метода,
который будет выполняться при интерпретации данного URL. Могут использоваться
следующие методы доступа:
file:
чтение файла с локального диска. Имя файла
интерпретируется для локальной машины пользователя. Данный метод используется
для отображения какого-либо файла, находящегося на машине пользователя.
Например:
file:/home/alex/index.html - отображает файл index.html из каталога /home/alex
на пользовательской машине (на машине установлена Unix-подобная ОС)
http:
доступ к WEB-странице в сети с
использованием HTTP-протокола. Это наиболее часто используемый метод доступа к
какому-либо HTML-документу в сети.
Например:
http://www.softexpress.com/ - доступ к стартовой странице компании SoftExpress
https:
доступ к WEB-странице в сети с
использованием относительно недавно разработанного нового протокола HTTPS.
Расшифровывается как HTTP Security. Это защищенный вариант обычного протокола
HTTP. Применяется, когда важна безопасность передаваемых данных.
Например:
https://www.softexpress.com/ - доступ к стартовой странице компании SoftExpress
ftp:
запрос файла с FTP-сервера (по
ftp-протоколу, который специально разработан и предназначен для передачи
файлов). Если FTP-сервер не анонимный, то Вам придется ввести login и password
для доступа.
Например:
ftp://ftp.mgul.ru/cool/file.zip
mailto:
запускает почтовую программу, установленную
по умолчанию, с указанным e-mail адресом получателя.
Например:
mailto:info@softexpress.com
Заметьте, что mailto: не требует указание слешей после двоеточия (после
двоеточия сразу идет электронный адрес абонента)
telnet:
обращение к службе telnet
news:
вызов службы новостей, если браузер ее
поддерживает.
Например:
news:relcom.www.support
servername - обязательный
параметр, описывающий сетевой адрес машины в виде буквенного адреса - домена
(который при запросе пользователя преобразуется к IP адресу при помощи DNS
службы) или непосредственно фиксированного IP адреса, присвоенного данной
машине. Но следует сказать, что существуют и виртуальные сервера, которые не
имеют своего собственного фиксированного IP адреса.
Например: www.softexpress.com - сетевой буквенный адрес машины, где находиться
сайт фирмы СофтСервис.
Замечание: если адрес машины
не указан, то ссылка считается относительной (локальной), и полный путь,
определяется автоматически из уже известного адреса сайта и пути относительно
текущего web-документа. Например, загружен документ по адресу:
http://webholm.ru/html/links.htm и в нем присутствует ссылка на ../1.htm - это
означает, что по ссылке будет загружен документ http://webholm.ru/1.htm.
Сочетание ".." и "/" в относительных ссылках соответственно
обозначают на один уровень (в иерархии папок) выше и ниже относительно текущего
документа.
port - номер порта TCP
на котором функционирует WEB-сервер. Если порт не указан, то "по
умолчанию" используется порт 80. Данный параметр (port) не используется в
подавляющем большинстве URL, поскольку его необходимо указывать только в тех
случаях, когда WEB-сервер работает не на стандартном порту.
pathname - путь к документу,
который должен вызваться в результате интерпретации URL. Различные WEB-сервера
могут быть сконфигурированы по-разному для интерпретации пути доступа к
документу. Например, при использовании CGI скриптов (исполняемых программ),
они, как правило, помещаются в папку cgi (этот путь записывается в специальных
параметрах WEB-сервера), но пользователи должны обращаться к содержимому этой
папки через браузер как к cgi-bin.
Например:
http://webholm.ru/cgi-bin/script.cgi
В данном примере HTTP-сервер должен вызвать CGI-скрипт с именем script.cgi,
который находится на сайте webholm.ru. Путь к данному скрипту /cgi-bin/ - в
действительности, является виртуальным путем (выделенным сервером для исполняемых
модулей). Заметьте, что при описании пути используется UNIX-подобный синтаксис,
где, в отличие от DOS и Windows используются прямые слеши вместо обратных.
Замечание: если после сетевого
адреса машины сразу идет имя документа, то он должен находиться в корневом
каталоге на удаленной машине или (что чаще) в каталоге, выделенном WEB-сервером
в качестве корневого. Если же URL заканчивается сетевым адресом машины, то в
качестве документа запрашивается документ из корневого каталога удаленной
машины с именем, установленным в настройках WEB-сервера (как правило, это файлы
index.html, index.htm, index.shtml, index.dhtml и т.д.).
#anchor - данный элемент
является ссылкой на строку (точку) внутри HTML-документа. Браузер, встречая
после имени документа данный элемент, размещает документ на экране таким
образом, что указанная строка документа помещается в верхнюю строку рабочего
окна браузера, то есть осуществляется, как бы прокрутка документа, до
необходимой строки. Точки, на которые ссылается #anchor, указываются в
документе при помощи тега NAME (подробно это описано в статье
"Гипертекстовые ссылки от А до Я").