URL-адрес – что это такое и где его взять?

Миниатюра URL-адрес - что это такое и где его взять?

Таинственный урл сайта – открываем завесу

Почти любой юзер интернета слышал о таком понятии, как URL адрес, но не каждый знает зачем он нужен. Давайте же рассмотрим пару пунктов, связанных с этим тезисом.

URL – адрес любого ресурса во всемирной паутине интернет. Впервые об URL услышали благодаря великобританскому изобретателю Тиму Бернерсу-Ли, который в 1990 году создал единообразный локатор ресурса. Изначально он обозначал места отдельных файлов.

На данный момент URL применятся для определения адресов чуть ли не для каждого ресурсав Интернете. То есть он показывает нам, где именно лежит то, что мы ищем. У каждого ресурса в глобальной сети есть своя уникальная совокупность символов, которые помогает идентифицировать его, будь то картинка, сайт и тому подобное.

Из чего же он состоит?

В браузере URL выглядит так: https://index.ru/
Она состоит из отдельных блоков, и в действительности выглядит так:<схема>:[//[ <логин:&lt>;<пароль>@]<хост>[:<порт>]][/][?<параметры>][#<якорь>]

Теперь же рассмотрим эти блоки отдельно.

  1. Схема показывает то, как к ресурсу будут обращаться, то есть сетевой протокол.
  2. Логин – имя юзера, который обращается к данному ресурсу.
  3. Пароль – пароль данного юзера.
  4. Хост – это IP или имя хоста в структуре DNS.
  5. Порт – порт при подключении.
  6. URL – путь определяет сведения об интересующем нам ресурсе.
  7. Параметры – особые параметры сайта, отвечающие за файлы внутри этого ресурса.
  8. Якорь нужен для указания заголовок внутри документа. Многие профессионалы считают, что он не нужен.

Наиболее важным в приведенной конструкции является блок<схема> или сетевой протокол. Одним из популярных протоколов является http. Как говорилось ранее, это свод правил при доступе к ресурсам. И таких схем очень много. Например, https – тот же самый http, только со специальной защитой.

Протокол ftp, созданный для передачи информации по сети TCP. Mailto обозначаются адреса электронных почт. Именно такой вид имеет URL адрес во всем мире.

Теперь узнаем как его взять

Если мы рассматриваем сайт, то найти URL очень просто, следует навести курсор на адресную строку и просто кликнуть. Бывает так, что иногда браузер скрывает протокол ресурса, но после того, как URL адрес будет находиться в буфере обмена, его будет видно.

Как мы уже знаем протокол бывает не только у страниц, но и у файлов. Так как же узнать их URL?

Рассмотрим пример с картинкой. Следует нажать на данное изображение правой кнопкой мыши и в высветившемся окне выбрать нужный нам пункт “Копировать адрес картинки”. Если же мы хотим узнать адрес документа, действовать стоит точно также, нажать на документ правой кнопкой мыши и выбрать соответствующий раздел в меню. Все очень легко и ясно.

Часто можно увидеть такую часть в URL: “B%0С%”. Что же это значит? Это всего лишь шифрование. Происходит это из-за того, что все адреса представляются в виде специального набора символов, а кириллица туда не входит, и чтобы аппарат смог понять куда ей переходить, он шифрует данный адрес.

Данное кодирование происходит в 2 этапа.

  1. Адрес кодируется в Юникод, в итоге мы получаем двух байтный порядок (в более новых
    браузерах происходит шифровка в BASE58).
  2. Перекодировка в шестнадцатеричную систему счисления.

Тогда для чего нужен знак процента? Этим знаком разделяется каждый байт.

На данный момент у URL существует большое количество недостатков.

  1. Иногда шифрование проходит не совсем верно.
  2. URL почти никак не возможно изменить.
  3. Нестабильная работа с гипертекстом.

Именно поэтому была предложена новая система адресов под названием PURL. Здесь используется немного другой подход. В определенной базе данных хранятся все адреса, которые постоянно проверяются, и если один из них не прошел проверку, он удаляется из этой базы. На данный момент разрабатываются еще несколько решений по разрешению данных проблем.

Со временем на замену URL пришел URI – унифицированный идентификатор ресурса. URI также обозначает символьное представление различных ресурсов.

URI состоит из двух частей:

  • уже известный нам URL, он дает информацию о местонахождении ресурсов;
  • URN, определяющий ресурсы в какой – либо зоне имен, но не показывающий его местонахождение.

Было выдвинуто предложение о замене термина URL на термин URI, так как прошлый адрес считается устаревшим. Ресурсы, которые не возможно получить через всемирную паутину, в URI имеют возможность описываться с помощью PDF, так как URI лишь идентифицирует их.

Но и он имеет свои изъяны, так как URL является фундаментом всей глобальной сети, URI должен быть полностью совместим с ним. Отсюда и пришли все недостатки, как преемство от URL.

Одним из них является шифровка, так как в URI, как и в URL, входит небольшой пакет символов. Иначе говоря, если мы захотим использовать буквы русского алфавита, то все символы нам придется кодировать таким же образом, как и URL.