Les ressources sur le réseau sont référencées, localisées par des URL. Une URL (Uniform Resource Locator) définit donc l'adresse d'une ressource (document ou autre) sur le Web et on utilise souvent le terme d'adresse Web pour en parler.
Une URL décrit un chemin dans une arborescence.
Le point de départ du chemin peut être l'adresse du site sur le
réseau, suivi de la hiérachie de dossiers à descendre (exemple www.site.fr/livres/promo/c.html).
Le point de départ peut également être la ressource en cours, suivi
de la hiérarchie de dossiers à remonter (exemple ../../index.html).
Le caractère de séparation entre les dossiers et les fichiers est le
/ (slash) comme dans les systèmes UNIX ou Linux (et
surtout pas le \ -backslash- des systèmes Microsoft windows).
Une URL est une simple chaîne de caractères.
Il convient d'être prudent avec les caractères utilisés et je vous
conseille fortement d'adopter les règles suivantes :
Les caractères ! * ' ( ) ; : @ & = + $ , / ? % # [
] sont des caractères
réservés qui ne doivent pas être utilisés telle que dans les URLs.
La longueur maximum d'une URL n'est pas définie dans les spécifications techniques. On se base donc sur la longueur la plus faible prise en compte par les navigateurs : 2083 caractères pour Internet Explorer.
Une URL est composée de plusieurs parties qui peuvent être ou non présentes.
Le protocole est généralement http, mais ça n'est qu'un
des protocoles utilisables dans une très longue liste.
L'adresse réseau peut être un nom
de domaine (ie google.com) ou une adresse
IP (ie 173.194.78.94).
Dans ce type d'URL aucun nom de ressource n'est défini. C'est la
configuration du serveur Web qui définit la ressource renvoyée quand
un lien pointe sur le dossier racine du site. Ca sera généralement index.html,
index.php, default.html ou default.aspx.
Ce type d'URL définit le chemin d'accès de la ressource dans les
dossiers du serveur Web. Notez que les dossiers et le fichier sont
séparés par un /.
On peut faire pointer une URL sur une partie à l'intérieur d'une ressource
en utilisant le caractère # (dièses) pour séparer le
nom de la ressource et le nom de la partie à atteindre.
On peut passer des "paramètres" à la ressource que l'on appelle. On
utilise la caractère ? (point d'interrogation) pour
séparer le nom de la ressources des paramètres. Les paramètres sont
des couples nom=valeur, séparés par le caractère &.
Ce type d'URL est surtout utilisé avec des ressources permettant un
traitement comme des programmes ou des scripts PHP, Phyton, ASP,
JAVA, etc.