Cherchez et affichez la valeur des liens contenus dans la page HTML suivante :

<!DOCTYPE HTML>
<html lang="fr">
  <head>
    <title>Page</title>
    <link rel="stylesheet" href="test.css">
    <script src="fonctions.js"></script>
  </head>
  <body>
    <p>On a ici un lien sur une image <img src="images/
	smiley.gif"> et là un lien sur une page <a href=
	"test1/page1_a.html">page1_a.html</a></p>
    
    <p>Encore un lien sur une image 
	<img src="images/smiley_bad.gif"> et un lien sur 
	une page html <a href='test1/page1_a.html'>
	page1_a.html</a></p>
    
    <p>On va commencer par un lien sur une page <a 
    href="test1/page1_c.html">page1_c.html</a> suivi d'un 
	lien sur une image <img src="images/smiley_good.gif">
	</p>
    
    <p>Un lien sur une image <img src="images/smiley.gif"> 
	et un autre lien sur une image <img 
	src="images/smiley_bad.gif"></p>
    
    <p><a href="test2/page2_a.html">page2_a.html</a> 
    lien sur une page suivi d'un lien sur une autre page 
	<a href="http://www.php.net/index.php">www.php.net</a>
	</p>
    
    <p><img src="images/smiley.gif"><img src="images/
	smiley_bad.gif"><a 
	href="http://www.nimporte.quoi/index.html" 
	target="_blank">n'importe quoi</a></p>
  </body>
</html>
Résultat attendu

Utilisez la notation heredoc pour mettre le code HTML sous la forme d'une variable.

Les liens peuvent être contenus dans les attributs href et src des tags HTML.

Cette exercice mêle l'utilisation des tableaux et le découpage de chaînes de caractères.

Le résultat de l'extraction des liens doit être identique à la capture ci-contre.

Une solution possible

Exercice : extraire les liens d'une page HTML