Pour voir le contenu dâune page HTML
en dehors de votre navigateur, histoire dâĂ©viter dâexĂ©cuter le code JavaScript ou dâactiver les potentiels traceurs quâelle contient.
Pour faire cela, vous pouvez utiliser la commande curl
comme suit :
curl -s http://booms.io/
Cependant, trÚs souvent ce type de page ne contient pas de saut de ligne. Pour vérifier cela, vous pouvez utiliser la commande wc
avec lâoption -l
pour compter le nombre de ligne :
curl -s http://booms.io/ | wc -l
Dans ce cas, vous obtiendrez 0, il nây a mĂȘme pas le retour chariot final.
Je vous propose dâutiliser la commande xmllint
qui est destinée à valider du code XML
. Cette commande permet Ă©galement de formater le code Ă lâaide de lâoption --format
.
Dans notre cas, nous souhaitons formater du code HTML
qui est un peu moins strict que le XML
, mais qui rester assez proche, pour cela nous ajouterons lâoption --html
Et si on lance la commande en comptant le nombre de ligne comme suit :
curl -s http://booms.io/ | xmllint --format --html - | wc -l
Cette fois on obtient 16
Pour lire effectivement le code, et répondre à la question initiale, vous devez utiliser quelque chose comme :
curl http://booms.io/ | xmllint --format --html -
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 1145 0 1145 0 0 6189 0 --:--:-- --:--:-- --:--:-- 6189
Et voici le type de résultat que vous aurez :
<!DOCTYPE html>
<html lang="en" data-adblockkey="MFwwDQYJKoZIhvcNAQEBBQADSwAwSAJBANDrp2lz7AOmADaN8tA50LsWcjLFyQFcb/P2Txc58oYOeILb3vBw7J6f4pamkAQVSQuqYsKx3YzdUHCvbVZvFUsCAwEAAQ==_KPN8bFEraYi2GwNlHdj3j/xIir/KNVsjDA+acdJE2qMnkLV5CwLcMpiH4p0W5iBK2iD8Oc/H6PhWWLOR4bCijQ==">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<meta charset="utf-8">
<meta name="viewport" content="width=device-width, initial-scale=1">
<link rel="shortcut icon" href="/favicon.ico" type="image/x-icon">
<link rel="preconnect" href="https://www.google.com" crossorigin>
<link rel="dns-prefetch" href="https://parking.bodiscdn.com" crossorigin>
<link rel="dns-prefetch" href="https://fonts.googleapis.com" crossorigin>
</head>
<body>
<div id="target" style="opacity: 0"></div>
<script>window.park = "eyJ1dWlkIjoiNmE2OGY3ZmEtMmNlOS0zNzc3LTQxNzAtNTFhNmQxNDFhNDU0IiwicGFnZV90aW1lIjoxNjM1MjI4MDczLCJwYWdlX3VybCI6Imh0dHA6XC9cL2Jvb21zLmlvXC8iLCJwYWdlX21ldGhvZCI6IkdFVCIsInBhZ2VfcmVxdWVzdCI6W10sInBhZ2VfaGVhZGVycyI6eyJhY2NlcHQiOlsiKlwvKiJdLCJ1c2VyLWFnZW50IjpbImN1cmxcLzcuNjguMCJdLCJob3N0IjpbImJvb21zLmlvIl19LCJob3N0IjoiYm9vbXMuaW8iLCJpcCI6IjgyLjY1LjEyNC4xMzUifQ==";</script><script src="/js/parking.2.72.0.js"></script>
</body>
</html>
኿