Regular expressions.
Sitedeki linkleri p=1 gibi değil de /falan-filan.html olarak takip edebilmek için sayfayı parse edip o linki file_get_contents ile çekebilirsin.