uzak siteden çektiğiniz kaynak kodun içinden sadece yazıları almak için strip_tags fonksiyonunu kullanabilirsiniz
$veri = strip_tags($uzak_siteden_kaynak_kod);
veya sadece istediğiniz html etiketlere izin vermek isterseniz
$veri = strip_tags($uzak_siteden_kaynak_kod,'<div><h1><p>' );
sadece div,h1,p etiketleri ve yazılar gelir diğer html etiketler temizlenir
bknz.
http://php.net/manual/tr/function.strip-tags.php