saol sorunu çözdüm ama yeni bir soru sormak istiyorum

preg_match_all('@<a href="http://(.*?)/@si', $sayfa, $cikti);
komutu ile web sitelerini çekiyorum ama bazı sitelerin

www.ebay.co.th" id="hpf-TH" rel="nofollow" target=
gibi devamlarınıda alıyor şöyle bir fonksiyon düşündüm acaba nasıl bulabilirim fonksiyon şöyle olacak
/ " ' &
gibi işaretlerden gerisini almayacak bunu nasıl yapabilirim acaba arkadaşlar?