PHP uzmanıyım diyen var mı ?
44
●3.384
- 21-11-2012, 19:53:50function file_get_contents_curl($url)
{
$ch = curl_init();
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$data = curl_exec($ch);
curl_close($ch);
return $data;
}
$html = file_get_contents_curl("http://example.com/");
//parsing begins here:
$doc = new DOMDocument();
@$doc->loadHTML($html);
$nodes = $doc->getElementsByTagName('title');
//get and display what you need:
$title = $nodes->item(0)->nodeValue;
$metas = $doc->getElementsByTagName('meta');
for ($i = 0; $i < $metas->length; $i++)
{
$meta = $metas->item($i);
if($meta->getAttribute('name') == 'description')
$description = $meta->getAttribute('content');
if($meta->getAttribute('name') == 'keywords')
$keywords = $meta->getAttribute('content');
}
echo "Title: $title". '<br/><br/>';
echo "Description: $description". '<br/><br/>';
echo "Keywords: $keywords"; - 22-11-2012, 01:46:37lancewood "php ile olabileceğinden şüpheliyim" deki şüphen tuhaf bir şey olmuş varsayıyorum django, asp.Net, ruby, vs... gibi web dilleri ve teknolojileri ile olupta php ile olmayacak hiçbir uygulama yoktur.
önemli olan algoritmayı çıkartmak ki bu konuda belirli bir mantıkla gidildiğinde imkansız bir uygulama değil.
kaynak alındıktan sonra belirli html tagları alınıp içerisindeki kelime sayılarının toplamının hangi tag veya taglar da çok ise geriye döndermek. olasılıklar çok sapan saçmada dönebilir, olumluda donebilir fakat belirli bir yüzdede başarılı olucaktır. Kısaca sayfadaki text yoğunluğuna odaklanmanın bir yolunu bulmak bana o kadarda zor görünmüyor. - 22-11-2012, 01:50:10Hocam şüpheliyim dememin nedeni, en başta belirttiğim uzman değilimden kaynaklanıyor.MaviTm adlı üyeden alıntı: mesajı görüntüle
- 22-11-2012, 02:35:05Üyeliği durdurulduCycl0ne adlı üyeden alıntı: mesajı görüntüleDescription tagını veriyor sadece olay tüm texti vermesinde örnek olarak pm attımTontonq adlı üyeden alıntı: mesajı görüntüle
- 22-11-2012, 02:43:54http://simplehtmldom.sourceforge.net/Tioc adlı üyeden alıntı: mesajı görüntüle
echo file_get_html('http://www.google.com/')->plaintext;Böyle deneyin - 22-11-2012, 02:59:53Dediğiniz şey sadece OpenGraph ile uyumlu sitelerde işe yarar. Aradığınız kod
og:description meta tagıdır.
deneme yapabilirsiniz. verdiğiniz site
http://www.makaleci.com/dersler/digg...mit/index.html
kutucuğa benim opengraph destekli sitemin urlsini yazmayı deneyin
http://www.sercankd.com/gecen-gun-co...ilastim-1.html
çektiği ilk şey
<meta name="title" content="geçen gün çocukluğumla karşılaştım" />
sonrasında çektiği şey ise
<meta property="og:description" content="naber *** dedim..iyi abi dedi..ben senin 20 yıl sonraki halinim dedimvay anasını dedi.. nereye gidiyosun dedim.okuldan kaçtım dedibaktım sıfatına; önlüğün tek yakası sökük, kolu sümüklü, çanta filan taşıyo bide..acıdım ****ye.. sen nereye gidiyon dediişe..." />
dikkat ederseniz kelimesi kelimesine noktalama işaretleri, ve yazım hatasına kadar yukarıdaki bölümü aldığını göreceksiniz. - 22-11-2012, 03:06:02Üyeliği durdurulduDesc tagını gördüğü bölümü alıyor, yukarda arkadaş yazmış zaten. Ama ben diyorum ki tüm text i verecek bunu yapan bir siteyi özel mesajla yolladım. Zaten başka bir sitede örneğini göremedimDeimosx adlı üyeden alıntı: mesajı görüntüle
- 22-11-2012, 07:25:58Üyeliği durduruldueğer bahsettiğiniz gibi birşey olsaydı og olmazdı ve description ve diğer metalara gerek kalmazdı.
ben sitemi ajax ile yaparım sayfa boş yüklenir 5 sn sonra tek bir divin içine 1000 tane içerikli div yığarım ve senin yapmaya çalıştığın sistem ile sadece boş divi alırsın kaynak kodda sadece div olduğu için yani bir sitede içeriğin hangi tag içerisinde olduğunu %100 bulman imkansız
