• 21-11-2012, 19:42:21
    #10
    Kimlik doğrulama veya yönetimden onay bekliyor.
    Css dosyasindan konu iceriginin divi bi sekilde bulunamazmi
  • 21-11-2012, 19:53:50
    #11
    function file_get_contents_curl($url)
    {
    $ch = curl_init();

    curl_setopt($ch, CURLOPT_HEADER, 0);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

    $data = curl_exec($ch);
    curl_close($ch);

    return $data;
    }

    $html = file_get_contents_curl("http://example.com/");

    //parsing begins here:
    $doc = new DOMDocument();
    @$doc->loadHTML($html);
    $nodes = $doc->getElementsByTagName('title');

    //get and display what you need:
    $title = $nodes->item(0)->nodeValue;

    $metas = $doc->getElementsByTagName('meta');

    for ($i = 0; $i < $metas->length; $i++)
    {
    $meta = $metas->item($i);
    if($meta->getAttribute('name') == 'description')
    $description = $meta->getAttribute('content');
    if($meta->getAttribute('name') == 'keywords')
    $keywords = $meta->getAttribute('content');
    }

    echo "Title: $title". '<br/><br/>';
    echo "Description: $description". '<br/><br/>';
    echo "Keywords: $keywords";
  • 22-11-2012, 01:46:37
    #12
    lancewood "php ile olabileceğinden şüpheliyim" deki şüphen tuhaf bir şey olmuş varsayıyorum django, asp.Net, ruby, vs... gibi web dilleri ve teknolojileri ile olupta php ile olmayacak hiçbir uygulama yoktur.

    önemli olan algoritmayı çıkartmak ki bu konuda belirli bir mantıkla gidildiğinde imkansız bir uygulama değil.

    kaynak alındıktan sonra belirli html tagları alınıp içerisindeki kelime sayılarının toplamının hangi tag veya taglar da çok ise geriye döndermek. olasılıklar çok sapan saçmada dönebilir, olumluda donebilir fakat belirli bir yüzdede başarılı olucaktır. Kısaca sayfadaki text yoğunluğuna odaklanmanın bir yolunu bulmak bana o kadarda zor görünmüyor.
  • 22-11-2012, 01:50:10
    #13
    MaviTm adlı üyeden alıntı: mesajı görüntüle
    lancewood "php ile olabileceğinden şüpheliyim" deki şüphen tuhaf bir şey olmuş varsayıyorum django, asp.Net, ruby, vs... gibi web dilleri ve teknolojileri ile olupta php ile olmayacak hiçbir uygulama yoktur.

    önemli olan algoritmayı çıkartmak ki bu konuda belirli bir mantıkla gidildiğinde imkansız bir uygulama değil.

    kaynak alındıktan sonra belirli html tagları alınıp içerisindeki kelime sayılarının toplamının hangi tag veya taglar da çok ise geriye döndermek. olasılıklar çok sapan saçmada dönebilir, olumluda donebilir fakat belirli bir yüzdede başarılı olucaktır. Kısaca sayfadaki text yoğunluğuna odaklanmanın bir yolunu bulmak bana o kadarda zor görünmüyor.
    Hocam şüpheliyim dememin nedeni, en başta belirttiğim uzman değilimden kaynaklanıyor.
  • 22-11-2012, 02:35:05
    #14
    Üyeliği durduruldu
    Cycl0ne adlı üyeden alıntı: mesajı görüntüle
    Bunu yapsam oxforda okurdum abi
    Tontonq adlı üyeden alıntı: mesajı görüntüle
    function file_get_contents_curl($url)
    {
    $ch = curl_init();

    curl_setopt($ch, CURLOPT_HEADER, 0);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

    $data = curl_exec($ch);
    curl_close($ch);

    return $data;
    }

    $html = file_get_contents_curl("http://example.com/");

    //parsing begins here:
    $doc = new DOMDocument();
    @$doc->loadHTML($html);
    $nodes = $doc->getElementsByTagName('title');

    //get and display what you need:
    $title = $nodes->item(0)->nodeValue;

    $metas = $doc->getElementsByTagName('meta');

    for ($i = 0; $i < $metas->length; $i++)
    {
    $meta = $metas->item($i);
    if($meta->getAttribute('name') == 'description')
    $description = $meta->getAttribute('content');
    if($meta->getAttribute('name') == 'keywords')
    $keywords = $meta->getAttribute('content');
    }

    echo "Title: $title". '<br/><br/>';
    echo "Description: $description". '<br/><br/>';
    echo "Keywords: $keywords";
    Description tagını veriyor sadece olay tüm texti vermesinde örnek olarak pm attım
  • 22-11-2012, 02:43:54
    #15
    Tioc adlı üyeden alıntı: mesajı görüntüle
    Description tagını veriyor sadece olay tüm texti vermesinde örnek olarak pm attım
    http://simplehtmldom.sourceforge.net/


    echo file_get_html('http://www.google.com/')->plaintext;
    Böyle deneyin
  • 22-11-2012, 02:59:53
    #16
    Dediğiniz şey sadece OpenGraph ile uyumlu sitelerde işe yarar. Aradığınız kod
    og:description meta tagıdır.
    deneme yapabilirsiniz. verdiğiniz site
    http://www.makaleci.com/dersler/digg...mit/index.html

    kutucuğa benim opengraph destekli sitemin urlsini yazmayı deneyin
    http://www.sercankd.com/gecen-gun-co...ilastim-1.html
    çektiği ilk şey
    <meta name="title" content="geçen gün çocukluğumla karşılaştım" />
    sonrasında çektiği şey ise

    <meta property="og:description" content="naber *** dedim..iyi abi dedi..ben senin 20 yıl sonraki halinim dedimvay anasını dedi..&nbsp;nereye gidiyosun dedim.okuldan kaçtım dedibaktım sıfatına; önlüğün tek yakası sökük, kolu sümüklü, çanta filan taşıyo bide..acıdım ****ye..&nbsp;sen nereye gidiyon dediişe..." />

    dikkat ederseniz kelimesi kelimesine noktalama işaretleri, ve yazım hatasına kadar yukarıdaki bölümü aldığını göreceksiniz.
  • 22-11-2012, 03:06:02
    #17
    Üyeliği durduruldu
    Deimosx adlı üyeden alıntı: mesajı görüntüle
    Dediğiniz şey sadece OpenGraph ile uyumlu sitelerde işe yarar. Aradığınız kod
    og:description meta tagıdır.
    deneme yapabilirsiniz. verdiğiniz site
    http://www.makaleci.com/dersler/digg...mit/index.html

    kutucuğa benim opengraph destekli sitemin urlsini yazmayı deneyin
    http://www.sercankd.com/gecen-gun-co...ilastim-1.html
    çektiği ilk şey
    <meta name="title" content="geçen gün çocukluğumla karşılaştım" />
    sonrasında çektiği şey ise

    <meta property="og:description" content="naber *** dedim..iyi abi dedi..ben senin 20 yıl sonraki halinim dedimvay anasını dedi..&nbsp;nereye gidiyosun dedim.okuldan kaçtım dedibaktım sıfatına; önlüğün tek yakası sökük, kolu sümüklü, çanta filan taşıyo bide..acıdım ****ye..&nbsp;sen nereye gidiyon dediişe..." />

    dikkat ederseniz kelimesi kelimesine noktalama işaretleri, ve yazım hatasına kadar yukarıdaki bölümü aldığını göreceksiniz.
    Desc tagını gördüğü bölümü alıyor, yukarda arkadaş yazmış zaten. Ama ben diyorum ki tüm text i verecek bunu yapan bir siteyi özel mesajla yolladım. Zaten başka bir sitede örneğini göremedim
  • 22-11-2012, 07:25:58
    #18
    Üyeliği durduruldu
    eğer bahsettiğiniz gibi birşey olsaydı og olmazdı ve description ve diğer metalara gerek kalmazdı.
    ben sitemi ajax ile yaparım sayfa boş yüklenir 5 sn sonra tek bir divin içine 1000 tane içerikli div yığarım ve senin yapmaya çalıştığın sistem ile sadece boş divi alırsın kaynak kodda sadece div olduğu için yani bir sitede içeriğin hangi tag içerisinde olduğunu %100 bulman imkansız