• 08-11-2016, 16:13:45
    #1
    Merhaba arkadaşlar ,

    simple html dom ile veri çekerken https bir sayfadan null değer dönüyor. Aşağıdaki gibi curl kodlarıyla çekmeye çalıştığımda ise aşağıdaki gibi şifreli olarak veriyor kodları. Sanırım bot kontrolü var , bunu nasıl aşabiliriz..

    <title>xxx - Security Check</title> <style type="text/css">@font-face{font-family:'Roboto Condensed';font-style:normal;font-weight:400;src:local('Roboto Condensed'),local('RobotoCondensed-Regular'),url(data:application/octet-stream;charset=binary;base64,d09GRgABAAAAADOoAA8AA AAATSwAA vs..vs..vs..

    $curl = curl_init();
    curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, FALSE);
    curl_setopt($curl, CURLOPT_HEADER, false);
    curl_setopt($curl, CURLOPT_FOLLOWLOCATION, true);
    curl_setopt($curl, CURLOPT_URL, $base);
    curl_setopt($curl, CURLOPT_REFERER, $base);
    curl_setopt($curl, CURLOPT_RETURNTRANSFER, TRUE);
    $str = curl_exec($curl);
    curl_close($curl);
    $html_code = new simple_html_dom();
    $html_code->load($str);


    Not: Python ile denedim sorunsuz şekilde kodlar çekti (requests modülü) , php den neden sorun çıktı anlamadım...
  • 09-11-2016, 11:12:51
    #2
    Üyeliği durduruldu
    Veri çekimi yaptığınız siteyi ve neye göre filtreleme yaptığını bilmediğimizden dolayı aşağıdaki seçenekleri önerebiliriz.

    Örnekler;

    1) Cookie sağlıyarak erişim yapmayı deniyebilirsiniz.
    2) User-Agent ile tarayıcı tanımı yapabilirsiniz.
  • 11-11-2016, 13:33:43
    #3
    Kimlik doğrulama veya yönetimden onay bekliyor.
    bknz: https://github.com/rmccue/requests session oluşturup oradan sırasıyla post ederek asıl sayfaya atlayabilirsin. biraz uğraştırır ama yaparsın.