inforesim adlı üyeden alıntı:
mesajı görüntüle
PHP uzmanıyım diyen var mı ?
44
●3.384
- 23-11-2012, 23:46:06
- 24-11-2012, 03:23:52Kimlik doğrulama veya yönetimden onay bekliyor.anladığım kadarıyla facebook'un kullandığı sistem gibi bir şey yapmaya çalışıyorsun. Facebook'da yine anlayabildiğim kadarıyla bu fifti-fifti ihtimalle elde edilen bir bilgi.
Facebook ilk başta sayfada kendi dağıttığı ve yayıncıların headere eklediği <og:xxx> taklerini kontrol ediyor buradan title+desc+resim vb gerekli bilgileri elde edemezse <meta> lardan elde ediyor ancak metalarda resim bulunmadığı için sayfa üzerinde yer alan <img> taglerinin hepsini alıp kaç tane bulduysa 1/5 vs.. şeklinde kullanıcının seçebilmesi için çıkarıyor. Sende aynı şekilde preg match ile tüm imajları alıp seçilebilir şekilde çıkarabilirsin istediğin şey buysa tek yöntem budur onun dışında diğer arkadaşlarında dediği gibi tüm sitelerin syntaxı farklı olduğundan sabit desen ile imaj bulmak mümkün değil. - 24-11-2012, 03:27:21Üyeliği durdurulduİlk mesajımdaki resimlere bakarsan, bu olayı facebook'un yapamadığını da göreceksin.Suerte adlı üyeden alıntı: mesajı görüntüle
- 24-11-2012, 03:33:58Kimlik doğrulama veya yönetimden onay bekliyor.Merhaba,
Algoritmayı söylüyorum umarım yapabilirsiniz, şuan vaktim olmadığı için yapamıyorum.
Curl ile siteye giriş yapıp kaynak kodları aldıkdan sonra body içerisindeki div,p,span gibi tagları sorgulayıp 300 karakterden fazla olanı alıyorsunuz.
Ardından bunların arasında en fazla karakter olanı gösterim alanı olarak seçip devam ediyorsunuz fakat bunları silmiyorsunuz, 2. 3. 4. artık kaç adet var ise arraylere dağıtıp içeriklere ekliyorsunuz.
Daha sonra bu çıktıyı json'a parse edip ajax üzerinden next prev özelliği ekleyip en yüksek karakterliyi 0. sıraya 0. sıradakini ise textarea ya yazdırıyorsunuz. Next Prev özelliği ile de önceki sonraki yani içeriği seçtiriyorsunuz.
Ekleme ;
300 karakter benim kendi düşüncemdir, bunu siz ayarlayabilirsiniz, algoritmada belirlediğiniz karakterden fazla içerik yok ise alt sınırlar belirleyip o koşulları sağlayacak dengeyi ayarlamanız durumunda içerik bulunamayacaktır.
Umarım açıklayıcı olmuştur.
Saygılarımla. - 25-11-2012, 22:11:38Aslında yapılabilir algoritmayı kurmak lazım , preg_match_all ile divlerin içinde ne var kontrol ettirirsin analiz ettirirsin ona göre hangisi resim , ne alınacak , ne yoksayılacak , hangisi resim hangisi başlık , hangisi etiket yaptırırsın zaten. Algoritmayı kurman lazım biraz o kadar.
- 26-11-2012, 00:36:12Bu kısa sürede yapılacak bir şey değil uzun zamanlar ister sürekli algoritmalar üretmeniz gerekecek.
Ben alttakinde divler arasındaki verileri çekip bunların 300'den fazla olanı alıyorum mesela ama diğer sitelerin yapısına göre değiştirmek gerekecek.
Kısacası bu böyle 1 günde bitecek bir şey değil kesinlikle.
<?php $url = "http://slashdot.org/"; $site = file_get_contents($url); $divsayisi = substr_count($site,"<div"); for($i=1;$i<=$divsayisi;$i++) { $div = explode("<div",$site); $div = explode("</div>",$div[$i]); // var_dump($div[0]); $div = explode(">",$div[0]); $say = count($div)-1; for($a=0;$a<=$say;$a++) { $topla = $div[$a]." ".$topla; } $net = strip_tags($topla)."<br><br><br><br>"; if(strlen($net)>=300) { echo $net; } } ?>