• 01-06-2014, 21:56:46
    #1
    Üyeliği durduruldu
    Arkadaşlar merhaba.

    Elimde crawl class var. İnternetten indirmiştim. Curl ile veri çekebiliyorum. Fakat şöyle bir problem var :

    Benim çekmek istediğim veriler aynı sayfada 20-25 kere tekrar edebiliyor. Benim kodlarım sadece ilkini alıyor ve diğerlerini almıyor.

    <?php
    	require_once('crawl.class.php');
    	require_once('ez_sql_core.php');
    	require_once('ez_sql_mysql.php');
    	
    	$db = new ezSQL_mysql( 'nv1705', 'dbdb', 'curl_db', 'localhost');
    	$crawl = new crawl;
    	
    	foreach(file('link.txt') as $key => $value)
    	{
    		$crawl->curl( trim($value) );
    		$crawl->coded(true);
    		$title = addslashes ( htmlentities($crawl->regex('<a href="mailto:','">') ) );
    		if($db->query("insert into tablo_adi (kategori1,kategori2) values ('{$value}','{$title}')"))
    			echo '<p><font color="green">insert (OK)</font></p>';
    		else 
    			echo '<p><font color="red">insert (FALSE)</font></p>';
    	}
    Çekmek istediğim verilerin hepsi de aynı HTML TAG'ları içerisinde. Hepsini birden nasıl aldırabilirim?

    Teşekkürler.
  • 01-06-2014, 22:46:18
    #2
    Üyeliği durduruldu
    preg_match_all ile alabilirsin hocam bir araştır
  • 02-06-2014, 00:19:20
    #3
    Üyeliği durduruldu
    Sample adlı üyeden alıntı: mesajı görüntüle
    preg_match_all ile alabilirsin hocam bir araştır
    CURL ile alabiliyorum fakat tüm verileri alamıyorum. Aşağıdaki gibi bir sayfadan veri almak istediğimde sadece 1 mail adresini alıyor. Ben bu sayfada yer alan tüm mail adreslerini almak istiyorum.


    <tr height="17" style="height: 12.75pt">
        <td height="17" width="95" style="height: 12.75pt; width: 71pt; color: black; font-size: 7.5pt; font-family: Verdana, sans-serif; text-align: left; white-space: normal; font-weight: 400; font-style: normal; text-decoration: none; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white">
        Ankara</td>
        <td style="width: 191px; color: black; font-size: 7.5pt; font-weight: 700; font-family: Verdana, sans-serif; text-align: left; white-space: normal; font-style: normal; text-decoration: none; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white">
        ANI BİLGİSAYAR</td>
        <td style="width: 218px; color: blue; font-size: 7.5pt; text-decoration: underline; text-underline-style: single; text-align: left; white-space: normal; font-weight: 400; font-style: normal; font-family: Arial Tur; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white">
        <a target="_blank" href="http://www.anibilisim.com/">
        <span style="font-size: 7.5pt">www.anibilisim.com</span></a></td>
        <td style="width: 219px; color: blue; font-size: 7.5pt; text-decoration: underline; text-underline-style: single; text-align: left; white-space: normal; font-weight: 400; font-style: normal; font-family: Arial Tur; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white">
        <a href="mailto:ani@anibilgisayar.com"><span style="font-size: 7.5pt">
        ani@anibilgisayar.com</span></a></td>
    </tr>
    <tr height="17" style="height: 12.75pt">
        <td height="17" width="95" style="height: 12.75pt; width: 71pt; color: black; font-size: 7.5pt; font-family: Verdana, sans-serif; text-align: left; white-space: normal; font-weight: 400; font-style: normal; text-decoration: none; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white">
        Ağva</td>
        <td style="width: 191px; color: black; font-size: 7.5pt; font-weight: 700; font-family: Verdana, sans-serif; text-align: left; white-space: normal; font-style: normal; text-decoration: none; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white">
        GRAND ELEKTRIK</td>
        <td style="width: 218px; color: blue; font-size: 7.5pt; text-decoration: underline; text-underline-style: single; text-align: left; white-space: normal; font-weight: 400; font-style: normal; font-family: Arial Tur; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white">
        <a target="_blank" href="http://www.grandelektrik.com/">
        <span style="font-size: 7.5pt">www.grandelektrik.com</span></a></td>
        <td style="width: 219px; color: blue; font-size: 7.5pt; text-decoration: underline; text-underline-style: single; text-align: left; white-space: normal; font-weight: 400; font-style: normal; font-family: Arial Tur; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white">
        <a href="mailto:info@grandelektrik.com">
        <span style="font-size: 7.5pt">info@grandelektrik.com</span></a></td>
    </tr>
    <tr height="17" style="height: 12.75pt">
        <td height="17" width="95" style="height: 12.75pt; width: 71pt; color: black; font-size: 7.5pt; font-family: Verdana, sans-serif; text-align: left; white-space: normal; font-weight: 400; font-style: normal; text-decoration: none; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white">
        Compex</td>
        <td style="width: 191px; color: black; font-size: 7.5pt; font-weight: 700; font-family: Verdana, sans-serif; text-align: left; white-space: normal; font-style: normal; text-decoration: none; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white" x:str="COMPEX FARUK ">
        COMPEX FARUK&nbsp;</td>
        <td style="width: 218px; color: blue; font-size: 7.5pt; text-decoration: underline; text-underline-style: single; text-align: left; white-space: normal; font-weight: 400; font-style: normal; font-family: Arial Tur; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white" x:str="www.compexfaruk.8m.net ">
        <a target="_blank" href="http://www.compexfaruk.8m.net/">
        <span style="font-size: 7.5pt">www.compexfaruk.8m.net&nbsp;</span></a></td>
        <td style="width: 219px; color: blue; font-size: 7.5pt; text-decoration: underline; text-underline-style: single; text-align: left; white-space: normal; font-weight: 400; font-style: normal; font-family: Arial Tur; vertical-align: bottom; border: medium none; padding-left: 1px; padding-right: 1px; padding-top: 1px; background: white">
        <a href="mailto:compexfaruk@mynet.com"><span style="font-size: 7.5pt">
        compexfaruk@mynet.com</span></a></td>
    </tr>
    Yardım için teşekkür ederim.
  • 02-06-2014, 00:25:58
    #4
    Üyeliği durduruldu
    $site=file_get_contents("file.txt");
    preg_match_all('#<a href="mailto:(.*?)">#si',$site,$phpbot);
    $phpbot = implode($phpbot[1]);
    print $phpbot; // bütün mail adreslerini listeler
  • 02-06-2014, 00:35:41
    #5
    Üyeliği durduruldu
    Sample adlı üyeden alıntı: mesajı görüntüle
    $site=file_get_contents("file.txt");
    preg_match_all('#<a href="mailto:(.*?)">#si',$site,$phpbot);
    $phpbot = implode($phpbot[1]);
    print $phpbot; // bütün mail adreslerini listeler
    çok teşekkür ediyorum ilginiz için. File.txt dosyasında 110'a yakın url var bunların hepsini okur mu kod yoksa array gibi birşeylere mi sokmak gerekiyor?

    tekrar tşkler.
  • 02-06-2014, 00:46:56
    #6
    Üyeliği durduruldu
    sadece <a href="mailto.*?)"> aralıgını alır hocam bütün mailleri ekrana basar direk
  • 02-06-2014, 01:07:40
    #7
    Üyeliği durduruldu
    Sample adlı üyeden alıntı: mesajı görüntüle
    sadece <a href="mailto.*?)"> aralıgını alır hocam bütün mailleri ekrana basar direk
    Anlatamadım özür dilerim. URL olarak txt dosyasında farklı farklı 120ye yakın URL var. Hepsini alır mı URL'lerin?

    file.txt dosyasında tek bir URL bulunmuyor yani. Alt alta 109 url varmış kontrol ettim şimdi.

    Teşekkürler.
  • 02-06-2014, 01:12:14
    #8
    Üyeliği durduruldu
    <a href="mailto ile başlayan tüm url lerin içerisindeki veriyi alır hocam
  • 02-06-2014, 01:34:01
    #9
    Üyeliği durduruldu
    Sample adlı üyeden alıntı: mesajı görüntüle
    <a href="mailto ile başlayan tüm url lerin içerisindeki veriyi alır hocam
    sadece ilk URL'de bulunan mailleri aldı. İkinci URL'ye geçmedi.

    http://domain.com/1.html
    http://domain.com/2.html

    gibi adresler mevcut file.txt içinde. Teşekkürler.