• 25-05-2014, 17:52:33
    #1
    Herhangi bir web sitesinin kaynak kodundaki bütün linkleri bulmam gerekiyor. Herhangi bir web site adresi textboxa girilip butona tıklandığında o sitenin kaynak kodlarını alabiliyorum fakat sitedeki linkleri yani a href = " " leri alamıyorum.

    Java ile oluşturuduğum sistem için nasıl bir yol izlemem gerekir? Alttaki gibi yaptığımda String pattern ile başlayan satırda syntax hatası veriyor.

    URL information = new URL(url);
            URLConnection yc = information.openConnection();
            BufferedReader in = new BufferedReader(new InputStreamReader(
                    yc.getInputStream(), "UTF-8"));
            String inputLine;
            StringBuilder gelenBilgi = new StringBuilder();
            while ((inputLine = in.readLine()) != null)
            	gelenBilgi.append(inputLine);
            in.close();
            
            String pattern = "((https?|ftp|file)\://(www)?)[A-Za-z0-9\.\-]+(/[A-Za-z0-9\?\&\=;\+!'\(\)\*\-\._~%]*)*";
    
            Pattern r = Pattern.compile(pattern);
    
            Matcher matcher = r.matcher(gelenBilgi);
            
            int count = 0;
            while (matcher.find())
                count++;
            
            List lst = new List();
            
            for(int i = 0; i< count; i++)
            {
    	        if (matcher.find( )) {
    	           lst.add(matcher.group(i));
    	        }
            }
  • 25-05-2014, 18:04:40
    #2
    🌐 𝘀𝗼𝗰𝗶𝗳𝗹𝘆.𝗰𝗼𝗺
    Netbeans kurulu olmadığı için deneyemedim ama java grab url diye aratınca baya bir kod yığını çıkıyor. Stackoverflow da falan baya kodlar var hocam.
  • 26-05-2014, 00:18:18
    #3
    tolgasen adlı üyeden alıntı: mesajı görüntüle
    Netbeans kurulu olmadığı için deneyemedim ama java grab url diye aratınca baya bir kod yığını çıkıyor. Stackoverflow da falan baya kodlar var hocam.
    Dediğiniz şekilde arama yaparak istediğime ulaştım teşekkürler Allah razı olsun