Merhaba,
İnternette google örümcekleri gibi dolaşıp sitelerden bilgi alıp bunu kendi database'ine kaydeden bir script istiyorum.Bunun için ne kadar bir ücret çıkar karşımıza ?
Teşekkürler
veri alan script
13
●780
- 20-07-2009, 02:36:48Kimlik doğrulama veya yönetimden onay bekliyor.Bundan 2 yıl evvel semantik web projesi üstünde çalışırken buna benzer birşeyi yaptım. Hatta dreamhost hesabımda yüzbin civarı sayfa indeksledim.Cagatayh adlı üyeden alıntı: mesajı görüntüle
Çok problemleri var hatırladığım kadarıyla, geliştiricinin hepsini aşması gerek. Mesela aynı döngülerde dolanmamak gibi. Mesela javascript linklerden tutun da link-farm'lara girmemek gibi (internetin çok ciddi bölümü adsense için yapılmış saçma sayfalardan oluşur, bir girdiniz mi zor çıkarsınız) dolanan örümceğin biraz da verimli dolaşması lazım, aynı ağlara dalıp veritabanın yarısını aynı sitelerden alırsanız sadece o sitelerin arama motoru gibi olursunuz.
Bunun dışında çok şey de var.
Böyle bir işi alabilirim ama sizden sabır bekleyeceğim, süre üstünden değil, işin kalitesi üstünden konuşalım. Çünkü periyodik olarak çalıştıracağınzı bir kod olacak verimli olmalı.
PM ile ulaşırsanız size referans listemi aktarabilirim.
İlgili kod yanımda yok, eski bilgisayarımla gitti. Ama önemli olan zaten crawler kodunu yazmak değil, kafada oturtmak, kodda birşey yok, 5-10 sayfa en fazla.
Tolga - 20-07-2009, 03:47:21hatta bazı bölümler python ile yazılmalı da diyebiliriz, düşünmek gerek. Performans önemli çünkü.
- 20-07-2009, 04:46:20birkaç mikrosaniyelik performans artışı, crawlayacağın site ile çarparsan birkaç saatlik hatta belki günlük bir performans artışına dönüşür.BHCoder adlı üyeden alıntı: mesajı görüntüle
PHP ile de yazılır, C++ ile de, Java ile de, önemli olan dil değil, kastım bu değil.
Neyse benim de teklifim temelde PHP için, veritabanının siz seçin, hepsiyle çalışabilirim. - 20-07-2009, 15:34:48Arkadaşlar tek tek teşekkür ederim. Maddi kaynak yeterli ancak bu proje üzerinde çalışmam lazım biraz daha. Çünkü benim tahmin ettiğimden daha da çok karışık gözüküyor.
Peki sorumu değiştirsem sizlere şöyle bir şey sunsam yine aynı şekilde karışık bir iş mi olur ?
Bir crawler kodu yazılacak ve internetteki tüm aktif domainleri dolaşıp, veritabanına sırasıyla domain isimlerini kaydedecek .Amaç internetteki aktif domain isimlerinin veritabanına kaydı. - 20-07-2009, 20:39:48Misafirçok çok mantıklı yazmışssınız, bilhassa bir önceki postunuz (uzun olan),gentleRain adlı üyeden alıntı: mesajı görüntüle
tebrik etmek istedim sizi.
söylediklerinize tamamen katılıyorum
