R10.net

R10.net (https://www.r10.net/index.php)
-   Programlama (https://www.r10.net/programlama/)
-   -   Beautifulsoup'tan anlayanlar bakabilir mi? (https://www.r10.net/programlama/2840891-beautifulsouptan-anlayanlar-bakabilir-mi.html)

Gamester 03-06-2021 22:06:24

Beautifulsoup'tan anlayanlar bakabilir mi?
 
Herkese merhaba, internette denk geldigim bir scraper'i gelistirmek icin ugrasiyorum fakat surekli hata aliyorum.
Asagida ki iki kod sikintisiz sekilde calisiyor.







Kodlar ve Spanlarin Adresleri

Kod:

productPrice = soup.find_all("div", class_= "prc-box-sllng prc-box-sllng-w-dscntd")
productPriceList = []
for i in productPrice:
    productPriceList.append(i.text)

Kod:

productName = soup.find_all("span", class_= "hasRatings")
productNameList = []
for i in range(len(productPriceList)):
    productNameList.append(productName[i].text)








Bu da benim istedigim span'in adresi




Yazdigim kod

Kod:

productRating = soup.find_all("div", class_= "ratingCount")
productRatingList = []
for i in productRating:
    productRatingList.append(productRating[i].text)

Aldigim hata

Kod:

  File "/Users/root/Desktop/t2/main.py", line 32, in <module>
    df = pd.DataFrame(table_dict)
  File "/Library/Frameworks/Python.framework/Versions/3.9/lib/python3.9/site-packages/pandas/core/frame.py", line 529, in __init__
    mgr = init_dict(data, index, columns, dtype=dtype)
  File "/Library/Frameworks/Python.framework/Versions/3.9/lib/python3.9/site-packages/pandas/core/internals/construction.py", line 287, in init_dict
    return arrays_to_mgr(arrays, data_names, index, columns, dtype=dtype)
  File "/Library/Frameworks/Python.framework/Versions/3.9/lib/python3.9/site-packages/pandas/core/internals/construction.py", line 80, in arrays_to_mgr
    index = extract_index(arrays)
  File "/Library/Frameworks/Python.framework/Versions/3.9/lib/python3.9/site-packages/pandas/core/internals/construction.py", line 401, in extract_index
    raise ValueError("arrays must all be same length")
ValueError: arrays must all be same length


ethmtrgt 08-06-2021 01:58:08

Hata beautifulsoup ile değil pandas modülü ile alakalı. Bkz: https://stackoverflow.com/questions/...ll-same-length

Fikirüssü 11-06-2021 12:39:49

@Gamester; Oylama ile işlemlerde sayfa bilgilerini aldığında bu bilgiler gözkükmez. Javascript ile sayfa açıldıktan sonra derlenerek bu şekile alır. Bu sebepten sayfanın Kaynağını Görüntüle diyerek aradığını yerin gerçekten olup, olmadığını teyit ederek işlem yapınız.


Tüm Zamanlar GMT +3 Olarak Ayarlanmış. Şuanki Zaman: 02:58:22.

Powered by vBulletin® Version 3.8.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.