• 13-07-2024, 12:55:17
    #1
    Arkadaşlar iyi çalışmalar..

    Bir çalışmam için aşağıdaki urldeki ana görseli çekmek istiyorum.. Nasıl yapabilirim..

    https://www.olumhaberi.com/haci-acar...aldirida-oldu/

    Not: Bu sayfa örnektir. Benzer bir başka siteden çekim olucaktır.
  • 13-07-2024, 12:57:52
    #2
    hangi dille yazıyorsun onu söylemende lazım (:
  • 13-07-2024, 12:58:32
    #3
    fatbotter.com
    Örnektir

    from selenium import webdriver
    from selenium.webdriver.common.by import By
    import requests
    import os
    
    # WebDriver'ı başlatın (Bu örnekte ChromeDriver kullanılıyor)
    driver_path = 'path/to/chromedriver'  # Buraya ChromeDriver'ın yolunu girin
    driver = webdriver.Chrome(driver_path)
    
    # URL'yi açın
    url = 'https://www.example.com'  # Buraya hedef URL'yi girin
    driver.get(url)
    
    # Resim elementini bulun (örneğin, img etiketi ve belirli bir sınıf adı ile)
    image_element = driver.find_element(By.CSS_SELECTOR, 'img.some-class-name')  # CSS seçiciyi güncelleyin
    
    # Resim URL'sini alın
    image_url = image_element.get_attribute('src')
    
    # Resmi indirin ve yerel diske kaydedin
    response = requests.get(image_url)
    if response.status_code == 200:
        with open('downloaded_image.jpg', 'wb') as file:
            file.write(response.content)
        print('Resim başarıyla indirildi!')
    else:
        print('Resim indirilemedi. HTTP Durum Kodu:', response.status_code)
    
    # WebDriver'ı kapatın
    driver.quit()

    Başka bir örnek

    import re
    from selenium import webdriver
    from selenium.webdriver.chrome.service import Service
    from selenium.webdriver.common.by import By
    from selenium.webdriver.chrome.options import Options
    import requests
    
    # WebDriver'ı başlatma
    driver_path = 'path/to/chromedriver'  # ChromeDriver'ın yolunu girin
    options = Options()
    options.headless = True  # Tarayıcının görünmemesi için headless modu kullanabilirsiniz
    service = Service(driver_path)
    driver = webdriver.Chrome(service=service, options=options)
    
    # URL'yi açma
    url = 'https://www.example.com'  # Hedef URL'yi girin
    driver.get(url)
    
    # Sayfanın HTML kaynak kodunu alma
    page_source = driver.page_source
    
    # WebDriver'ı kapatma
    driver.quit()
    
    # Regex kullanarak resim URL'sini bulma
    # Bu örnekte img etiketlerinin src özniteliklerini düzenli ifade kullanarak buluyoruz
    image_urls = re.findall(r'<img[^>]+src="([^">]+)"', page_source)
    
    # İlk resmi alıp indirme (daha fazla resim için döngü ile işleyebilirsiniz)
    if image_urls:
        image_url = image_urls[0]
        response = requests.get(image_url)
        if response.status_code == 200:
            with open('downloaded_image.jpg', 'wb') as file:
                file.write(response.content)
            print('Resim başarıyla indirildi!')
        else:
            print('Resim indirilemedi. HTTP Durum Kodu:', response.status_code)
    else:
        print('Hiçbir resim bulunamadı.')
  • 13-07-2024, 13:05:07
    #4
    Wordpress tabanlı sitelerden çekecekseniz selenium ile uğraşmanıza gerek yok. Rest api üzerinden alabilirsiniz. Hem performanstan hem zamandan kazanırsınız. Cloudflare takılırsanız da farklı çözümler mevcut.
  • 13-07-2024, 13:05:42
    #5
    Selenium ile link urlsini çeken örnek kod

    from bs4 import BeautifulSoup
    from selenium import webdriver
    from selenium.webdriver.common.by import By
    from selenium.webdriver.support.wait import WebDriverWait
    from selenium.webdriver.support import expected_conditions as EC
    
    driver = webdriver.Chrome()
    
    driver.get('https://www.olumhaberi.com/inanc-oktemay-ve-ozge-ceren-deniz-izmir-de-yolda-elektrik/')
    WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.CLASS_NAME, 'g1-frame-inner'))
    )
    html_content = driver.page_source
    soup = BeautifulSoup(html_content, 'html.parser')
    src = soup.find('div', class_='g1-img-wrap mashsb-micro-wrapper').find('img')['src']
    print(src)
  • 13-07-2024, 13:53:09
    #6
    Melihhh adlı üyeden alıntı: mesajı görüntüle
    hangi dille yazıyorsun onu söylemende lazım (:
    Excel vba üzerinden yazıyorum üstadım..
  • 13-07-2024, 13:55:25
    #7
    fatiheryildiz adlı üyeden alıntı: mesajı görüntüle
    Excel vba üzerinden yazıyorum üstadım..
    VALLAHİ onu bilmiyorum kardeş python falan olsaydı yardımcı olurdum da excel seleniumun varlığını bile bilmiyordum şimdiye kadar inan ki
  • 13-07-2024, 13:57:28
    #8
    Melihhh adlı üyeden alıntı: mesajı görüntüle
    VALLAHİ onu bilmiyorum kardeş python falan olsaydı yardımcı olurdum da excel seleniumun varlığını bile bilmiyordum şimdiye kadar inan ki
    Eyvallah üstadım teşekkür ederim. Excelle kolay oluyor normalde, verileri istediğiniz şekilde ayarlayıp hücrelere yazdırabiliyorsunuz ve böylece güzel ayarlarsanız indirme ve yüklenecek yere yüklemeyi bile yapabilirsiniz..
  • 13-07-2024, 13:59:49
    #9
    lookout adlı üyeden alıntı: mesajı görüntüle
    Örnektir

    from selenium import webdriver
    from selenium.webdriver.common.by import By
    import requests
    import os
    
    # WebDriver'ı başlatın (Bu örnekte ChromeDriver kullanılıyor)
    driver_path = 'path/to/chromedriver'  # Buraya ChromeDriver'ın yolunu girin
    driver = webdriver.Chrome(driver_path)
    
    # URL'yi açın
    url = 'https://www.example.com'  # Buraya hedef URL'yi girin
    driver.get(url)
    
    # Resim elementini bulun (örneğin, img etiketi ve belirli bir sınıf adı ile)
    image_element = driver.find_element(By.CSS_SELECTOR, 'img.some-class-name')  # CSS seçiciyi güncelleyin
    
    # Resim URL'sini alın
    image_url = image_element.get_attribute('src')
    
    # Resmi indirin ve yerel diske kaydedin
    response = requests.get(image_url)
    if response.status_code == 200:
        with open('downloaded_image.jpg', 'wb') as file:
            file.write(response.content)
        print('Resim başarıyla indirildi!')
    else:
        print('Resim indirilemedi. HTTP Durum Kodu:', response.status_code)
    
    # WebDriver'ı kapatın
    driver.quit()
    Başka bir örnek

    import re
    from selenium import webdriver
    from selenium.webdriver.chrome.service import Service
    from selenium.webdriver.common.by import By
    from selenium.webdriver.chrome.options import Options
    import requests
    
    # WebDriver'ı başlatma
    driver_path = 'path/to/chromedriver'  # ChromeDriver'ın yolunu girin
    options = Options()
    options.headless = True  # Tarayıcının görünmemesi için headless modu kullanabilirsiniz
    service = Service(driver_path)
    driver = webdriver.Chrome(service=service, options=options)
    
    # URL'yi açma
    url = 'https://www.example.com'  # Hedef URL'yi girin
    driver.get(url)
    
    # Sayfanın HTML kaynak kodunu alma
    page_source = driver.page_source
    
    # WebDriver'ı kapatma
    driver.quit()
    
    # Regex kullanarak resim URL'sini bulma
    # Bu örnekte img etiketlerinin src özniteliklerini düzenli ifade kullanarak buluyoruz
    image_urls = re.findall(r'<img[^>]+src="([^">]+)"', page_source)
    
    # İlk resmi alıp indirme (daha fazla resim için döngü ile işleyebilirsiniz)
    if image_urls:
        image_url = image_urls[0]
        response = requests.get(image_url)
        if response.status_code == 200:
            with open('downloaded_image.jpg', 'wb') as file:
                file.write(response.content)
            print('Resim başarıyla indirildi!')
        else:
            print('Resim indirilemedi. HTTP Durum Kodu:', response.status_code)
    else:
        print('Hiçbir resim bulunamadı.')
    karakurtmedya adlı üyeden alıntı: mesajı görüntüle
    Selenium ile link urlsini çeken örnek kod

    from bs4 import BeautifulSoup
    from selenium import webdriver
    from selenium.webdriver.common.by import By
    from selenium.webdriver.support.wait import WebDriverWait
    from selenium.webdriver.support import expected_conditions as EC
    
    driver = webdriver.Chrome()
    
    driver.get('https://www.olumhaberi.com/inanc-oktemay-ve-ozge-ceren-deniz-izmir-de-yolda-elektrik/')
    WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.CLASS_NAME, 'g1-frame-inner'))
    )
    html_content = driver.page_source
    soup = BeautifulSoup(html_content, 'html.parser')
    src = soup.find('div', class_='g1-img-wrap mashsb-micro-wrapper').find('img')['src']
    print(src)
    Eyvallah üstadlarım. Sanırım bu örneklerle çözerim diye düşünüyorum. Herkese çok çok teşekkür ederim.