• 02-08-2022, 17:39:42
    #1
    ['<![CDATA[https://www.themarthablog.com/addl-sitemap.xml]]>', '<![CDATA[https://www.themarthablog.com/post-sitemap1.xml]]>', '<![CDATA[https://www.themarthablog.com/post-sitemap2.xml]]>', '<![CDATA[https://www.themarthablog.com/post-sitemap3.xml]]>', '<![CDATA[https://www.themarthablog.com/post-sitemap4.xml]]>', '<![CDATA[https://www.themarthablog.com/post-sitemap5.xml]]>', '<![CDATA[https://www.themarthablog.com/category-sitemap.xml]]>']
    https://www.themarthablog.com/addl-sitemap.xml regex ile bunu kazımak istiyorum. Nasıl yapabilirim
  • 02-08-2022, 17:44:12
    #2
    lxml + requests ile çok rahat yapılır. Sonuçta XML bu
  • 02-08-2022, 17:45:15
    #3
    mertcangokgoz adlı üyeden alıntı: mesajı görüntüle
    lxml + requests ile çok rahat yapılır. Sonuçta XML bu
    beautifulsoup ile veri çekiyorum sonuç bu şekilde çıktı bu text bir veri
    veriyi zaten çektim. amacım linklerin başındaki sondaki karakterleri silmek
  • 02-08-2022, 17:51:21
    #4
    Regex :

    CDATA\[(.+?)]
    Döngü ile içerisindekilerin hepsini alabilirsin.
    Regex deneme yapabileceğin yer : https://regex101.com/
  • 02-08-2022, 17:57:26
    #5
    FurkanAkman adlı üyeden alıntı: mesajı görüntüle
    Regex :

    CDATA\[(.+?)]
    Döngü ile içerisindekilerin hepsini alabilirsin.
    Regex deneme yapabileceğin yer : https://regex101.com/
    Bu siteyi geçen buldum ama kullanmasını bilmiyorum. Nasıl öğrenebilirim. Baya yararlı bir site
  • 02-08-2022, 17:59:09
    #6
    A.AY adlı üyeden alıntı: mesajı görüntüle
    Bu siteyi geçen buldum ama kullanmasını bilmiyorum. Nasıl öğrenebilirim. Baya yararlı bir site
    Üst kısıma Regex desenini yazıyorsun ve alt kısıma normal verileri ekliyorsun. Doğru ve eşleşen sonuç olursa sana sağ kısımda gösterir hepsini. Site basit sadece regex desenlerini öğrenmek gerekli.
  • 02-08-2022, 18:00:47
    #7
    FurkanAkman adlı üyeden alıntı: mesajı görüntüle
    Üst kısıma Regex desenini yazıyorsun ve alt kısıma normal verileri ekliyorsun. Doğru ve eşleşen sonuç olursa sana sağ kısımda gösterir hepsini. Site basit sadece regex desenlerini öğrenmek gerekli.
    işte o desenleri bilmiyorum. Baya karışık bir konu bir ara öğreneceğim ama.
    Şunun gibi bir sistem arıyorum. Bir site olacak. tüm kodu yazıcaz sonra ayrıştırmak istediğim kısımları belirlicez, site kendisi desen yazacak.
    Böyle bir site varmı acaba?