Python Bu Veriden Regex ile Nasıl Linkleri Çıkartabilirim

02-08-2022, 17:39:42

['<![CDATA[https://www.themarthablog.com/addl-sitemap.xml]]>', '<![CDATA[https://www.themarthablog.com/post-sitemap1.xml]]>', '<![CDATA[https://www.themarthablog.com/post-sitemap2.xml]]>', '<![CDATA[https://www.themarthablog.com/post-sitemap3.xml]]>', '<![CDATA[https://www.themarthablog.com/post-sitemap4.xml]]>', '<![CDATA[https://www.themarthablog.com/post-sitemap5.xml]]>', '<![CDATA[https://www.themarthablog.com/category-sitemap.xml]]>']

https://www.themarthablog.com/addl-sitemap.xml regex ile bunu kazımak istiyorum. Nasıl yapabilirim

02-08-2022, 17:44:12

#2

mertcangokgoz

lxml + requests ile çok rahat yapılır. Sonuçta XML bu

02-08-2022, 17:45:15

#3

A.AY

mertcangokgoz adlı üyeden alıntı: mesajı görüntüle

lxml + requests ile çok rahat yapılır. Sonuçta XML bu

beautifulsoup ile veri çekiyorum sonuç bu şekilde çıktı bu text bir veri
veriyi zaten çektim. amacım linklerin başındaki sondaki karakterleri silmek

02-08-2022, 17:51:21

#4

FurkanAkman

Regex :

CDATA\[(.+?)]

Döngü ile içerisindekilerin hepsini alabilirsin.
Regex deneme yapabileceğin yer : https://regex101.com/

02-08-2022, 17:57:26

#5

A.AY

FurkanAkman adlı üyeden alıntı: mesajı görüntüle

Regex :

CDATA\[(.+?)]

Döngü ile içerisindekilerin hepsini alabilirsin.
Regex deneme yapabileceğin yer : https://regex101.com/

Bu siteyi geçen buldum ama kullanmasını bilmiyorum. Nasıl öğrenebilirim. Baya yararlı bir site

02-08-2022, 17:59:09

#6

FurkanAkman

A.AY adlı üyeden alıntı: mesajı görüntüle

Bu siteyi geçen buldum ama kullanmasını bilmiyorum. Nasıl öğrenebilirim. Baya yararlı bir site

Üst kısıma Regex desenini yazıyorsun ve alt kısıma normal verileri ekliyorsun. Doğru ve eşleşen sonuç olursa sana sağ kısımda gösterir hepsini. Site basit sadece regex desenlerini öğrenmek gerekli.

02-08-2022, 18:00:47

#7

A.AY

FurkanAkman adlı üyeden alıntı: mesajı görüntüle

Üst kısıma Regex desenini yazıyorsun ve alt kısıma normal verileri ekliyorsun. Doğru ve eşleşen sonuç olursa sana sağ kısımda gösterir hepsini. Site basit sadece regex desenlerini öğrenmek gerekli.

işte o desenleri bilmiyorum. Baya karışık bir konu

bir ara öğreneceğim ama.
Şunun gibi bir sistem arıyorum. Bir site olacak. tüm kodu yazıcaz sonra ayrıştırmak istediğim kısımları belirlicez, site kendisi desen yazacak.
Böyle bir site varmı acaba?