Öncelikle merhaba, geçtiğimiz günlerde php tabanlı içerisinde 10bin adet haber bulunan bir siteyi wordpresse başarılı bir şekilde aktardım. Fakat sitenin önceki googleda bulunan kayıtlı sayfaları ile wordpresste bulunan yazıları bir türlü eşleştiremedim. Googledan gelen bir kullanıcı habere tıkladıgında her zaman 404 ekranı ile karşılaşıyor. 3-4 gündür bu sorun ile boğuşmama rağmen bir çözüm bulabilmiş değilim.
Çözümü .htaccess ile çözmeye çalıştım çok yaklaştım fakat bazı haberlerde hata aldım sanırım kullandıgım yöntemin geliştirilmesi gerekiyor bunun içinde yardımlarınızı bekliyorum.
Detaylı olarak sorunum;
Sitenin php sürümünde google'da Haberin linki
https://example/deneme-yazi-1231.html olarak kayıtlı yani ilk önce başlık, sonra yazı idsi, ardından .html etiketi.
Ben siteyi wordpresse geçirince sayfanın urli şuna dönüştü
https://example/deneme-yazi/ Haliyle googledan habere tıklayan kullanıcı 404 ile karşılaşıyor ve sistemdeki yazıyı bulamıyor.
Bazı regex yöntemleriyle bunu düzeltmeyi başardım örneğin
https://example/deneme-yazi-1231.html linkine tıklayan kullanıcı (.*?)-d+.html regexteki bu kodun yardımıyla .html etiketi ve id yi silerek normal sayfaya yönleniyor. Fakat sistemde sayfalar 3 farklı yöntem ile kayıt edilmiş bazılarının urlinde sadece yazının başlığı, bazılarında yazının başlığı ve idsi, bazılarında yazının başlığı, yazının idsi ve .html etiketi mevcut. Hal böyle olunca (.*?)-d+.html bu kod biraz işlevsiz kalıyor çünkü bazılarında .html etiketi olmadıgı için yine 404 hatası alıyorum.
Unutulmaması gereken bir diğer konu ise bazı haberlerin başlığından 15 bin dolarlık dava gibi sayıların mevcut olması. Yani regexe, urlde bulunan tüm sayıları sil diyemeyiz bir koşulla birlikte urlin sonundaki sayıları silmeli.
Umarım derdimi detaylı bir şekilde anlatabilmişimdir, bu konudaki görüşlerinizi, fikirleriniz ve yardımlarınızı bekliyorum. Düşük olmak ile birlikte bir ücrette ödeyebilirim.