merhaba,
çok kahve içmeyin şeklinde bir latife yaparak bir tavsiye vereyim. vermiş olduğunuz faktöriyel ihtimali elbette sözkonusu fakat bunu okuyan bunu da okudu kapsamında bir yönlendirme verecekseniz, bu olası kombinasyonların adetleri sizi ilgilendiriyor olacak. bunların en fazlaları ile çalışacaksınız. yoksa teoride muhakkak çokca kombinasyon sözkonusu.
eğer gerçekten bunu okuyan bunu da okudu verisi vermek istiyorsanız bu datayı saklamalısınız. sisteminizi, sunucu ve veritabanı yapınızı bilmiyorum fakat fikir vermesi açısından şöyle bir yol önerebilirim.
bir sayfaya girildiğinde o sayfaya yönlendiren referer'ı kayıt altına alın.
yani;
okunan - referer - sayac
105 - 100 - 4
107 - 105 - 3
şeklinde 3 stun işinizi görecektir. burada sayac aynı satırları tekrar tekrar eklememek ve ileride çok satırlı bir tablo içinde count yapmamak için kullanılabilir. anlık trafiğinizi bilmiyorum, cache kullanıyor musunuz onu da bilmiyorum. dilerseniz count kullanmayabilir, insert'i bu tabloya yaparken geçici bir tabloda count'lu versiyonlarını zaman zaman güncelleyebilirsiniz. sanıyorum daha sağlıklı olacaktır.
zaman içerisinde elbette çokca satır oluşacak fakat gerçek bir sonuç vermek istiyorsanız bu yönlendirmeleri saymanız gerekir.
zaman zaman yönlendirme az olan satırları silerek tablonuzu rahatlatabilirsiniz. zaman içerisinde elinizde sağlıklı bir istatistik birikecektir.
kişi bir entry okurken ona referans olan ve onun referans verdiği sayfalardan sayacı çok olanları istediğiniz kadar çekip alakalı entry gösterebilirsiniz.
kolaylıklar
Aslında benim düşündüğüm de buydu eksin anlattım sanırım. Satıra bir sayac sütunu koyup haftalık olarak 2'nin altındaki sayaçlı ilişki kayıtlarını rastlantısal görüp tamamen silip, sayacı 5 üzerinde olan kayıtları da muhtemel eşleşme olarak ilişki tablosundan silip kaydın kendi tablosunda alakalılar kolonuna taşımak gibi bir yok izlemeyi düşünüyorum.
Eğer alakalılar kolonu boş değilse sistem hiç bir işlem yapmadan direk bunu basacak. Böylece sunucu yükü giderek hafifleyecek.
Ama ben sizin düşündüğünüz referrer kaydı yerine ilk başta site içi arama kayıtlarını referans almayı planlıyorum. Çünkü ziyaretçilerin tüm hareketlerini loglamak anlık trafiğin yüksek olduğu anlarda büyük yük getirecektir.
bunu okuyan bunu da okudu alanlarında kelimelere takılmamak lazım. yani gerçekten onu okuyan bunu da okumuş değildir çoğu sitede.
@MUTE 'in belirttiği gibi yazılar ya kategorilerine göre, ya etiketlerine göre yada yazarlarına göre gruplanır. mutlaka gruplayabileceğin birşey vardır. tavsiye yazılarda da bu gruplamalardan birini yada hepsini kombinleyerek tavsiye yazılar gösterebilirsin.
birebir okunma sayılarına göre gerçekçi yapacağım dersen işin içinden çıkamazsın. tablolarındaki satır sayısı milyon mertebesine ulaşınca algoritman siteni yavaşlatacaktır.
Gruplayacak sistemin gerçekten semantik bütünlük içerisinde olması çok önemli. Bu yeni ziyaretçilerin yenis ayfalara geçişini sağlayacak önemli bir konu. Mesela enflasyon ile ilgili yazdığınız bir yazıda stabil ekonomik veriler diye bir ibare geçiyor. Ve ziyaretçilerin %80'i bu kelimenin anlamını bilmeyerek bu kelimeyi aratıyor. Burada bu iki kelime arasında bir etiket kategori ya da başka türlü bir gruplama yapamazsınız. En anlamlı gruplama kullanıcı hareketlerinin analizi diye düşünüyorum. Haftalık olarak da 2'den az girilmiş ilişki kayıtlarını da sildirecek bir kod yazarak rastlantısal bağları silip, 5 den fazla girilmiş kayıtları da tesadüf olamaz diye eşleyerek taşırsak ilişki tablomuzu yönetebileceğimiz makul sınırlarda tutabiliriz.