Semantic Konuşmaları - Sayfa 9

İlk
4
5
6
7
8
9
10
11
12
13
14

18-02-2013, 04:03:24

#73

abirisebil

kbasali adlı üyeden alıntı: mesajı görüntüle

Somut bir örnek ile ilgili bir soru - istek yapıyım ozaman ben

sektör oyun (flash ve arceda oyun) olduğunda şöyle bir link yapısı kurmak ne derece doğru olur ve eksikleri nelerdir

Oyun,
Bildiğimiz .swf oyun
Oyun açıklaması,
keyword kullanımı, benzer kelimelerin kullanılması, internal ve external link kullanımı
Oyunu yazan kişi veya kuruluş,
tom john( internal link ve bu kişi ile ilgili kısa bilgi ve bu kişinin diğer oyunlar var ise site içinde bunlara link)
Oyun kahramanları,
Tom ve jerry ( tom ve jerry hakkında detaylı bilgi, yine internal external link kullanımı, ve site'de eğer mevcut ise diğer oyunlara link verme)
Oyun yayın hakkı sahibi,
Oyunun yayın hakkı veya telif hakkı kimde ise, oyun arkaplandaki müziği yapan kişi ile ilgili bilgi mevcut ise bu kişilere hakkında yine internal link ile anlatmak
Oyunun kategorisi,
Bu zaten çok klasik ama yinede olmazsa olmaz bir durum.

schema.org verilerine göre yukarıdaki verilerin başlıkların arama motorlarına anlatılması

Bu tarz bir çalışmanın en büyük avantajlarından birisi sadece oyun ve açıklama olarak siteyi güncel tutmak değil onlarca farklı kişi, oyun kahramanı hakkında bilgi vermek ve en önemsili bana göre alt sayfaları sürekli güncellemesi. son olarakda sadece oyun ve açıklama ile kalmayıp çok geniş bir yelpaze'de bilgi veren bir site haline geliyor.

Tabi bu sadece oyun oynama sayfası ile ilgili yapılması gereken bir kısım, bunun dışında yerine getirilmesi gereken daha farklı unsurlar elbette var.
domain otoritesini güçlendirme adına.

bu teori denklem doğru ise bu konudan birşey anladığımı varsayıp kolumun altına 2 tane karpuz koyup bizim köy kahvesine gidip orda basıcam havayı

bu teori doğru ise geriye bir tek eksik kalıyor @abirisebil o konuda yardım etmeniz mümkündür acep ?

teori yanlış ise daha kötü çünkü soracağım soruların sayısı 10 ve üzeri

abirisebil alıntı yaptım ama herkes teori hakkında eleştiri yapabilir.

Öncelikle herşey verinin arama motorlarına anlatılması değildir. Bu sadece bir kolaylıktır. http://schema.org/CreativeWork adresinde

Alıntı

The most generic kind of creative work, including books, movies, photographs, software programs, etc.

açıklmasına dikkat edin. Bu sayede sayfanızın ne ile ilgili olduğunu arama motoruna anlatıyoruz.

Google'ın önem verdiği şey bilgidir => Konu hakkındaki semantic ağaç sistemi (tree). Örneğinizden yola çıkarsak, oyun hakkında ne tür bilgiler verebiliriz?

- Oyunun yapımcısı,
- Oyunun açıklaması (Content quality, semantic Article)
- LSI kategori ve sayfalara link.
- Oyunun resmi, thumbnailUrl'si
- Oyun hakkında açıklama,
- Oyunun nasıl oynanacağını anlatan içerik (mümkünse media - video kullanılırsa video için MediaObject şeması kullanılmalı.)
- Oyun yorumları,
- varsa aldığı ödüller,
- oyun telif hakları sahibi hakkında bilgilendirme,
- yayınlanma tarihi
- update edilme tarihi
- varsa yeni ve eski sürümler hakkında bilgi,
- yakın anlam ve LSI ilişkisindeki etiketler,
- oyunu siteye ekleyen yazar, kişi, editör,
- oyun versiyonu,
- Oyun için editör değerlendirmesi.
- Oyun için ziyaretçi değerlendirmesi
- ve benzer sayfalar.

İnceleme bölümüne giren standartlara http://schema.org/Review adresinden ulaşabilirsiniz.

Şimdilik swf object için sadece video standartları var. Oyun standartları henüz geliştirilmedi. oyun standartları için 1,5 yıl önce öneri verildi. Ancak browser tabanlı oyun yerine software oyun olarak tanımlaması yapıldığı gerekçesiyle yeni bir standart atanmadı. Sanırım Adobe Flash'a torpil geçilir düşüncesi var ortada. Çünkü Flash nerdeyse bu konuda rakipsiz.

Var olan standartları kullanın. Ama dediğim gibi önemli olan standartlar değil, içerik kalitesi ve LSI desteği. Hiçbir standart kullanmayan siteler hala ilk sıralarda. Kazandıkları tek nokta Content Quality.

Şema standartları sadece arama motoruna kendinizi daha iyi ifade etmenizi sağlar.
18-02-2013, 04:25:35

#74

kbasali

Kimlik doğrulama veya yönetimden onay bekliyor.

drupal adlı üyeden alıntı: mesajı görüntüle

Var mı bilemiyorum.Yapmak ciddi anlamda zor ve zaman ister.

Burda schema.org uyumlu derken her tarafı sular seller gibi akan bir site demek istemedim.Sadece etkinlik,yemek tarifleri,yazarlar ,videolar,resimler,haber makaleleri,v.b. konular schema.org uyumlu yapılabilir.

Microdata gelişmelerinin bir kısmına IBM çalışanları destek sunuyor.Onların bazı yazılımları kullanılabilir.

Diğer yandan drupal dışındaki sistemlerde nasıl bir kullanım alanı vardır hiç bilmiyorum.

Ozaman şöyle sorayım

websitesinde bazen kimi kelimelerin üstüne geldimizde yukarıdaki resimdeki gibi açılan minik bilgilendirme kutuların tam olarak adı nedir?

Ayrıca bende scheme.org göre işaretlemiş verileri kast etmiştim.

--R10.NET; Flood Engellendi -->-> Yeni yazılan mesaj 04:25:35 -->-> Daha önceki mesaj 04:05:52 --

abirisebil adlı üyeden alıntı: mesajı görüntüle

Öncelikle herşey verinin arama motorlarına anlatılması değildir. Bu sadece bir kolaylıktır. http://schema.org/CreativeWork adresinde açıklmasına dikkat edin. Bu sayede sayfanızın ne ile ilgili olduğunu arama motoruna anlatıyoruz.

Google'ın önem verdiği şey bilgidir => Konu hakkındaki semantic ağaç sistemi (tree). Örneğinizden yola çıkarsak, oyun hakkında ne tür bilgiler verebiliriz?

- Oyunun yapımcısı,
- Oyunun açıklaması (Content quality, semantic Article)
- LSI kategori ve sayfalara link.
- Oyunun resmi, thumbnailUrl'si
- Oyun hakkında açıklama,
- Oyunun nasıl oynanacağını anlatan içerik (mümkünse media - video kullanılırsa video için MediaObject şeması kullanılmalı.)
- Oyun yorumları,
- varsa aldığı ödüller,
- oyun telif hakları sahibi hakkında bilgilendirme,
- yayınlanma tarihi
- update edilme tarihi
- varsa yeni ve eski sürümler hakkında bilgi,
- yakın anlam ve LSI ilişkisindeki etiketler,
- oyunu siteye ekleyen yazar, kişi, editör,
- oyun versiyonu,
- Oyun için editör değerlendirmesi.
- Oyun için ziyaretçi değerlendirmesi
- ve benzer sayfalar.

İnceleme bölümüne giren standartlara http://schema.org/Review adresinden ulaşabilirsiniz.

Şimdilik swf object için sadece video standartları var. Oyun standartları henüz geliştirilmedi. oyun standartları için 1,5 yıl önce öneri verildi. Ancak browser tabanlı oyun yerine software oyun olarak tanımlaması yapıldığı gerekçesiyle yeni bir standart atanmadı. Sanırım Adobe Flash'a torpil geçilir düşüncesi var ortada. Çünkü Flash nerdeyse bu konuda rakipsiz.

Var olan standartları kullanın. Ama dediğim gibi önemli olan standartlar değil, içerik kalitesi ve LSI desteği. Hiçbir standart kullanmayan siteler hala ilk sıralarda. Kazandıkları tek nokta Content Quality.

Şema standartları sadece arama motoruna kendinizi daha iyi ifade etmenizi sağlar.

Benim örneklediğim ve sizin iyice detaylandırdığınız şekilde deki bir websitesi bu veri sağladığı sürece LSI ve bilgi verme konusunda biçilmez bir katfan olmuyormu? Zaten bildiğim kadarı ile bukadar detaylı bir yapıya sahip site sayısı çok azdır türkiye'de. Yoks

Otorite olan veya arama sonuçlarında ilk 5 içinde olan sitelerin kimilerinde nerdeyse oyun ile ilgili içerik bile yok,
Örnek kraloyun ama benim sormak istediğim bu değil şimdilik.

Ayrıca merakımı maruz görün daha evvelki verdiğiniz 100k hacimli aranma sonuçları örnek ile yukarıdaki yazdıklarınız arasında ne gibi bir fark ki?

Fazla merakda iyi değil derler genelde ama hazır üstadları bulmuşken soramaya devam edeyim ben
Yukarıdaki örnek ile sizin daha evvel verdiğiniz 100k site arasındaki eksik kalan farklar nelerdir?

Edit:
sabah 5 gibi soru sorunca sanırım ondan kaynaklı soruların herbiri infaz memuru soruna benzemiş kusura bakmayın. düzelttim
18-02-2013, 05:11:05

#75

abirisebil

kbasali adlı üyeden alıntı: mesajı görüntüle

Ozaman şöyle sorayım

Benim örneklediğim ve sizin iyice detaylandırdığınız şekilde deki bir websitesi bu veri sağladığı sürece LSI ve bilgi verme konusunda biçilmez bir katfan olmuyormu ?

Otorite olan veya arama sonuçlarında ilk 5 içinde olan sitelerin kimilerinde nerdeyse oyun ile ilgili içerik bile yok,örnek kraloyun ama benim sormak istediğim bu değil zaten amaçımda bu değil şimdilik

Sayfalarında gördüğünüz her bir kelime, media objectleri ve linkler içeriktir.

LSI konusunda kraloyun örnek alınacak sitelerden bir tanesidir. LSI kategori sistemini kurmuş, ağaç sistemi çok gelişmiş, her bir kategoride yakın içerikli oyunlar barındırmaktadır. Keza bir üstünde oyunskor'un semantik sistemi daha güçlüdür.

En üstte yer alan, oyungemizi ise henüz bu sistemleri kullanmadığı halde zirvededir. Bunun nedeni içerik kalitesinin yeterli oluşu, Semantic içeriğin bir alt konusu olan, multi-language desteği ve off-page faktörlerdir.

Oyun sitelerinin içerik olarak birbirine fark atmaları çok zordur. Hemen hemen kaliteli her oyun sitesi gerekli sistemi kurmuştur. Fark oluşturacak etkenler ancak ilk yapılan ise olur. Yani bu sitelerin yaptıklarını yapıp, yapmadığı eksik yerleri tamamlamanız gerekir. Ancak bu otomatikleştirilmiş sistem ile mümkün değildir. En baştan beri üzerine basa basa vurguladığım iş gücü yükü burada devreye giriyor.

Sadece en yüksek skora sahip semantic içerik oluşturmak da yetmez, halen %30'un üzerinde pay sahibi olan off-page faktörleri çok iyi işlemek gerekir.

Oyunskor 2.500.000 üzerinde link kaybına uğramasına rağmen, sadece 1 sıra geriledi. Bunun nedeni diğer adı geçen iki siteye semantik üstünlüğünden dolayıdır. oyungemisi ve kraloyun'a uygulanan off-page faktörlerin yarısı bu siteye uygulansa, zirveden inmesi çok zor olur.

Hemen bakalım oyun kelimesiyle LSI bağı olan futbol oyunları kelimesi :

futbol oyunları aramasında bahsi geçen 3 siteden, en üstte olanı oyunskor'dur. Sadece 25 external link ile yerini korumaktadır. Hemen altında bulunan site 2590 linkle beslenmesine rağmen oyunskor'u geçememektedir. Geçebilmesi için ihtiyacı olan şey,

- ya binlerce link ki filtreye girme ihtimalini yükseltir.
- ya da semantik içerik güçlendirilmesi olmalıdır.

Daha fazla analiz sunarsam, bir çok web sitesinin isminin geçeceğinden dolayı, burada noktalıyorum.

Adı geçen sitelerle ilgili analizlerden rahatsız olan web site sahipleri özel mesaj gönderirlerse konudan silerim.

kbasali adlı üyeden alıntı: mesajı görüntüle

Daha evvelki verdiğiniz 100k hacimli aranma sonuçları örnek ile yukarıdaki yazdıklarınız arasında ne gibi bir fark?

Aradaki fark iş yükü + off-page faktörlerdir. Aynı uygulamalar, iş gücü karşılanıp, gerekli off-page faktörler uygulandıktan sonra oyun kelimesinde de zirveye oynamak pekala mümkündür.

kbasali adlı üyeden alıntı: mesajı görüntüle

LSI olarak daha nelerden bu siteye destek verebiliriz ? yukarıdaki örnek'de eksik kalan nedir tam olarak?

off-page faktörler ilgili yapılması gerekenleri hemen hemen her SEO zaten biliyor. On-page faktörler ki (SERPs sıralamasını %70 etkiler), çok ciddi emek + zaman + bütçe ister. Teorik olarak 1 kişinin bunları yapması çok zordur, otomatikleştirilmiş sistemler gerekli gereksinimleri karşılayamayabilir.
18-02-2013, 12:55:46

#76

osmanbey

@abirisebil, bu konuda böyle araştırmış yapan birini bulmuşken devam edelim.

öncelikle "reçel" kelimesiyle ilgili bulduklarınız

- yemek tarifi
- ekmek yapımı
- salça yapılışı
- dordurma yapımı
- şeker hamuru
- pekmez yapımı
- şarap malzemeleri

kendi tahminleriniz mi yoksa yazılımınızın sonuçları mı? şunun için soruyorum, bizim böyle bir yazılımla çalışma imkanımız yok. eğer bu bir yazılım sonucuysa bir kanaat hasıl olacak.

alkadraz'ın lsi ile söyledikleri arasında ilk 10 veya 5 neyse siteyi kelime dağılımları itibariyle incelemek ve içeriklerin onlara benzer bir şekilde üretilmesi vardı. Yanlışım varsa düzeltsin.

Bize yazılımınızın sonuçlarından oluşacak şekilde sizin belirlediğiniz 3-4 kelimede hangi lsi sonuçlarını verdiğini belirtebilir misiniz? o kelimelerde ilk 5 sıradaki siteleri analiz edelim ve bu bilgilerle karşılaştıralım. Sizin sonuçlarınıza daha çok odaklanmış olanların durumlarını analiz edelim ve böylece yazılımımız olmasına rağmen örnekler üzerinden, bir kelimede nereye kadar açılabileceğimizi tesbit edelim.

bu konuda yardımcı olursanız çok memnun olacağız r10 ailesi olarak.
18-02-2013, 13:04:10

#77

TuzsuzT

Aslında buna benzer tahminleri kafadan yapmak da mümkün olabilir. Yukarıdaki listede dikkat ettim ortak noktaları şeker Biraz kafa yormak ve mantık yürütmek yoluyla belki tam olmasa da benzer sonuçlar almak mümkün olabilir. Şöyle bir açılım yapmak ne derece doğru olur bilemiyorum. Ama görüşlerinizi bekliyorum.

Örneğin bizim ana kelimemiz abiye modelleri olsun. Abiye elbise arayan bir bayanın buna benzer başka ne tür ihtiyaçları olabilir, nelere göz atmak isteyebilir?

- Abiye elbiseye uygun bir çanta
- Uygun bir ayakkabı
- Uygun takılar ve aksesuarlar

Bu şekilde şöyle kelimeler üretilebilir:

- abiye ayakkabı
- abiye çanta
- broş
- şapka

Gördüğümüz gibi broş ile abiye arasında normalde sıkı bir ilişki yok ama biraz mantık yürütmeyle bir bağlantı kurmak mümkün hale gelebiliyor.
18-02-2013, 14:47:20

#78

zagor75

Kimlik doğrulama veya yönetimden onay bekliyor.

abirisebil adlı üyeden alıntı: mesajı görüntüle

İnternet üzerindeki araçlar maalesef bu iş için yeterli değil. LSI programları genelde, yakın anlam ilişkisindeki kelime öbeklerini LSI gibi sunuyor. Reçel örneğinde, herkes marmelat kelimesini, reçel için LSI zannediyor. Ancak bu kelimeler arasındaki ilişki LSI değil, yakın anlam ilişkisidir.

Google için, yakın anlam ilişkisi ile, LSI farklı verilerdir.

Bu nedenle kendi çabamla buluyorum. Ancak verileri yine Google'dan alıyorum. Yakın ilişkili kelimeleri ve sıralamada çıkan sonuçlarını kendi oluşturduğum database'e kaydediyorum. Daha sonra, geniş öbekli sorguları ufak bir programcıkla tetikliyorum. Yaklaşık arama sonuçları tetiklendikten sonra, Semantic Static sonuçlarına göre derliyorum. Bu yöntem şuana kadar bulduğum en iyi yöntem. Yanılma payının ne olduğunu henüz ölçemedim. Çünkü bunu ölçebilecek bir veriyi Google bizimle paylaşmıyor.

@abirisebil Usta,

Buraya kadar yazdıklarınızdan çıkardığım sonucun, sorumla ilgili olacak kısmını anladığım kadarı ile özetleyecek olursam; yakın anlam ilişkisi olan kelimelerle, LSI kelimelerinin aynı şey olmadığı sonucuna varıyorum. Yorumunuzda, LSI programlarının, daha çok yakın anlam ilişkisindeki kelime öbeklerini sunduğunu belirtmişsiniz. Bu sonucu "Google için, yakın anlam ilişkisi ile, LSI farklı verilerdir." cümlenizden çıkarıyorum.

LSI kelimeleri çıkarmak için kendi yazdığınız uygulama "öbeklerinden" yararlandığınızı anlatmışsınız. Ben de buna benzer bir uygulama öbeği yazma hevesi içindeyim. Anladığım kadarı ile sizin kullandığınız tam anlamı ile bir kelime işlemcisi uygulaması, ben haddimi bilerek küçük bir başlangıç yapmak istiyorum sadece konuya...

"Yakın ilişkili kelimeleri ve sıralamada çıkan sonuçlarını kendi oluşturduğum database'e kaydediyorum." Database'e aldığınız yakın ilişkili kelimeleri anladım(ancak bu yakın ilişkili kelimeleri curl gibi bir dille otomatik olarak mı çekiyorsunuz? yoksa bu kelimeleri manuel olarak database kendiniz mi ekliyorsunuz?) ancak "sıralamada çıkan sonuçlarını" derken neyi kastettiğinizi anlayamadım, bu kısmı biraz açabilir misiniz? Buraya kadar kelimeleri database e attığımızı düşünüp soruma devam ediyorum. Database de yakın ilişkili ve sıralamada çıkan sonuçlardan(bunların ne olduğunu şu an için anlamamış olsam da...) elde ettiğimiz kelimelerimiz mevcut.

"Daha sonra, geniş öbekli sorguları ufak bir programcıkla(burada "geniş öbekli sorguları" derken, aLKaDraZ Ustanın bahsettiği algoritmaların formüllerinden yazdığınız scriptleri mi kastediyorsunuz?) tetikliyorum. Yaklaşık arama sonuçları tetiklendikten sonra, Semantic Static sonuçlarına göre derliyorum." Burada "geniş öbekli sorgular", "bir programcıkla tetikliyorum"(kısmını anlayamadım, LSI kelimeleri bu aşamada mı elde ediyorsunuz? yoksa bir sonraki aşamada mı?), "Semantic Static sonuçlarına göre derliyorum". Sakıncası yoksa, bu kısımla ilgili olarak yaptıklarınızı, ya da bu tarz bir uygulama geliştirmek isteyen arkadaşlara yol göstermek için, yararlı olacak detayları bizlerle paylaşmanız mümkün mü acaba?

Konunun sadece abirisebil Ustanın omuzlarına yıkılmamasını umut ediyorum, gerçi kendisi iyi niyetle, bıkmadan, usanmadan sorularımızı detaylı bir şekilde cevaplıyor ancak, aLKaDraZ, digiklan, NeLph, delphi911... gibi ustaların da konuya, abirisebil ustaya destek olmalarını rica ediyorum. İlginiz ve anlayışınız için şimdiden teşekkürler.
18-02-2013, 15:40:14

#79

abirisebil

osmanbey adlı üyeden alıntı: mesajı görüntüle

öncelikle "reçel" kelimesiyle ilgili bulduklarınız

- yemek tarifi
- ekmek yapımı
- salça yapılışı
- dordurma yapımı
- şeker hamuru
- pekmez yapımı
- şarap malzemeleri

kendi tahminleriniz mi yoksa yazılımınızın sonuçları mı? şunun için soruyorum, bizim böyle bir yazılımla çalışma imkanımız yok. eğer bu bir yazılım sonucuysa bir kanaat hasıl olacak.

Keşke benim tahminlerim olsaydı. Çok iyi bir dil bilgisine sahip olduğumu düşünürdüm. (latife ediyorum) Bunlar yazılımdan çıkan sonuçlar ve sadece 7 LSI kelime öbeğini yazdım. Sonuç çok daha fazla.

osmanbey adlı üyeden alıntı: mesajı görüntüle

alkadraz'ın lsi ile söyledikleri arasında ilk 10 veya 5 neyse siteyi kelime dağılımları itibariyle incelemek ve içeriklerin onlara benzer bir şekilde üretilmesi vardı. Yanlışım varsa düzeltsin.

@Alkadraz hocam, manuel işlemler için en makul olanı söylemiş. Bu konuda hemfikiriz. (detaylı inceleme sevmeyenler için fazla bile) Daha belirgin sonuç için benim düşüncem, alakalı sonuçların ilk 30 sonuca kadar incelenmesi yönündedir.

osmanbey adlı üyeden alıntı: mesajı görüntüle

Bize yazılımınızın sonuçlarından oluşacak şekilde sizin belirlediğiniz 3-4 kelimede hangi lsi sonuçlarını verdiğini belirtebilir misiniz? o kelimelerde ilk 5 sıradaki siteleri analiz edelim ve bu bilgilerle karşılaştıralım. Sizin sonuçlarınıza daha çok odaklanmış olanların durumlarını analiz edelim ve böylece yazılımımız olmasına rağmen örnekler üzerinden, bir kelimede nereye kadar açılabileceğimizi tesbit edelim.

Anahtar kelime öbeğimiz : iphone 5

LSI listesi :
- Turkcell (iphone varyasyonları)
- Ipod (ipod versiyona göre varyasyonları)
- ucuz (iphone varyasyonları)
- mac (macintosh)
- cep telefonları

Anahtar kelime öbeğimiz : narenciye sıkacağı

LSI listesi :
- tost nakinası
- braun ürünleri
- tefal çaycı
- philips 1861
- waffle makinesi

Anahtar kelime öbeğimiz : istanbul gezilecek yerler

LSI listesi :
- istanbul tarihi yerler
- istanbul rehberi
- istanbul haritası
- istanbul otelleri
- istanbul tatil
- istanbul otel
- istanbul hava durumu
- haftasonu istanbul

Anahtar kelime öbeğimiz : En güzel yemek

LSI listesi :
- diyet yemek tarifleri
- yemek tarifleri videolu
- kız oyunları
- makarna tarifleri
- yemek tarifleri
- italyan yemek tarifleri
- ekonomik yemek tarifleri

vs.
Arama sonuçlarında, semantik üstünlüğü bulunan websitelerinin hepsinin ilk sayfada oluşuna dikkat ediniz. Nadiren 2-3. sayfaya düşüyorlar. Gerilere düşme nedenleri : yakın anlam ilişkisindeli kelime öbekleri hakkında kaliteli içerik içermemesi, ya da hiç içeriğe sahip olmamalarıdır.

Örnekleri çoğaltabiliriz. Ancak bu arama sonuçlarının yeterli olduğu kanaatindeyim.

TuzsuzT adlı üyeden alıntı: mesajı görüntüle

Aslında buna benzer tahminleri kafadan yapmak da mümkün olabilir. Yukarıdaki listede dikkat ettim ortak noktaları şeker Biraz kafa yormak ve mantık yürütmek yoluyla belki tam olmasa da benzer sonuçlar almak mümkün olabilir.

Yakın anlam ilişkili kelime öbeklerini çok hızlı bir şekilde tespit edebiliriz. Çünkü bizim aklımıza gelenlerin hepsi, ilk olması gerekenler kümesinde yer alıyor. Ancak LSI için aynı şeyi söylemek çok zor. Benim kanaatim, ben tahmin edebiliyorsam, bir başkası da tahmin edebiliyordur. Bu nedenle araştırmak en iyisi.

zagor75 adlı üyeden alıntı: mesajı görüntüle

Buraya kadar yazdıklarınızdan çıkardığım sonucun, sorumla ilgili olacak kısmını anladığım kadarı ile özetleyecek olursam; yakın anlam ilişkisi olan kelimelerle, LSI kelimelerinin aynı şey olmadığı sonucuna varıyorum. Yorumunuzda, LSI programlarının, daha çok yakın anlam ilişkisindeki kelime öbeklerini sunduğunu belirtmişsiniz. Bu sonucu "Google için, yakın anlam ilişkisi ile, LSI farklı verilerdir." cümlenizden çıkarıyorum.

Kesinlikle evet.

zagor75 adlı üyeden alıntı: mesajı görüntüle

"Yakın ilişkili kelimeleri ve sıralamada çıkan sonuçlarını kendi oluşturduğum database'e kaydediyorum." Database'e aldığınız yakın ilişkili kelimeleri anladım(ancak bu yakın ilişkili kelimeleri curl gibi bir dille otomatik olarak mı çekiyorsunuz? yoksa bu kelimeleri manuel olarak database kendiniz mi ekliyorsunuz?)

Yakın ilişkili kelime verilerini direk Google'dan alıyorum. İpucu Google Toolbar'ı deneyin. Belki bazı kelime öbeklerini size json, xml, atom formatlarında sunabilir Hep google bizden veri topluyor, sıra bizde.

zagor75 adlı üyeden alıntı: mesajı görüntüle

"Daha sonra, geniş öbekli sorguları ufak bir programcıkla tetikliyorum. Yaklaşık arama sonuçları tetiklendikten sonra, Semantic Static sonuçlarına göre derliyorum." Burada "geniş öbekli sorgular", "bir programcıkla tetikliyorum"(kısmını anlayamadım, LSI kelimeleri bu aşamada mı elde ediyorsunuz? yoksa bir sonraki aşamada mı?), "Semantic Static sonuçlarına göre derliyorum". Sakıncası yoksa, bu kısımla ilgili olarak yaptıklarınızı, ya da bu tarz bir uygulama geliştirmek isteyen arkadaşlara yol göstermek için, yararlı olacak detayları bizlerle paylaşmanız mümkün mü acaba?

LSI kelimeleri bu aşamada değil, en sonunda elde ediyorum.

Semantic statistic mantığını anlamak için;
- http://en.wikipedia.org/wiki/Statistical_semantics
- http://en.wikipedia.org/wiki/Latent_semantic_analysis

sayfalarına bakınız. Sizin yapmanız gereken kendinize ait ya da başkalarının yazmış olduğu formüller arasında kaybolmak değil, sıralama sonuçlarında çıkan web sitelerindeki benzerlikleri, benzerlik skoruna göre ortaya çıkarmaktır.

Bunun için sıralamadaki web sitelerini özenli bir şekilde tarayıp, db'ye yüklemeniz gerekiyor. Bazı web siteleri için bu veri miktarı 1-2 TB'a kadar çıkabiliyor. Daha büyük veri isteyen siteleri incelemiyorum. HDD müsaade etmiyor.

Bundan sonrası sizin kabiliyetinize kalmış. Şöyle düşünün : Ben minik bir google'ım. Kullanıcılar benim db'den yakın anlamlı aramalara başladılar (program tetiklemesi) şimdi bu kişilere cevap verme ve istatistiklerini kaydetme zamanı. Sorguları bitince istatiklere bir bakalım, pasta nasıl bölünmüş?

pastadan çıkanları, google search api ile sorgulayalım, bakalım yeni gelen dostlar arasında eski dostlardan kaç tanesi var? büyük google minik google'a ne kadar ipucu verecek?
18-02-2013, 16:24:59

#80

zagor75

abirisebil adlı üyeden alıntı: mesajı görüntüle

sayfalarına bakınız. Sizin yapmanız gereken kendinize ait ya da başkalarının yazmış olduğu formüller arasında kaybolmak değil, sıralama sonuçlarında çıkan web sitelerindeki benzerlikleri, benzerlik skoruna göre ortaya çıkarmaktır.

Kesinlikle çok zekice!!! Ben sorumu edit ederken siz edit edilmiş halini görmeden soruma cevap vermişsiniz. Sanırım kafamda bir şeyler tetiklendi...

Teşekkür ederim.

--R10.NET; Flood Engellendi -->-> Yeni yazılan mesaj 16:24:59 -->-> Daha önceki mesaj 15:47:11 --

abirisebil adlı üyeden alıntı: mesajı görüntüle

Bunun için sıralamadaki web sitelerini özenli bir şekilde tarayıp, db'ye yüklemeniz gerekiyor. için sıralamadaki web sitelerini özenli bir şekilde tarayıp, db'ye yüklemeniz gerekiyor. Bazı web siteleri için bu veri miktarı 1-2 TB'a kadar çıkabiliyor. Daha büyük veri isteyen siteleri incelemiyorum. HDD müsaade etmiyor.

"Bunun için sıralamadaki web sitelerini özenli bir şekilde tarayıp, db'ye yüklemeniz gerekiyor." Cümlenizden anladığım, veritabanımı, bir web sitesindeki sadece yakın anlamlı kelimeleri değil, sitenin tamamını yakın anlamlıları bir veri setine dönüştürebilecek şekilde modellemeli ve verileri bu şekilde ölçümlendirmeliyim? Sanırım başlangıç için böyle bir yol izlemem gerekiyor? Söylemesi kolay ancak yapması oldukça zor görünüyor? Yoksa ben tam anlamadığım için olayı biraz karıştırıyor muyum?
18-02-2013, 16:55:17

#81

abirisebil
zagor75 adlı üyeden alıntı: mesajı görüntüle

"Bunun için sıralamadaki web sitelerini özenli bir şekilde tarayıp, db'ye yüklemeniz gerekiyor." Cümlenizden anladığım, veritabanımı, bir web sitesindeki sadece yakın anlamlı kelimeleri değil, sitenin tamamını yakın anlamlıları bir veri setine dönüştürebilecek şekilde modellemeli ve verileri bu şekilde ölçümlendirmeliyim? Sanırım başlangıç için böyle bir yol izlemem gerekiyor? Söylemesi kolay ancak yapması oldukça zor görünüyor? Yoksa ben tam anlamadığım için olayı biraz karıştırıyor muyum?

Sadece yakın anlam ilişkisindeki sayfaları toplarsanız LSI elde edemezsiniz. Sitenin tamamına ve tüm içeriğine ihtiyacınız var. Google bu sitedeki hangi içeriklere, değer vermiş ise, yakın anlam ilişkili o kelime ile, sorguladığınız içerik arasında LSI bağlantı vardır demektir.

Mesela aşağıdaki SERPs incelemesi :

Tost Makinası için :
1. akakçe
2. hepsiburada
3. teknosa
4. gittigidiyor
5. donanımhaber
6. tefal
7. istoç sepeti
8. webdenal
9. arçelik
Narenciye Sıkacağı için :
1. akakçe
2. istoç sepeti
3. donanım haber
4. teknosa
5. sahibinden
6. narenciye sıkacağı
7. elektroworld
8. philips
9. teknosa
10. arzum
11. gittigidiyor
12. arçelik
13. bosch
14. teknosa
15. esse
16. hepsiburada
Bu iki kelime için benzerlik oranı nedir sizce? Sonuçlar artırıldıkça, benzerlik oranı büyüyecektir.

Son ihtiyacın olan ise Google Kategori ağacı sistemidir :

http://www.dosya.tc/server2/IJoA2K/c....json.txt.html

1426 kategori ağaca dahil edilmiş. Kategoriler arası ilişkiler işine yarayacaktır.

İlk
4
5
6
7
8
9
10
11
12
13
14