- Arama motorlarında uygulama PageRank
- PageRank’e Giriş
- Pagerank hesaplama
- Sitenin önemini arttırıyoruz
- PageRank ile ilgili bazı yaygın yanlış anlamalar
- Daha fazla çalışma için linkler:
Наша команда-партнер Artmisto
A. Shkondin.
Google’ın arama hizmetleri sağlama pazarındaki başarısı ve özellikle bu arama motorunun Runet’e genişlemesiyle, web yöneticileri arasında PageRank’i hesaplama algoritmalarında ilgi artmaktadır. Bu makale, PageRank hesaplamasının bazı yönlerini tartışmaktadır.
Arama motorlarında uygulama PageRank
Tek heceli sorgular durumunda ilgili sayfaları bulmanın geleneksel yolları tatmin edici sonuçlar vermez, çünkü popüler konularda (örneğin, "deneme", "iş") her zaman aynı alaka düzeyine sahip çok sayıda sayfa olacaktır. Bu sayfaları bir şekilde düzenlemek için, arama motorları çeşitli numaralarda çalışmaya başlar. Örneğin, büyük bir katılımı olan (Rambler) ya da katalogda bulunan sayfaları (Yandex, Aport) yayınlayan ilk kişi. Google, PageRank’i bu amaçlar için kullanıyor ve bu da şaşırtıcı sonuçlar veriyor ve kısa sürede Google, yalnızca veritabanı büyüklüğü açısından değil aynı zamanda arama kalitesi açısından da lider bir konumda olmaya başladı. Arama motorlarımızdan Aport, PageRank'i ilk kullanan ve ardından Yandex'i kullandı. Rambler'de bu teknoloji kullanılmaz, ancak bu aşamada bu olasılık göz önünde bulundurulur ve PageRank'in bu arama motorunda kullanılması mümkündür.
Arama sonuçlarını PageRank'e göre sıralamanın yanı sıra, bu teknoloji için başka bir uygulama daha var. Gerçek şu ki, internetteki sayfa sayısı o kadar büyük ki arama motorları artık her şeyi endeksleyemiyor. PageRank, sayfa değerinin bir ölçütü olarak hizmet ettiğinden, sayfaları PageRank'in azalan düzenine göre dizmek mantıklıdır. Google daha da ileri gitti: şimdi yalnızca bir kayıt formu göndermek yeterli değil - sitenin dizine eklenebilmesi için en az bir harici bağlantınızın olması gerekir.
PageRank’e Giriş
Sayfa Sıralaması, sorgulardan bağımsız olarak sayfaların kalitesini değerlendirmeyi amaçlayan statik bir değerdir, yani. PageRank kullanarak her sayfanın “global değerini” hesaplar. PageRank Sergey Brin ve arama motoru sonuçlarının sıralanmasında teknolojiyi geliştiren Larry Page'in yazarları, daha sonra Google'ın kurucuları oldu.
PageRank'in temeli, yazarın diğer yazarların bibliyografik referanslarındaki referans sayısı ile yayınlanmasının önemini değerlendiren akademik bir yaklaşımdı. İnternet kullanımına uyum sağlamak için algoritmada şu değişiklikler yapıldı: her bir bağlantının ağırlığı ayrı ayrı dikkate alınır ve yönlendirilen sayfadaki bağlantı sayısıyla normalleştirilir. Ayrıca, PageRank rastgele bir yürüyüşle yorumlanabilir.
Pagerank hesaplama
Dünya çapında internette sörf yapan mükemmel bir sörfçü düşünün. Rastgele yürüyüş p durumundayken sörfçünün sayfayı p ziyaret etmesine izin verin. Her adımda, web sörfçüsü ya sözde rasgele bir şekilde seçilen ağdaki başka bir sayfaya atlar ya da aynı sayfayı iki kez ziyaret etmeden ve geri döndürmeden geçerli sayfadaki bağlantıyı izler. Rastgele atlamanın olasılığı d olarak gösterilir , daha sonra bir bağlantının olasılığı 1 - d olur . Böylece, p sayfasında bir kullanıcı bulma olasılığı aşağıdaki formülle hesaplanabilir:
burada R (p) sayfanın Sayfa Sırasıdır, C (p) sayfadaki bağlantı sayısıdır, k p'ye atıfta bulunan sayfa sayısıdır, d sönümleme faktörüdür. Genellikle 0.1 <d <0.15 . PageRank’i bu şekilde ölçeklendirirseniz,
N , PageRank'in hesaplandığı tüm sayfaların sayısıdır, o zaman R (p) tüm sayfalardaki olasılık dağılımı olarak düşünülebilir.
PageRank değerini hesaplamak için, NxN boyutunda bir matris M oluşturulur , burada matrisin her bir mij elemanına R0 (p) = 1 / C (p) değeri atanır, i.nci sayfanın j. . Böylece, PageRank'in hesaplanması, her bir yineleme adımında matris M'nin Rj vektörü ile çarpılmasıyla elde edilen , M matrisinin özvektörünü bulmaya indirgenir. Zayıflama katsayısının tanıtılması, işlemin birleşmesini sağlar.
Sitenin önemini arttırıyoruz
PageRank’in kazanan alayını gerçekleştirmek, biri sayfanız için arttırmayı düşünmenize yardımcı olamaz. Bir bağlantının yerleştirildiği kaynak ne kadar yetkiliyse, başvurduğu sayfanın PageRank değerini o kadar arttırır. Tersine, bir sayfadaki bağlantılar ne kadar çoksa, sayfanızın Sayfa Sırasını arttırmaya olan katkısı o kadar az olacaktır - başka bir deyişle FFA'ya katılmanın (başka bir deyişle, ücretsiz ilaveli bağlantılar içeren siteler). Daha az belirgin olan, birbirine bağlı sayfaların en uygun topolojisidir. Örneğin, bir "halka" da düzenlenmiş sayfalar (her sayfa sol ve sağdaki bir komşuya atıfta bulunduğunda, sonuncusu ilk ve sonuncuya atıfta bulunur), halkadaki sayfaların sayısından bağımsız olarak aynı Sayfa Sıralamasına sahip olacaktır ( , hepsinin PageRank'i 1'e eşit olacaktır). Aynı şey “yıldızlar” için veya herkesin herkese gönderme yaptığı durum için geçerlidir ve bu ifade tüm simetrik topolojiler için de geçerlidir. Asimetrik topolojiler, PageRank'in artması açısından çok daha umut vericidir. Ücretsiz ev sahiplerinden “boş” (ancak birbiriyle bağlantılı) web siteleri oluşturmanın yararsızlığı hakkında yapılan açıklama çok açık değildir. Örneğin, 5 sitedeki bağlantıları, bir tanesinin sıfır olmayan PageRank’ten en az 15 kat daha fazla PageRank’e sahip olmasını sağlayacak şekilde değiştirebilirsiniz. Küçük bir program yazarak görmek kolaydır. Makalede bunun nasıl yapıldığını okuyun. PageRank’in Verimli Hesabı
PageRank ile ilgili bazı yaygın yanlış anlamalar
Arama motorlarında konumlandırmaya adanmış Runet forumlarındaki mesajları analiz ettikten sonra, en azından tartışmalı ve genellikle yanlış olan bir dizi PageRank iddiası öne sürülebilir. Bu ifadeleri kısaca düşünün:
- FFA, ziyaretçi defterleri veya diğer web sitelerinin bulunduğu bir web sitesine çok fazla bağlantı varsa, PageRank anlaşılmayacaktır.
"Atıf indeksi" ve PageRank kavramlarını karıştırmayın. Sayfa Sırası hesaplanırken, sitenin içeriğinin veya bağlantının metninin analizi yapılmaz, yalnızca toplam bağlantı sayısı ve ağırlıkları dikkate alınır, bu nedenle "yanlış" sayfalardan bağlantı varsa ceza uygulanmaz.
- Herhangi bir sayfa için yüksek PageRank elde ederseniz, bu sayfa arama sonuçlarında ilk sırada yer alır.
Doğru değil, PageRank'in sayfa sıralaması için ana kriter değil, yardımcı bir kriter olması nedeniyle. Aksi halde, ilk sayfalarda, birçok istek için, yalnızca derecelendirmeler ve üstler yerleştirilecektir. Yalnızca ceteris paribus, PageRank değeri yüksek bir sayfa arama sonuçlarında daha yüksek olacaktır.
- Siteyi tüm popüler dizinlere kaydederseniz, PageRank çok yüksek olacaktır
Gurur duymayın - Sayfa Sırası tüm site için değil, tek bir sayfa için hesaplanır. Bu nedenle, Yahoo’da olduğu gibi derin bir alt dizinden bir bağlantı Vasya Pupkin sayfasından daha az değerli olabilir. Yani, burada linklerin kalitesini değil, sayılarını alabilir. Yalnızca katalogdan gelen bağlantıların doğrudan sitenize gitmesine ve bir cgi-betiği üzerinden gitmemesine dikkat etmek gerekir, aksi takdirde bunlar dikkate alınmayacaktır. Ayrıca, pek çok dizinin kuralları, PageRank’i artıracağınız belgeyi değil, kök sayfanın yerleştirilmesini gerektirir. Bu nedenle, kendi sitenizin kök sayfasına bakarak belirli bir sayfanın PageRank değerini arttırmanız çok daha etkilidir.
- Dış bağlantılar yerleştirirken PageRank azaltıldı
Yukarıda da değinildiği gibi çok tartışmalı bir ifade, yönlendiren sayfaların simetrik bir kombinasyonu durumunda, dış bağlantı eklendiğinde olasılığı göz ardı edilen, PageRank azalır. Eğer kendi içinde bir fobinin üstesinden gelmezse, link değişimi için özel bir sayfa başlatmanızı tavsiye ederiz. Bu arada, PageRank'i hesaplarken hiç kimsenin dış ve iç referansları ayırmaya söz vermediğine dikkat etmek gerekir.
Daha fazla çalışma için linkler:
- PageRank Atıf Sıralaması: Web’e Sipariş Vermek
- Büyük Ölçekli Hipermetin Web Arama Motorunun Anatomisi
- Genişlik birinci arama tarama, yüksek kaliteli sayfalar sağlar
- PageRank’in Verimli Hesabı
Telif Hakkı © 2001, A. Shkondin tarafından
Yayın yazarın iznini gerektirir.