- განაცხადის PageRank საძიებო სისტემებში
- შესავალი PageRank
- გაანგარიშება პედაგოგი
- ჩვენ გაზრდის საიტის მნიშვნელობას
- PageRank- სთან დაკავშირებული ზოგადი მიდგომა
- შემდგომი შესწავლის ბმულები:
Наша команда-партнер Artmisto
ა. შკონდინი.
Google- ის წარმატების შედეგად საძიებო მომსახურების გაწევის მიზნით, განსაკუთრებით კი ამ საძიებო სისტემის გაფართოებას Runet- ში, ვებ-მასტერებს შორის არის PageRank- ის გაანგარიშების ალგორითმების ინტერესი. ეს სტატია განიხილავს PageRank- ის რამდენიმე ასპექტს.
განაცხადის PageRank საძიებო სისტემებში
Monosyllabic queries შემთხვევაში შესაბამისი გვერდების მოძიების ტრადიციული გზები დამაკმაყოფილებელ შედეგებს არ იძლევა პოპულარული თემების შესახებ (მაგალითად, "ესეები", "მუშაობა") ყოველთვის იქნება დიდი რაოდენობით გვერდები იგივე შესაბამისობით. იმისათვის, რომ როგორმე ორგანიზება ამ გვერდებზე, საძიებო სისტემები იწყება სხვადასხვა ხრიკებზე. მაგალითად, პირველად გამოსცემს იმ გვერდებს, რომლებსაც დიდი დასწრება აქვთ (Rambler) ან რომლებიც იმყოფებიან კატალოგში (Yandex, Aport). Google ამ მიზნებისათვის PageRank- ის იყენებს, რაც საოცარ შედეგებს აძლევს და მოკლე დროში Google- მა წამყვან პოზიციას იკავებს არა მარტო მონაცემთა ბაზის ზომაზე, არამედ ძიების ხარისხიც. ჩვენი საძიებო სისტემებით, Aport იყო პირველი გამოყენება PageRank, რასაც მოჰყვა Yandex. Rambler- ში ეს ტექნოლოგია არ გამოიყენება, მაგრამ ამ ეტაპზე ეს შესაძლებლობა განიხილება, და შესაძლებელია, რომ ამ საძიებო სისტემაში PageRank გამოყენებული იქნება.
PageRank- ის ძიების შედეგებთან ერთად, ამ ტექნოლოგიის კიდევ ერთი პროგრამა არსებობს. ფაქტია, რომ ინტერნეტის გვერდების რაოდენობა იმდენად დიდია, რომ საძიებო სისტემებს ვეღარ შეძლებენ ინდექსზე ყველაფერი. და მას შემდეგ, რაც PageRank ემსახურება როგორც ფასეულობის კრიტერიუმს, ლოგიკურია PageRank- ის დაკვეთის მიხედვით. Google კიდევ უფრო შორს წავიდა: ახლა უბრალოდ რეგისტრაციის ფორმა არ არის საკმარისი - იმისათვის, რომ საიტი იყოს ინდექსირებული, უნდა ჰქონდეს მინიმუმ ერთი გარე ბმული.
შესავალი PageRank
PageRank არის სტატიკური ღირებულება განკუთვნილია შეფასების ხარისხის გვერდებზე, მიუხედავად ნებისმიერი შეკითხვებისა, ანუ გამოყენებით PageRank ითვლის "გლობალური ღირებულება" თითოეული გვერდი. PageRank- ის სერგეი ბრინსა და Larry Page- ის ავტორები, რომლებიც ეძებდნენ საძიებო სისტემის შედეგების დამატებითი რანგის ტექნოლოგიას, მოგვიანებით Google- ის დამფუძნებლებმა გახდნენ.
PageRank- ის საფუძველი იყო აკადემიური მიდგომა ავტორის გამოქვეყნების მნიშვნელობის შესაფასებლად მისი ავტორის სხვა ავტორების ბიბლიოგრაფიულ ცნობებში. ინტერნეტის გამოყენების ადაპტირებისთვის, ალგორითმის შემდეგ ცვლილებები განხორციელდა: თითოეული ბმის წონა ინდივიდუალურად არის გათვალისწინებული და ნორმალიზებულია გვერდების რაოდენობის მიხედვით. გარდა ამისა, PageRank შეიძლება ინტერპრეტირებული თვალსაზრისით შემთხვევითი ფეხით.
გაანგარიშება პედაგოგი
წარმოიდგინეთ სრულყოფილი ვებ სერფინგი surfing მსოფლიო ქსელში. მოდით surfer ეწვევა გვერდზე p , ხოლო შემთხვევითი ფეხით არის სახელმწიფო p . ყოველ ნაბიჯზე, ვებ სერფირი ან სხვა გვერდზე გადადის ქსელში, რომელიც ფსევდო-შემთხვევით მოქმედებაშია შერჩეული, ან იგი ახდენს ბმულს მიმდინარე გვერდზე, არ დაბრუნებულა და არც ერთ გვერდს არ ეწინააღმდეგება ორჯერ. შემთხვევითი ნახვის ალბათობა აღნიშნულია, როგორც დ, მაშინ ბმული ალბათობა იქნება 1 - დ . ამგვარად, გვერდი p- ზე მომხმარებლის პოვნის ალბათობა შეიძლება გამოითვალოს შემდეგი ფორმულით:
სადაც R (p) გვერდია PageRank გვერდი, C (p) არის გვერდების ბმულების რაოდენობა, k არის გვერდების რაოდენობა, რომლებიც გულისხმობს p , d არის ბიძგების ფაქტორი. როგორც წესი, 0.1 <d <0.15 . იმ შემთხვევაში, თუ თქვენ მასშტაბის მომხრეა ისე, რომ
სადაც N არის გვერდების რაოდენობა, რისთვისაც PageRank გამოითვლება, მაშინ R (p) შეიძლება ჩაითვალოს ყველა გვერდისთვის ალბათობის განაწილებად.
PageRank- ის გამოთვლა, მატრიცა M იქმნება ზომის NxN- ით , სადაც მატრიცის თითოეული ელემენტის mij ენიჭება R0 (p) = 1 / c (p) მნიშვნელობას იმ შემთხვევაში, თუ i- გვერდი შეიცავს ბმულს ბმულს, მატრიქსის ყველა დანარჩენი ელემენტები ივსება zeros . ამრიგად, PageRank- ის გაანგარიშება მცირდება მატრიცის M- ს ეიჯგენოგრაფის დასადგენად , რომელიც მიიღწევა მატრიქსის M გამრავლებით ვექტორი Rj- ს მეშვეობით თითოეულ სარეციფერს. ადეკვატურობის კოეფიციენტის დანერგვა უზრუნველყოფს პროცესს.
ჩვენ გაზრდის საიტის მნიშვნელობას
PageRank- ის გამარჯვების პროცესის გააზრება, თქვენს გვერდზე არ იფიქრებს იმაზე, რომ ის გაზრდის თქვენს გვერდს. ინტუიციურად ნათელია, რომ უფრო ავტორიტეტული რესურსი, რომელსაც აქვს ბმული განთავსებული, მით უფრო გაზრდის გვერდის PageRank გვერდს, რომელიც ეხება. პირიქით, გვერდებზე მეტი ბმულები, ნაკლებად იქნება თქვენი გვერდიანი PageRank- ის გაზრდა - კიდევ ერთი დასტურია FFA- ში მონაწილეობის უტყუარობა (უფასო ყველა გვერდით, რომელიც შეიცავს უფასო დანართების ბმულებს). ნაკლებად აშკარაა ურთიერთდაკავშირებული გვერდების ოპტიმალური ტოპოლოგია. მაგალითად, "ბეჭვდილში" ორგანიზებული გვერდები (როდესაც თითოეული გვერდი ეხება მეზობელს მარცხნივ და მარჯვნივ, უკანასკნელი ეხება პირველ და პირველს ბოლო) ექნებათ იგივე PageRank, მიუხედავად იმისა, რომ გვერდების რაოდენობა ბეჭვდის , PageRank ყველა იქნება 1). იგივე შეიძლება ითქვას "ვარსკვლავებზე" ან იმ შემთხვევაში, როდესაც ყველას ეხება ყველას, და ეს განცხადება, ალბათ, ყველა სიმეტრიული ტოპოლოგიისთვისაა გასაკეთებელი. ასიმეტრიული ტოპოლოგიები ბევრად უფრო პერსპექტიულია PageRank- ის გაზრდის თვალსაზრისით. განცხადება "უსასრულო" შექმნის უსარგებლოობის შესახებ (მაგრამ ერთმანეთთან აკავშირებს) უფასო მასპინძლების საიტებზე არ არის აშკარა. მაგალითად, თქვენ შეგიძლიათ გაცვალოთ ბმულები 5 საიტებზე ისე, რომ ერთ-ერთ მათგანს აქვს PageRank 15 ჯერ მეტი მინიმალური არასამთავრობო ნულოვანი PageRank. ეს არის მარტივი ვხედავ წერილობით პატარა პროგრამა. წაიკითხე როგორ გავაკეთოთ ეს სტატია. PageRank- ის ეფექტური შედგენა
PageRank- სთან დაკავშირებული ზოგადი მიდგომა
საძიებო სისტემებში პოზიციონირებისთვის Runet- ის ფორუმების ანალიზის შემდეგ, შეიძლება გამოყოთ რამდენიმე გვერდიანი ბანკირის, ყოველგვარი შეურაცხმყოფელი და ხშირად არასწორი. მოკლედ განვიხილოთ ეს განცხადებები:
- თუ FFA- სთან, ვებ-გვერდთან ან სხვა ვებსაიტებთან ბევრი ბმული არსებობს, მაშინ PageRank- ის გაგება შეიძლება.
არ გაურკვეველია კონცეფცია "ციტირების ინდექსი" და PageRank. PageRank- ის გაანგარიშებისას, საიტის შინაარსის ან ბმის ტექსტის ანალიზი არ არის შესრულებული, მხოლოდ კავშირების საერთო რაოდენობა და მათი წონა მხედველობაშია მიღებული, ამიტომ ჯარიმები არ გამოიყენება, თუ არსებობს "არასწორი" გვერდების ბმულები.
- თუ რომელიმე გვერდის მაღალი PageRank- ის მიღწევისთანავე, ეს გვერდი პირველ ადგილზე იქნება ძიების შედეგებში.
სიმართლე არ არის, იმის გამო, რომ PageRank არ არის მთავარი კრიტერიუმი რანგის გვერდებზე, არამედ დამხმარე. წინააღმდეგ შემთხვევაში, პირველ გვერდებზე, ბევრ მოთხოვნას, მხოლოდ რეიტინგები და საუკეთესოები განთავსდება. მხოლოდ ფსკერის გვერდი, რომელიც უფრო მაღალია PageRank- ის გვერდზე, უფრო მაღალი იქნება ძიების შედეგებში.
- თუ დარეგისტრირდით საიტზე ყველა პოპულარულ კატალოგში, მაშინ PageRank ძალიან მაღალი იქნება
არ დაიმახსოვროთ - PageRank გამოითვლება არა მთელი საიტისთვის, არამედ ერთი გვერდისთვის. აქედან გამომდინარე, ღრმა ქვედანაყოფის ბმული, თქვა Yahoo- ს, შეიძლება იყოს ნაკლებად ღირებული, ვიდრე ვაზიას Pupkin- ის გვერდი. ასე რომ, აქ შეგიძლიათ მიიღოთ არა ბმულების ხარისხი, არამედ მათი რიცხვი. საჭიროა მხოლოდ ყურადღება მიაქციოთ იმ ფაქტს, რომ კატალოგის ბმულები პირდაპირ თქვენს საიტზე მიდიან და არა CGi- სკრიფტით, წინააღმდეგ შემთხვევაში ისინი უბრალოდ არ იქნება გათვალისწინებული. გარდა ამისა, წესების ბევრი დირექტორიების მოითხოვს განთავსებას root გვერდზე, და არა დოკუმენტი, რომლის PageRank თქვენ აპირებთ გაზრდის. აქედან გამომდინარე, გაცილებით უფრო ეფექტურია კონკრეტული გვერდის PageRank- ის გაზრდა საკუთარი საიტის ძიების გვერდის მითითებით.
- PageRank მცირდება გარე კავშირების განთავსებისას
ძალიან საკამათო განცხადება, როგორც ზემოთ აღინიშნა, PageRank ამცირებს გულისხმობდა გვერდების სიმეტრიული კომბინაციის შემთხვევაში, რომელთა ალბათობაა მიღებული გარე ბმული, რომელიც უმნიშვნელოა. თუ ასეთი ფობია თავისთავად არ გადალახავს, მაშინ შეგვიძლია რჩევა მივცეთ სპეციალურ გვერდს ბმულების გაცვლისთვის. სხვათა შორის, აღსანიშნავია, რომ PageRank- ის გაანგარიშებისას, არავინ დაპირდა, რომ გარე და შიდა გამონათქვამები გამოეყო.
შემდგომი შესწავლის ბმულები:
- PageRank Citation რანჟირება: შემოტანა ორდერში ვებ
- ანატომია დიდი ზომის ჰიპერტექსტუალურ ვებ საძიებო სისტემაში
- Breadth- პირველი ძებნა მცოცავი იძლევა მაღალი ხარისხის გვერდებზე
- PageRank- ის ეფექტური შედგენა
Copyright © 2001 A. Shkondin
გამოცემა მოითხოვს ავტორის ნებართვას.