Категории

  • Голосование
  • Право голоса
  • Киев
  • Украина
  • Здоровье
  • Популярное
  • Новости
  • Новости

      Artmisto
      Наша команда-партнер Artmisto. С "Buddy.Bet" азартные игроки найдут идеальное место для развлечений и возможность выиграть крупные суммы.

    PageRank: Больш спасылак добрых і важных

    1. Прымяненне PageRank ў пошукавіках
    2. Ўвядзенне ў PageRank
    3. вылічэнне Pagerank
    4. Павышаем значнасць сайта
    5. Некаторыя распаўсюджаныя памылкі звязаныя з PageRank
    6. Спасылкі для далейшага вывучэння:

    Наша команда-партнер Artmisto

    А. Шкондин.

    У сувязі з поспехам Google на рынку прадастаўлення паслуг пошуку і асабліва з экспансіяй дадзенага пошукавіка ў Рунэт, сярод вэбмайстроў назіраецца павышэнне цікавасці да алгарытмах разліку PageRank. У дадзеным артыкуле разглядаюцца некторые аспекты вылічэнні PageRank.

    Прымяненне PageRank ў пошукавіках

    Традыцыйныя спосабы знаходжання рэлевантныя старонак, у выпадку аднаскладовыя запытаў не даюць здавальняючых вынікаў, бо па папулярным тэмах (напрыклад "рэфераты", "праца") заўсёды знойдзецца вялікі лік старонак з аднолькавай рэлевантнасці. Для таго, каб неяк упарадкаваць такія старонкі, пашукавікі пускаюцца на розныя хітрыкі. Напрыклад выдаюць першымі тыя старонкі, якія маюць вялікую наведвальнасць (Rambler) або якія прысутнічаюць у каталогу (Yandex, Aport). У Google для гэтых мэтаў прымяняецца PageRank, што дае цудоўныя вынікі, і за кароткі час Google стаў займаць лідзіруючыя пазіцыі не толькі па аб'ёме базы, але і па якасці пошуку. З нашых пошукавікаў першым PageRank стаў выкарыстоўваць Aport, за ім Yandex. У Rambler гэтая тэхналогія не ўжываецца, але на дадзеным этапе такая магчымасць разглядаецца, і, не выключана, што PageRank будзе выкарыстоўвацца і ў гэтай пошукавай сістэме.

    На шэрагу з парадкаваннем вынікаў пошуку па PageRank, ёсць і іншае прымяненне для гэтай тэхналогіі. Справа ў тым, што колькасць старонак у Інтэрнэце на столькі вяліка, што пошукавікі ўжо не могуць сабе дазволіць індэксаваць усё запар. А паколькі PageRank служыць крытэрыем каштоўнасці старонкі, то лагічна праводзіць індэксацыю старонак у парадку змяншэння PageRank. У Google пайшлі нават далей: цяпер просты адпраўкі формы для рэгістрацыі не дастаткова, - для таго, каб сайт быў праіндэксаваны неабходна наяўнасць хоць бы адной вонкавай спасылкі.

    Ўвядзенне ў PageRank

    PageRank - статычная велічыня, прызначаная для ацэнкі якасці старонак не залежна ад якіх або запытаў, г.зн. з дапамогай PageRank вылічаецца «сусветная каштоўнасць" кожнай старонкі. Аўтары PageRank Сяргей Брын і Лары Пэйдж, якія распрацавалі тэхналогію дадатковага ранжыравання вынікаў выдачы пошукавікаў, у наступстве сталі заснавальнікамі кампаніі Google.

    За аснову PageRank быў абраны акадэмічны падыход ацэнкі важнасці публікацыі аўтара па ліку яе згадак у бібліяграфічных спасылках іншых аўтараў. Для адаптацыі да прымянення ў Інтэрнэт у алгарытм былі ўнесены наступныя змены: вага кожнай спасылкі ўлічваецца індывідуальна і нармуецца па ліку спасылак на якая спасылаецца старонцы. Акрамя таго, PageRank можа быць інтэрпрэтаваны ў тэрмінах выпадковага блукання

    вылічэнне Pagerank

    Уявіце сабе ідэальнага вэб-серфера які перамяшчаецца па сусветнай павуціне. Хай серфераў наведвае старонку p, выпадковае блуканне пры гэтым знаходзіцца ў стане p. На кожным кроку, вэб-серфераў альбо пераскоквае на іншую старонку ў сетцы, выбраную псеўда-выпадковым чынам, альбо ён варта па спасылцы на бягучай старонцы, пры гэтым не вяртаючыся і не мог наведваць адну і тую ж старонку двойчы. Верагоднасць выпадковага скачка пазначым як d тады верагоднасць пераходу па спасылцы будзе 1-d. Такім чынам, верагоднасць знаходжання карыстальніка на старонцы p можна вылічыць па наступнай формуле:

    Такім чынам, верагоднасць знаходжання карыстальніка на старонцы p можна вылічыць па наступнай формуле:

    дзе R (p) - PageRank старонкі, С (p) - лік спасылак на старонцы, да - лік б спасылаліся на p старонак, d - каэфіцыент згасання (damping factor). Звычайна 0.1 <d <0.15. Калі маштабаваць PageRank такім чынам, што

    Калі маштабаваць PageRank такім чынам, што

    дзе N - лік ўсіх старонак, для якіх вырабляецца разлік PageRank, то R (p) можна разглядаць як размеркаванне верагоднасці па ўсіх старонках.

    Для вылічэнні PageRank складаецца матрыца M памерам NxN, дзе кожнаму элементу mij матрыцы прысвойваецца значэнне R0 (p) = 1 / C (p) у тым выпадку, калі з i -й старонкі маецца спасылка на j -ую, усе тыя, што засталіся элементы матрыцы запаўняюцца нулямі . Такім чынам, вылічэнне PageRank зводзіцца да адшукання ўласнай вектара матрыцы M што дасягаецца памнажэннем матрыцы M на вектар Rj на кожным кроку ітэрацыі. Ўвядзенне каэфіцыента згасання гарантуе, што працэс сыходзіцца.

    Павышаем значнасць сайта

    Усвядоміўшы пераможнае шэсце PageRank, нельга не задумацца аб яго павелічэнні для сваёй старонкі. Інтуітыўна зразумела, што чым Аўтарытэтны рэсурс, на якім размешчана спасылка тым больш яна павялічвае PageRank старонкі, на якую спасылаецца. І наадварот, чым больш спасылак на старонцы, тым менш будзе яе ўклад у павышэнне PageRank вашай старонкі - яшчэ адзін доказ бескарыснасці ўдзелу ў FFA (Free For All - сайты, якія змяшчаюць набор спасылак са свабодным даданнем). Менш відавочная аптымальная тапалогія взаимоссылающихся старонак. Напрыклад, старонкі арганізаваныя ў "кольца" (калі кожная старонка спасылаецца на суседа злева і справа, апошняя спасылаецца на першую, а першая на апошнюю) будуць мець адзін і той жа PageRank не залежна ад колькасці старонак у кольцы (калі не праводзіць маштабаванне па суме , то PageRank ва ўсіх будзе роўны 1). Тое ж справядліва для "зорак" ці выпадку, калі ўсе спасылаюцца на ўсіх, і, верагодна, гэта зацвярджэнне справядліва ўвогуле для ўсіх сіметрычных тапалогій. Значна больш перспектыўныя з пункту гледжання павелічэння PageRank асіметрычныя тапалогіі. Зацвярджэнне аб непатрэбнасьці стварэння «пустых» (але б спасылаліся адзін на аднаго) сайтаў у бясплатных хостеров не гэтак відавочна. Напрыклад, можна арганізаваць абмен спасылкамі на 5 сайтах такім чынам, што ў аднаго з іх PageRank будзе ў 15 разоў больш, чым мінімальны не нулявы PageRank. У гэтым вельмі лёгка пераканаецца, напісаўшы невялікую праграмку. Пра тое, як гэта зрабіць, чытайце ў артыкуле Efficient Computation of PageRank

    Некаторыя распаўсюджаныя памылкі звязаныя з PageRank

    Прааналізаваўшы паведамленні ў рунетовских форумах, прысвечаных пазіцыянаванню ў пошукавых сістэмах, можна вылучыць цэлы шэраг сцвярджэнняў аб PageRank, як мінімум спрэчных, а часцяком проста няверных. Коратка разгледзім гэтыя сцвярджэнні:

    • Калі на нейкі сайт ёсць шмат спасылак з FFA, гасцявых кніг або на сайтаў іншай тэматыкі, то PageRank будзе заніжаны.

    Не варта блытаць паняцці "індэкс цытавання" і PageRank. Пры разліку PageRank аналіз змесціва ні сайта ні тэксту спасылкі не вырабляецца, улічваюцца толькі агульная колькасць спасылак і іх вагі, таму ніякіх штрафных санкцый пры наяўнасці спасылак з «няправільных» старонак не ўжываецца.

    • Калі дабіцца высокага PageRank для нейкай старонкі, то гэтая старонка будзе на першым месцы ў выніках пошуку.

    Не дакладна, па той прычыне, што PageRank з'яўляецца не асноўным крытэрыем для ранжыравання старонак, а дапаможным. У адваротным выпадку, на першых старонках па вельмі шматлікім запытам размяшчаліся б толькі рэйтынгі і топы. Толькі пры іншых роўных умовах старонка з больш высокім PageRank будзе размяшчацца вышэй у выніках пошуку.

    • Калі зарэгістраваць сайт ва ўсіх папулярных каталогах, то PageRank будзе вельмі высокім

    Не варта цешыць сябе - PageRank вылічаецца ня для сайта цалкам, а для асобна ўзятай старонкі. Таму спасылка з глыбокай поддириктории, скажам ў Yahoo, можа быць менш каштоўная чым старонка Васі Пупкіна. Так што, тут можна узяць не якасцю спасылак, а іх колькасцю. Трэба толькі звяртаць увагу на тое, каб спасылкі з каталога ішлі наўпрост на ваш сайт, а не праз cgi-скрыпт, інакш яны проста не будуць улічвацца. Акрамя таго, правілы многіх каталогах патрабуюць размяшчэння каранёвай старонкі, а не таго дакумента, PageRank якога вы збіраецеся павышаць. Таму значна больш эфектыўна можна павысіць PageRank канкрэтнай старонкі спасылкай з каранёвай старонкі свайго ўласнага сайта.

    • PageRank памяншаецца пры прастаўленні знешніх спасылак

    Вельмі спрэчнае сцвярджэнне, як гаварылася вышэй PageRank паніжаецца ў выпадку сіметрычнага аб'яднання спасылаюцца старонак, верагоднасць атрымаць якое пры прастаўленні знешняй спасылкі нікчэмна малая. Калі такую ​​фобію ў сабе не перадужаць, то можна даць савет завесці адмысловую старонку для абмену спасылкамі. Дарэчы, варта заўважыць, што пры разліку PageRank ніхто не абяцаў падзяляць спасылкі на знешнія і ўнутраныя.

    Спасылкі для далейшага вывучэння:

    1. The PageRank Citation Ranking: Bringing Order to the Web
    2. The Anatomy of a Large-Scale Hypertextual Web Search Engine
    3. Breadth-first search crawling yields high-quality pages
    4. Efficient Computation of PageRank

    Аўтарскія правы © 2001, А. Шкондин
    Публікацыя патрабуе дазволу аўтара.

    Номера

    Номерной фонд гостиницы насчитывает 173 номера различных категорий.

    Забронировать отель можно прямо сейчас: Бронирование онлайн