Категории

  • Голосование
  • Право голоса
  • Киев
  • Украина
  • Здоровье
  • Популярное
  • Новости
  • Новости

      Artmisto
      Наша команда-партнер Artmisto. С "Buddy.Bet" азартные игроки найдут идеальное место для развлечений и возможность выиграть крупные суммы.

    PageRank: Daugiau gerų ir svarbių nuorodų.

    1. „PageRank“ taikymas paieškos sistemose
    2. Įvadas į „PageRank“
    3. Skaičiuojant PageRank
    4. Mes didiname svetainės svarbą
    5. Keletas bendrų klaidingų nuomonių, susijusių su „PageRank“
    6. Nuorodos tolesniam tyrimui:

    Наша команда-партнер Artmisto

    A. Shkondin.

    Dėl „Google“ sėkmės paieškos paslaugų teikimo rinkoje ir ypač dėl to, kad ši paieškos sistema buvo išplėsta į „Runet“, tarp žiniatinklio valdytojų susidomėjo „PageRank“ skaičiavimo algoritmais. Šiame straipsnyje aptariami kai kurie „PageRank“ skaičiavimo aspektai.

    „PageRank“ taikymas paieškos sistemose

    Tradiciniai būdai rasti tinkamus puslapius vienagumbių užklausų atveju nesuteikia patenkinamų rezultatų, nes populiariose temose (pvz., „esė“, „darbas“) visada bus daug tų pačių aktualių puslapių. Siekiant kažkaip organizuoti šiuos puslapius, paieškos sistemos pradeda veikti įvairiais gudrybėmis. Pavyzdžiui, pirmasis išleidžia tuos puslapius, kuriuose yra didelis lankomumas (Rambler) arba kurie yra kataloge (Yandex, Aport). „Google“ šiems tikslams naudoja „PageRank“, kuris suteikia nuostabių rezultatų, ir per trumpą laiką „Google“ pradėjo užimti pirmaujančią poziciją ne tik duomenų bazės dydžio, bet ir paieškos kokybės požiūriu. Iš mūsų paieškos sistemų „Aport“ pirmą kartą naudojo „PageRank“, po to - „Yandex“. „Rambler“ ši technologija nenaudojama, bet šiuo metu svarstoma ši galimybė, ir yra įmanoma, kad šioje paieškos sistemoje bus naudojamas „PageRank“.

    Kartu su paieškos rezultatais pagal „PageRank“ yra ir kita šios technologijos programa. Tiesa ta, kad interneto puslapių skaičius yra toks didelis, kad paieškos sistemos nebegali sau leisti viską indeksuoti. Ir kadangi „PageRank“ yra puslapio vertės kriterijus, logiška indeksuoti puslapius mažėjančia PageRank tvarka. „Google“ dar toliau: dabar nepakanka pateikti tik registracijos formą - norint, kad svetainė būtų indeksuojama, turite turėti bent vieną išorinę nuorodą.

    Įvadas į „PageRank“

    PageRank yra statinė vertė, skirta puslapių kokybei įvertinti, neatsižvelgiant į visas užklausas, t.y. „PageRank“ apskaičiuoja kiekvieno puslapio „pasaulinę vertę“. „PageRank Sergey Brin“ ir „Larry Page“ autoriai, sukūrę papildomos paieškos rezultatų reitingavimo technologiją, vėliau tapo „Google“ steigėjais.

    PageRank pagrindas buvo akademinis požiūris, leidžiantis įvertinti autoriaus skelbimo svarbą kitų autorių bibliografinėse nuorodose. Siekiant prisitaikyti prie interneto naudojimo, buvo atlikti šie algoritmo pakeitimai: į kiekvieną nuorodos svorį atsižvelgiama individualiai ir normalizuojamas pagal nuorodų skaičių nuorodiniame puslapyje. Be to, „PageRank“ gali būti interpretuojamas atsitiktine tvarka.

    Skaičiuojant PageRank

    Įsivaizduokite puikų interneto naršyklę, naršantį visame pasaulyje. Leiskite banglentininkams apsilankyti puslapyje p , o atsitiktinis pėsčiomis yra valstybės p . Kiekviename etape žiniatinklio naršyklė peršoka į kitą tinklapio puslapį, pasirinktą pseudo atsitiktine tvarka, arba seka nuorodą, esančią dabartiniame puslapyje, negrįždama ir neperžiūrėdama to paties puslapio du kartus. Atsitiktinio šuolio tikimybė žymima kaip d, tada nuorodos tikimybė bus 1 - d . Taigi, tikimybė rasti vartotoją p puslapyje gali būti apskaičiuojama pagal šią formulę:

    Taigi, tikimybė rasti vartotoją p puslapyje gali būti apskaičiuojama pagal šią formulę:

    kur R (p) yra puslapio PageRank, C (p) yra puslapių nuorodų skaičius, k yra puslapių skaičius, susijęs su p , d yra slopinimo koeficientas. Paprastai 0,1 <d <0,15 . Jei masto pagerank tokiu būdu, kad

    Jei masto pagerank tokiu būdu, kad

    kur N yra visų puslapių, kuriems skaičiuojamas PageRank, skaičius, tada R (p) gali būti laikomas tikimybės pasiskirstymu visuose puslapiuose.

    Norint apskaičiuoti „PageRank“, sukuriama M matrica , kurios dydis yra NxN , kur kiekvienam matricos elementui „ mij“ priskiriama reikšmė R0 (p) = 1 / C (p) , jei i -oji puslapis turi nuorodą į j , visi kiti matricos elementai yra užpildyti nuliais . Taigi, PageRank skaičiavimas sumažinamas, kad būtų galima rasti matricos M savitą vektorių , kuris pasiekiamas dauginant matricą M vektoriumi Rj kiekviename iteracijos etape. Sumažinimo koeficiento įvedimas užtikrina, kad procesas susivienys.

    Mes didiname svetainės svarbą

    Suvokdami laimėjusį „PageRank“ procesą, negalime padėti galvoti apie tai, kaip jį padidinti jūsų puslapyje. Intuityviai aišku, kad kuo autoritetingesnis yra šaltinis, kuriame yra nuoroda, tuo daugiau jis padidina puslapio, kuriam jis skirtas, PageRank. Priešingai, tuo daugiau nuorodų į puslapį, tuo mažesnis bus jo indėlis į puslapio puslapio „PageRank“ didinimą - dar vienas įrodymas, kad nereikia dalyvauti FFA („Free For All“ - svetainės, kuriose yra nemokama papildoma nuoroda). Mažiau akivaizdus yra optimalus tarpusavyje susijusių puslapių topologija. Pvz., Puslapiuose, suskirstytuose į „žiedą“ (kai kiekvienas puslapis yra susijęs su kaimynu kairėje ir dešinėje, paskutinis - pirmas ir pirmasis iki paskutiniojo), bus tas pats PageRank, neatsižvelgiant į žiede esančių puslapių skaičių (jei nenurodysite , tada visų PageRank bus lygus 1). Tas pats pasakytina ir apie „žvaigždes“ arba atvejį, kai visi nurodo visus, ir šis teiginys tikriausiai tinka visoms simetriškoms topologijoms. Asimetriškos topologijos yra daug žadančios dėl PageRank didinimo. Pareiškimas apie „tuščių“ (bet tarpusavyje sujungiančių) svetainių kūrimo nenaudingumą iš nemokamų kompiuterių nėra toks akivaizdus. Pavyzdžiui, galite keistis nuorodomis 5 svetainėse taip, kad vienas iš jų turi 15 kartų daugiau PageRank nei minimalus nulinis „PageRank“. Tai lengva pamatyti, rašant nedidelę programą. Skaitykite, kaip tai padaryti straipsnyje. Efektyvus PageRank skaičiavimas

    Keletas bendrų klaidingų nuomonių, susijusių su „PageRank“

    Išnagrinėjus pranešimus „Runet“ forumuose, skirtuose paieškos sistemose, galima išskirti keletą „PageRank“ teiginių, bent jau prieštaringų ir dažnai tiesiog neteisingų. Trumpai apsvarstykite šiuos teiginius:

    • Jei yra daug nuorodų į svetainę su FFA, svečių knygomis ar kitomis svetainėmis, tada „PageRank“ bus nepakankamai įvertintas.

    Nepainiokite „citavimo indekso“ ir „PageRank“ sąvokos. Skaičiuojant „PageRank“, svetainės turinio arba nuorodos teksto analizė neatliekama, atsižvelgiama tik į bendrą nuorodų skaičių ir jų svorį, taigi, jei yra nuorodų iš „neteisingų“ puslapių, netaikomos sankcijos.

    • Jei bet kuriame puslapyje pasieksite aukštą „PageRank“, tuomet šis puslapis bus pirmoje vietoje paieškos rezultatuose.

    Netiesa, todėl, kad PageRank nėra pagrindinis kriterijus reitinguojant puslapius, bet pagalbinis. Priešingu atveju, pirmuosiuose puslapiuose labai daug prašymų būtų pateikti tik reitingai ir viršūnės. Paieškos rezultatuose bus didesnis tik „ceteris paribus“, puslapis su didesniu „PageRank“.

    • Jei registruosite svetainę visuose populiariuose kataloguose, tada „PageRank“ bus labai didelis

    Nepatenkinkite - PageRank skaičiuojamas ne visai svetainei, bet vienam puslapiui. Todėl nuoroda iš gilaus antrinio katalogo, pvz., „Yahoo“, gali būti mažiau vertinga nei Vasya Pupkin puslapyje. Taigi, čia jūs negalite paimti nuorodų kokybės, o jų skaičiaus. Būtina atkreipti dėmesį tik į tai, kad nuorodos iš katalogo patenka tiesiai į jūsų svetainę, o ne su cgi-script, nes kitaip jos nebus įskaitomos. Be to, daugelio katalogų taisyklėms reikalingas šakninio puslapio išdėstymas, o ne dokumentas, kurio PageRank jūs ketinate padidinti. Todėl daug efektyviau padidinti konkretaus puslapio PageRank nuorodą į savo svetainės šakninį puslapį.

    • PageRank yra mažesnis, kai pateikiamos išorinės nuorodos

    Labai prieštaringas pareiškimas, kaip jau minėta, „PageRank“ mažėja, jei simetriškas nuorodų puslapių derinys, kurio tikimybė yra pasiekiama, kai pritvirtinama išorinė nuoroda. Jei tokia fobija savaime neprisidėtų, mes galime patarti, kad pradėtume specialų puslapį keistis nuorodomis. Beje, verta pažymėti, kad skaičiuojant „PageRank“ niekas pažadėjo atskirti nuorodas į išorinį ir vidinį.

    Nuorodos tolesniam tyrimui:

    1. PageRank citavimo reitingas: pavedimas į internetą
    2. Didelės apimties hipertekstinės interneto paieškos sistemos anatomija
    3. Pirmoji paieškos rikiuotė suteikia aukštos kokybės puslapius
    4. Efektyvus PageRank skaičiavimas

    Autorinės teisės © 2001 A. Shkondin
    Leidinys reikalauja autoriaus leidimo.

    Номера

    Номерной фонд гостиницы насчитывает 173 номера различных категорий.

    Забронировать отель можно прямо сейчас: Бронирование онлайн