Категории

  • Голосование
  • Право голоса
  • Киев
  • Украина
  • Здоровье
  • Популярное
  • Новости
  • Новости

      Artmisto
      Наша команда-партнер Artmisto. С "Buddy.Bet" азартные игроки найдут идеальное место для развлечений и возможность выиграть крупные суммы.

    PageRank: link più buoni e importanti.

    1. Applicazione PageRank nei motori di ricerca
    2. Introduzione a PageRank
    3. Calcolo del pagerank
    4. Aumentiamo l'importanza del sito
    5. Alcuni malintesi comuni associati a PageRank
    6. Collegamenti per ulteriori studi:

    Наша команда-партнер Artmisto

    A. Shkondin.

    A causa del successo di Google nel mercato per la fornitura di servizi di ricerca, e in particolare con l'espansione di questo motore di ricerca su Runet, tra i webmaster c'è un aumento di interesse negli algoritmi per il calcolo del PageRank. Questo articolo discute alcuni aspetti del calcolo del PageRank.

    Applicazione PageRank nei motori di ricerca

    I metodi tradizionali di trovare pagine pertinenti nel caso di query monosillabiche non danno risultati soddisfacenti, perché su argomenti popolari (ad esempio "saggi", "lavoro") ci sarà sempre un gran numero di pagine con la stessa rilevanza. Per organizzare in qualche modo queste pagine, i motori di ricerca si avviano in vari trucchi. Ad esempio, il primo a pubblicare quelle pagine che hanno una grande presenza (Rambler) o che sono presenti nel catalogo (Yandex, Aport). Google utilizza PageRank per questi scopi, il che dà risultati sorprendenti, e in breve tempo, Google ha iniziato a occupare una posizione di leadership non solo in termini di dimensioni del database, ma anche nella qualità della ricerca. Dei nostri motori di ricerca, Aport è stato il primo a utilizzare PageRank, seguito da Yandex. In Rambler questa tecnologia non viene utilizzata, ma in questa fase viene considerata questa possibilità, ed è possibile che PageRank venga utilizzato in questo motore di ricerca.

    Insieme all'ordinazione dei risultati di ricerca di PageRank, esiste un'altra applicazione per questa tecnologia. Il fatto è che il numero di pagine su Internet è così grande che i motori di ricerca non possono più permettersi di indicizzare tutto. E poiché PageRank funge da criterio per il valore della pagina, è logico indicizzare le pagine in ordine decrescente di PageRank. Google è andato ancora oltre: ora basta semplicemente inviare un modulo di registrazione: per poter indicizzare il sito, devi avere almeno un link esterno.

    Introduzione a PageRank

    PageRank è un valore statico inteso a valutare la qualità delle pagine indipendentemente da qualsiasi domanda, ad esempio utilizzando PageRank calcola il "valore globale" di ogni pagina. Gli autori di PageRank Sergey Brin e Larry Page, che hanno sviluppato la tecnologia di ulteriore classifica dei risultati dei motori di ricerca, in seguito sono diventati i fondatori di Google.

    La base di PageRank era un approccio accademico per valutare l'importanza della pubblicazione dell'autore per il numero delle sue referenze in riferimenti bibliografici di altri autori. Per adattarsi all'uso di Internet, sono state apportate le seguenti modifiche all'algoritmo: il peso di ciascun collegamento viene preso in considerazione individualmente e viene normalizzato dal numero di collegamenti nella pagina di riferimento. Inoltre, PageRank può essere interpretato in termini di una passeggiata casuale.

    Calcolo del pagerank

    Immagina il navigatore web perfetto che naviga in tutto il mondo. Lascia che il navigatore visiti la pagina p , mentre la passeggiata casuale è nello stato p . Ad ogni passo, il navigatore del web salta a un'altra pagina sulla rete, selezionata in modo pseudo-casuale, o segue il collegamento sulla pagina corrente, senza tornare e non visitando la stessa pagina due volte. La probabilità di un salto casuale è d indicata come d, quindi la probabilità di un collegamento sarà 1 - d . Pertanto, la probabilità di trovare un utente nella pagina p può essere calcolata con la seguente formula:

    Pertanto, la probabilità di trovare un utente nella pagina p può essere calcolata con la seguente formula:

    dove R (p) è il PageRank della pagina, C (p) è il numero di link nella pagina, k è il numero di pagine che si riferiscono a p , d è il fattore di smorzamento. Di solito 0,1 <d <0,15 . Se ridimensionate il pagerank in modo tale

    Se ridimensionate il pagerank in modo tale

    dove N è il numero di tutte le pagine per cui viene calcolato PageRank, quindi R (p) può essere considerato come la distribuzione di probabilità su tutte le pagine.

    Per calcolare il PageRank, viene creata una matrice M con la dimensione NxN , dove a ciascun elemento mij della matrice viene assegnato il valore R0 (p) = 1 / C (p) nel caso in cui l' i -esima abbia un collegamento al j- th, tutti gli elementi rimanenti della matrice sono pieni di zeri . Pertanto, il calcolo del PageRank viene ridotto al trovare l'autovettore della matrice M, che viene ottenuto moltiplicando la matrice M per il vettore Rj a ogni fase di iterazione. L'introduzione del coefficiente di attenuazione assicura che il processo converga.

    Aumentiamo l'importanza del sito

    Realizzando la processione vincente di PageRank, non si può fare a meno di pensare di aumentarlo per la tua pagina. È intuitivamente chiaro che più è autorevole una risorsa su cui è posizionato un link, più aumenta il PageRank della pagina a cui fa riferimento. Viceversa, più link su una pagina, meno sarà il suo contributo all'aumento del PageRank della tua pagina - un'altra prova della futilità di partecipare ai siti FFA (Free For All - contenenti una serie di link con aggiunta gratuita). Meno ovvia è la topologia ottimale delle pagine interconnesse. Ad esempio, le pagine organizzate in un "ring" (quando ogni pagina si riferisce a un vicino a sinistra ea destra, l'ultima si riferisce al primo e il primo all'ultimo) avranno lo stesso PageRank indipendentemente dal numero di pagine sul ring (se non si scala in il PageRank di tutti sarà uguale a 1). Lo stesso vale per le "stelle" o il caso in cui tutti si riferiscono a tutti, e questa affermazione è probabilmente vera per tutte le topologie simmetriche. Le topologie asimmetriche sono molto più promettenti in termini di aumento del PageRank. La dichiarazione sull'inutilità di creare siti web "vuoti" (ma collegati tra loro) da host gratuiti non è così ovvia. Ad esempio, puoi scambiare link su 5 siti in modo che uno di essi abbia PageRank 15 volte di più del PageRank minimo non zero. Questo è facile da vedere scrivendo un piccolo programma. Leggi come farlo nell'articolo. Calcolo efficiente di PageRank

    Alcuni malintesi comuni associati a PageRank

    Dopo aver analizzato i messaggi nei forum di Runet dedicati al posizionamento nei motori di ricerca, è possibile individuare una serie di accuse di PageRank, almeno controverso, e spesso semplicemente errate. Considera brevemente queste affermazioni:

    • Se vi sono molti collegamenti a un sito Web con FFA, libri degli ospiti o altri siti Web, il PageRank verrà sottostimato.

    Non confondere il concetto di "indice di citazione" e PageRank. Quando si calcola il PageRank, l'analisi dei contenuti del sito o del testo del collegamento non viene eseguita, viene preso in considerazione solo il numero totale di link e i relativi pesi, pertanto non vengono applicate sanzioni se vi sono collegamenti dalle pagine "errate".

    • Se ottieni un PageRank elevato per qualsiasi pagina, questa pagina sarà in primo luogo nei risultati di ricerca.

    Non è vero, per il motivo che il PageRank non è il criterio principale per classificare le pagine, ma è uno ausiliario. Altrimenti, nelle prime pagine, per moltissime richieste, verrebbero posizionati solo i punteggi e i top. Solo ceteris paribus, una pagina con un PageRank più alto sarà più alta nei risultati di ricerca.

    • Se registri il sito in tutte le directory popolari, il PageRank sarà molto alto

    Non illuderti: il PageRank non viene calcolato per l'intero sito, ma per una singola pagina. Pertanto, un collegamento da una sottodirectory profonda, ad esempio in Yahoo, potrebbe essere meno prezioso della pagina di Vasya Pupkin. Quindi, qui puoi prendere non la qualità dei collegamenti, ma il loro numero. È necessario solo prestare attenzione al fatto che i collegamenti dal catalogo vanno direttamente al tuo sito, e non attraverso un cgi-script, altrimenti semplicemente non saranno presi in considerazione. Inoltre, le regole di molte directory richiedono il posizionamento della pagina radice e non il documento di cui il PageRank si sta per aumentare. Pertanto, è molto più efficiente aumentare il PageRank di una pagina specifica facendo riferimento alla pagina radice del tuo sito.

    • Il PageRank viene ridotto quando si posizionano collegamenti esterni

    Una dichiarazione molto controverso, come accennato in precedenza, PageRank diminuisce nel caso di una combinazione simmetrica delle pagine di riferimento, la cui probabilità si ottiene quando viene apposto un collegamento esterno. Se una simile fobia di per sé non viene superata, allora possiamo dare consigli per iniziare una pagina speciale per lo scambio di link. A proposito, vale la pena notare che durante il calcolo del PageRank, nessuno ha promesso di separare i riferimenti esterni e interni.

    Collegamenti per ulteriori studi:

    1. Il ranking PageRank Citation: portare ordine sul Web
    2. L'anatomia di un motore di ricerca web ipertestuale su larga scala
    3. La ricerca per indicizzazione della larghezza consente di ottenere pagine di alta qualità
    4. Calcolo efficiente di PageRank

    Copyright © 2001 di A. Shkondin
    La pubblicazione richiede il permesso dell'autore.

    Номера

    Номерной фонд гостиницы насчитывает 173 номера различных категорий.

    Забронировать отель можно прямо сейчас: Бронирование онлайн