Il punto di partenza
A volte durante le nostre ricerche nel web con GOOGLE capita di trovare
links a pagine web senza contenuto testuale, o con un contenuto minimo
e poche pagine interne di riferimento) tra i primi 10-20 risultati
di ricerca.
Quest'eventualità è meno rara di quanto si pensi e
non è l'effetto di fantomatici bugs presenti nel codice sorgente
dello spider.
La causa va identificata nel modo unico, e a volte controverso, con
cui GOOGLE indicizza le pagine web presenti nel suo database.
Tecnologia Made in GOOGLE
Google utilizza una tecnologia basata su hardware e software
avanzato. La velocità con cui possono essere eseguite le ricerche è attribuibile
in parte all'efficienza dell'algoritmo di ricerca e in parte all'elevato
numero di PC collegati in rete, che, insieme, contribuiscono a creare
un motore di ricerca superveloce.
Il nucleo principale del software è rappresentato da PageRank(TM)...
PageRank sfrutta la vastissima rete di collegamenti associati alle
singole pagine per determinarne il valore. In pratica, Google interpreta
un collegamento dalla pagina A alla pagina B come un "voto" espresso
dalla prima in merito alla seconda. Tuttavia, non si limita a calcolare
il numero di voti, o collegamenti, assegnati a una pagina. Oltre
a effettuare questo calcolo, Google prende in esame la pagina che
ha assegnato il voto. I voti espressi da pagine "importanti" hanno
più rilevanza e quindi contribuiscono a rendere "importanti" anche
le pagine collegate...
Google integra PageRank con sofisticate procedure di ricerca testo
per trovare le pagine che sono rilevanti e rispondono ai criteri
di ricerca indicati...
>>>
fonte http://www.google.com/intl/it/why_use.html
Premessa importante
GOOGLE non affida l'indicizzazione di una pagina al solo PageRank,
come specificato nel paragrafo precedente, è pur vero che
un buon PageRank aumenta le probabilità di apparire tra i
primi risultati di ricerche specifiche (a parità di altri
fattori).
Capire il PageRank: la formula ufficiale
I fondatori di GOOGLE (Sergey Brin e Lawrence Page) hanno reso pubblico
l'algoritmo utilizzato per calcolare il PageRank di una pagina web
all'indirizzo web:
http://www-db.stanford.edu/~backrub/google.html
La Formula: PR[A] = (1 - d) + d * (PR[T1]/C[T1] + ... + PR[Tn]/C[Tn])
PR[A]: il PageRank da calcolare del sito A
PR[T1] ... PR[Tn]: il PageRank dei siti web (da T1 a Tn) che contengono
almeno un link verso il sito A
C[T1] ... C[Tn]: il numero di links esterni contenuti dai siti web
(da T1 a Tn).
d(damp): è il Fattore GOOGLE il cui valore
probabilmente è settato
a 0,85 (variazioni medie tra 0,80 e 0,90). Questo Fattore può essere
modificato da GOOGLE.
PR su Base logaritmica
Il PR (PageRank) mostrato da GOOGLE nella sua Toolbar è espresso
molto probabilmente in base logaritmica. Supponiamo che la base sia
10.
Questo vuol dire ad esempio che il PR = 3 vale 10 volte un PR = 2
e 100 volte un PR = 1.
Nell'esempio che segue i PR riportati sono LINEARI, ossia non espressi
su base logaritmica.
Solo al termine dell'esempio estrapoleremo il PR su base log. dal
PR lineare ottenuto.
Un esempio pratico
Supponiamo che la home page del nostro sito A (esempiorank.com -
nome ipotetico) sia linkata da 5 pagine web esterne (T1, T2, T3,
T4, T5).
GOOGLE interpreterà i links pubblicati sulle pagine T1...T5
come voti espressi ad esempiorank.com
a) Assegnamo un PageRank alle pagine web che ci linkano: T1 = 200,
T2=120, T3=260, T4=400, T5=40
b) Assegnamo un numero di links esterni ad ognuna di queste pagine:
T1link = 3, T2link=10, T3link=4, T4link=20, T5link=1
c) Calcoliamo l'ipotetico PageRank:
PR[esempiorank.com/index.html] = (1 - 0,85) + 0,85 * (200/3 + 120/10
+ 260/4 + 400/20 + 40/1)
Risultato: 173,27 - arrotondato alla seconda cifra
Il PR su base log. della home page di esempiorank.com è di
2
Links interni e PageRank
Discorso a parte meritano i links interni ad una pagina web (esempiorank.com/index.html,
esempiorank.com/pagina1.html etc...)
L'importanza di una pagina è data dai "voti esterni" che
questa riceve. Nel caso di links interni ad esempiorank.com, questi
determinano il PageRank delle altre pagine presenti nel sito. Per
cui nella struttura ad albero di esempiorank.com, la home page avrà un
valore necessariamente più alto rispetto a quello delle sue
pagine interne (il cui PR sarà immediatamente inferiore) e
così via scendendo in profondità.
Esemplificando: L'effetto eco di links esterni a pagine interne ad
esempiorank.com comporterà un incremento del PR relativo a
tali pagine e del PR della Home Page; al contrario se i links esterni
portano alla Home Page, l'effetto eco farà alzare il PR delle
pagine interne linkate dalla Home.
Effetto PageRank: Linkami!
L'esempio precedente ci offre dei consigli sul come e perché effettuare
degli Scambi Links (o banners) con altri siti web.
Assunto: Più una pagina web è linkata da altri siti
e più il suo PageRank è elevato.
Non sempre una pagina web con PR più alto del nostro rappresenta
il miglior investimento pubblicitario. Secondo la Formula il PR di
una pagina web viene diviso per il numero di links esterni riportati
su di essa.
Estremizzando: una pagina web con PR = 4(es. 10000) e 60 link esterni
ci porterà meno punti di una pagina con PR=2(es. 200) e 1
solo link esterno.
Questa estremizzazione è utile per chiarire che un sito Web
il cui PR è costruito sull'esposizione di decine e decine
di link non necessariamente ha una capacità di Voto realmente
Forte se contrapposto al Voto di una Pagina web con PR più basso
ma con solo un paio di links indovinati.
La politica pubblicitaria del PageRank
In che modo aumentare il Page Rank di un sito web per migliorare
le probabilità di apparire tra i primi risultati di ricerca
di GOOGLE?
Un paio di suggerimenti per creare un'adeguata politica pubblicitaria
sfruttando la Formula del PR:
a) farsi linkare da più siti web (siti web con PageRank
inferiore al nostro non danno nessuna penalità!).
b) dare la priorità a pagine web con buoni PR e che non
abbiano, se possibile, un numero eccessivo di links esterni...
c) scambiare la cortesia esponendo i links dei nostri "amici",
se possibile evitando di linkarli tutti sulla nostra Home Page
per non inficiarne la capacità di Voto!
|