User Tag List

Pagina 2 di 2 PrimaPrima 1 2
Risultati da 16 a 21 di 21

Discussione: Il web non sarà per i mocciosetti

  1. #16
    Data Registrazione
    Oct 2009
    Messaggi
    2,261
    Ringraziamenti ricevuti
    428
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)
    Downloads
    10
    Uploads
    0

    Predefinito Riferimento: Il web non sarà per i mocciosetti

    Citazione Originariamente Scritto da L'Enigimista Visualizza Messaggio
    Secondo queste informazioni dovrebbero penalizzare parecchi siti stranieri che molte volte usano gli stessi contenuti ma essendo famosi si posizionano sempre in prima pagina.
    Se tu conoscessi un quality rater (che per contratto, anche se solo semestrale, non possono dichiarare che lo sono stati) potresti porre questa domanda: se Google forma delle liste di contenuti, come vede le liste di contenuti formate da altri siti che non aggiungono valore alla sua lista?

    Scusa: lista di contenuti è anacronista, si dovrebbe dire "lista di oggetti". Non a caso google spinge molto il linguaggio di programmazione Python (lo stesso Guido Van Rossum è stato assunto da Google nel 2005) che sembra il miglior linguaggio di manipolazione di oggetti (per chiarezza devo dire che io sono un pythonista ma non faccio guerre di religione).

    Prova a guardare il web per quello che sembra di essere: un sistema caotico dove ad ogni secondo vengono immessi nuovi oggetti. Come ordineresti questo sistema caotico? Come metteresti ordine a questo apparente disordine?
    Cercando di predire cosa sia di "valore" per gli utenti. Quali sono gli elementi temporali (cioè che variano nel tempo)che fanno percepire di valore un oggetto?
    Una guida sul tag <br> in html ha lo stesso valore adesso e 15 anni fà?
    Una guida sui colori di adsenseicon ha lo stesso valore adesso rispetto a 10 anni fa?
    Tutto questo che ho scritto ora si sa da 10 anni, quanto valore ha questo specifico post nelle serp di Google?
    Se tu avessi un motore di ricerca non ti piacerebbe sapere più della rilevanza attuale quale rilevanza avrà nel futuro? Non ti piacerebbe sapere quanto un post verrà linkato più di quanto lo sia ora? E se la gente legge solo determinati autori?
    Algoritmi più noti nel search web. Gli algiritmi LAR (Link Analisys ranking)
    Faccio questa aggiunta perché rileggendo questo post non mi pare che si capisca molto.
    Gli algoritmi LAR vedono il web come un insieme caotico dove i vari oggetti possono essere ordinati in base ad una struttura topologica e fa uso dei grafi. Percorrendo gli archi entranti e gli archi uscenti si determina il valore di ordinamento.
    In origine c'era un algoritmo il InDegree che calcola la popolarità di una pagina web prendendo in considerazione il numero di link che puntano ad essa.
    Poi sono venuti fuori tre algoritmi più evoluti:
    PageRank
    Kleinberg (chiamato anche HITS)
    Salsa
    Il PageRank segue un percorso casuale nel grafo del web dove ogni pagina propaga il proprio peso alle pagine che linka.In questo caso si determina un array di pesi che determinano l'authority.
    Questo algoritmo fa ricorso ai processi delle catene di Markov.
    Il PR è querry indipendent ovvero il calcolo del punteggio è fatto per tutti i nodi del grafo web. IL PR parte dal presupposto del random surfer: il punteggio rappresenta la probabilità con cui un utente che naviga in modo random si trova ad un certo istante (in tempo discreto come dicono i matematici) su una determinata pagina.
    Domanda come gestisce il PR le due situazioni critiche del random surfer: pagine senza link uscenti e link che forzano la navigazione verso un moto che passa sempre attraverso un insieme finito di nodi con una periodicità costante?
    Il primo problema viene chiamato node sink: in assenza di ancoraggio nel grafo web, il PR "finge" degli archi fittizi che sono diretti in modo randomico verso altri nodi del grafo. In pratica all'utente che giunge su una pagina priva di link uscenti, non ha uno stallo nella sua navigazione, ma può ritornare indietro e scegliere un nuovo nodo (serp?).
    Il secondo problema è il dumping factor (rectius, spam, linkbuilding). Questo fattore impedice la navigazione ciclica dell'utente che, se non ci fosse, impedirebbe la sua navigazione randomica e sopratutto impedirebbe di calcolare il punteggio.

    L'algorimo Kleinberg, invece, ha uno scema di propagazione dei pesi suddivisi soltanto in due livelli (hub) determinando l'authority. Un kleinberg sofisticato ha diversi livelli di authority sia degli hub che dei componenti inseriti in questi.
    Un contenuto con alto hub authority è una pagina che contiene collegamenti a pagine con la stessa authority hub e simmetricamente una pagina con un alto authority è una pagina che è puntata da molte pagine inserite in un alto authority hub.
    Il Kleinber funziona attraverso il c.d. brand-topic-querry

    L'algoritmo SALSA (Stochastic Approch for Link-Structure Analysis) è una combinazione dei due.
    L’idea a fondamento di SALSA è sostanziamente comune a quella su cui si basa HITS. Si parte dal presupposto di considerare la distinzione tra due tipologie di nodi: hub e authority. La visione dicotomica dei nodi è motivata, anche dai seguenti principi:
    • l’entità del punteggio di hub di un nodo è determinata dall’entità dei punteggi di authority dei nodi cui esso punta;
    • l’entità del punteggio di authority di un nodo è determinata dall’entità dei punteggi di hub dei nodi da cui esso è puntato.
    In aggiunta rispetto all’approccio di HITS, SALSA combina la suddetta distinzione tra i ruoli di hub e authority con la teoria dei cammini randomici su un grafo (su cui si fonda PageRank). Consideriamo un grafo bipartito G in cui i nodi compaiono duplicati, sotto forma di componente di hub e di componente di authority, e in cui la presenza di un arco tra un hub r e una
    authority s indica l’esistenza di un link informativo da r a s. Sicuramente i nodi con più elevato punteggio di hub e di authority relativamente ad un determinato argomento saranno quelli più facilmente raggiungibili da un’elevata quantità di pagine del grafo G. SALSA si propone di identificare le pagine di G che risultano maggiormente visitate da cammini randomici sul grafo, dalle quali poi potrà estrarre quelle con maggiore punteggio di authority.
    L’approccio di SALSA è iterativo. Prende avvio come nel PR, ma nel grafo web (G) vengono modellati due distinti cammini: uno attraversa solo le componenti hub e l'altro solo le componenti authority. Il punteggio è determinato dalla probabilità che una navigazione randomica interessa in ogni istante i livelli hub e authority dello stesso livello (vi ricorda qualche tool seo?).
    Se ogni link avesse lo stesso peso il SALSA sarebbe un InDegree pesato.
    Per curiosità posto la formula, ora svelata perché il brevetto è scaduto, del PageRank: PageRank - Wikipedia
    Ultima modifica di investor6; 18-03-14 alle 11:51 AM
    Replica con @investor6 utilizzando il bottone "Rispondi alla Discussione"

  2. The Following 2 Users Say Thank You to investor6 For This Useful Post:

    Lenigmista (18-03-14), macao (18-03-14)

  3. #17
    Data Registrazione
    Aug 2012
    Messaggi
    856
    Ringraziamenti ricevuti
    125
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)
    Downloads
    0
    Uploads
    0

    Predefinito Riferimento: Il web non sarà per i mocciosetti

    Citazione Originariamente Scritto da investor6 Visualizza Messaggio
    Sui link in entrata non ci scommetterei molto. A me sembra che BigG stia abbandonando o quantomeno ridimensionando l'idea della link popularity anche se rivista in ottica PageRank.
    Il team spam ha capito che ogni volta che fanno un aggiornamento i seo nel giro di qualche mese imparano di nuovo a mettere i link spam nelle prime posizioni delle serp. Secondo me Google sta andando nella direzione di creare un algoritmo complesso definitivo basato sulle conversazioni: in questo modo è più difficile per i seo-spammer e sopratutto le serp sarebbero più adattative alle mode del momento.
    x quel che ha detto Cutts recentemente la strada per un ranking che non tenga conto dei link è lontanissima...

    https://www.youtube.com/watch?v=NCY30WhI2og

    certo considerando che nel 99% dei casi dice l'opposto della verità potrebbe essere che lo rilascino a breve
    Replica con @Teccak utilizzando il bottone "Rispondi alla Discussione"

  4. #18
    Data Registrazione
    May 2012
    Messaggi
    3,109
    Ringraziamenti ricevuti
    211
    Mentioned
    17 Post(s)
    Tagged
    0 Thread(s)
    Downloads
    2
    Uploads
    0

    Predefinito Riferimento: Il web non sarà per i mocciosetti

    se ho decifrato bene, è la disposizione dell'HTML (e di altri linguaggi che stanno dietro) che trasformano il contenuto (pur essendo lo stesso) in modo diverso; io ho sempre pensato che fosse il pagerank.

    Sintesi di quel che hai detto:
    - Esempio con <br>:

    1) Io vado in banca a prelevare

    2) Io vado
    in banca a
    prelevare.

    Google li considera diversi? Mi sa' che Matt era il secchione della classe ed i suoi compagni gli dicevano: "Guarda che la professoressa non se ne accorge che è copiato, sono andato a capo!".

    Al di là della battuta, forse ho capito quel che dici.
    Ultima modifica di Lenigmista; 18-03-14 alle 06:53 PM
    Replica con @Lenigmista utilizzando il bottone "Rispondi alla Discussione"

  5. #19
    Data Registrazione
    Oct 2009
    Messaggi
    2,261
    Ringraziamenti ricevuti
    428
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)
    Downloads
    10
    Uploads
    0

    Predefinito Riferimento: Il web non sarà per i mocciosetti

    Se ti riferisci a quello che ho scritto io...non hai proprio capito
    Replica con @investor6 utilizzando il bottone "Rispondi alla Discussione"

  6. #20
    Data Registrazione
    Oct 2010
    Messaggi
    585
    Ringraziamenti ricevuti
    98
    Mentioned
    2 Post(s)
    Tagged
    0 Thread(s)
    Downloads
    0
    Uploads
    0

    Predefinito

    ho letto con molta attenzione tutti gli interventi, soprattutto quelli profondissimi di Investor. Mi mancano purtroppo le basi per capire buona parte di quello che ho letto quindi intervengo solo su una parte.

    Investor parla di hangout che sarebbero se ho capito bene una sort di contenuti in tempo reale in cui il titolare ovviamente non può aiutarsi scopiazzando altri siti perchè non ne ha il tempo. ma a cosa si applicano?

    al momento il business del web è quasi interamente basato su contenuti statici (testo) per quanto riguarda il posizionamento su Google, o sbaglio?

    In altre parole se voglio fare contatti devo essere primo su google. Per essere primo, reputazione a parte, mi bastano anche dei contenuti altrui riscritti molto bene. Sempre se in qualche modo mi sono guadagnato buona reputazione in precedenza. Come mai farà google a capire che sono solo bravo a rielaborare e la notizia non viene da me come prima fonte?

    Parlo ovviamente di rielaborazioni realizzate in modo tempestivi da siti inferiori x reputazione, non certo dai colossi che stanno sempre davanti.

    Ecco, scusatemi se sono andato forse un po' fuori tema ma mi interessava conoscere il vostro parere sull'argomento.

    seconda cosa: molto interessante la questione sollevata dall'Enigmista (lo scrivo senza la I supplementare, scusami ehehe). La mia risposta è: Google vede i due testi che hai indicato come uguali e dunque copiati. L?acapo o lo spazio non hanno rilevanza.

    E non solo. Per me rischi che siano uguali anche se ci inserisci un'interpunzione leggermente diversa o piccole modifiche irrilevanti. Non posso esserne certo ovviamente, ma questa è la mia opinione basata sull'esperienza.

    Un caso molto interessante sono i siti che si occupano di testi delle canzoni (tra cui anche il mio radiomusik.it anche se marginalmente). Fate caso allo sforzo disperato di differenziarsi anche se alla fine le parole son quelle e quindi c'è poco da fare...
    Ultima modifica di Tattico; 18-03-14 alle 10:40 PM
    Replica con @macao utilizzando il bottone "Rispondi alla Discussione"

  7. #21
    Data Registrazione
    May 2012
    Messaggi
    3,109
    Ringraziamenti ricevuti
    211
    Mentioned
    17 Post(s)
    Tagged
    0 Thread(s)
    Downloads
    2
    Uploads
    0

    Predefinito Riferimento: Il web non sarà per i mocciosetti

    Citazione Originariamente Scritto da investor6 Visualizza Messaggio
    Se ti riferisci a quello che ho scritto io...non hai proprio capito
    ci ho provato ma non ne vengo a capo, di solito gli enigmi li faccio, non li risolvo.
    evidentemente Il web non sarà per i mocciosetti
    Replica con @Lenigmista utilizzando il bottone "Rispondi alla Discussione"

Pagina 2 di 2 PrimaPrima 1 2

Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •