You are here

Contenuti duplicati con Drupal : noindex e rel=canonical

Inviato da giovanninews on Sab, 03/12/2011 - 16:09

Contenuti duplicati in Drupal e il meta name noindex Prima di tutto devo dire che il rel=canonical non è una direttiva come erroneamente detto nel mio precedente articolo, bensì un suggerimento che alcuni motori di ricerca possono apprezzare (ma anche punire se utilizzato erroneamente).

E' un suggerimento, come anche detto nel Webmaster Central Blog di Google che a febbraio 2009 ne annuncia il supporto: [rel = "canonical" è un suggerimento che onoriamo con forza.].

L' articolo indicato suggerisce anche come utilizzare il rel=canonical ed informa che è supportato anche da Ask.com, Microsoft Live Search eYahoo!.

Allora, perchè non uso il suggerimento rel=canonical ? Non lo uso per ora, ma forse lo utilizzerò in seguito. Al momento, sono più occupato nel cercare di eliminare i contenuti duplicati dall' indice di Google e gli errori di Bing. E' importante utilizzarli entrambi per capire come si comportano; probabilmente, ciò che può dare fastidio ad uno, potrebbe far innervosire anche l' altro.

Sembrerebbe inoltre che Bing sia usato da MSN e Yahoo!; quindi, la ricerca con questi riporta gli stessi risultati. Ritornando ai contenuti duplicati, rel=canonical sembra una soluzione poco adottabile con Drupal, almeno per me che uso il modulo Nodewords.

Il modulo Nodewords permette di impostare il suggerimento rel=canonical automaticamente per tutti i nodi o manualmente per ogni singolo nodo. L' impostazione manuale non la ritengo praticabile per ovvi motivi di praticità e l' impostazione automatica attiverebbe il rel=canonical anche per i nodi che, secondo me, non dovrebbero essere proprio indicizzati.

Ho deciso quindi, per ora, di provare a togliere i contenuti duplicati interni, o quelli che a me sembrano duplicati, attraverso l' utilizzo del meta name noindex. Il modulo Nodewords (Meta Tags) offre in questo caso delle ottime possibilità di configurazioni automatiche; permette configurazioni automatiche dei meta name più importanti per la home page, per la tassonomia (sia singolarmente che per interi vocabolari) e per pagine particolari come err 403 ed err 404.

Imposto quindi il modulo Nodewords per mettere <meta name="robots" content="noindex" /> per le liste; dovrebbero man mano diminuire dall' indice di Google tutte le urls con il ?page=.

Questo toglierà dalla SERP di Google anche tutte le pagine generate per un vocabolario categoria, forse anche comode da avere e non duplicate.

La scelta è dettata dal fatto che Drupal genera una enorme quantità di contenuti duplicati interni anche per i singoli nodi con l' argomento ?page= e non so se questo sia un errore di Drupal o di Google.

Alcuni contenuti duplicati nel mio sito web

<< Pagina precedente

Pagina successiva >>