La guida definitiva per duplicare contenuti e SEO

Pubblicato: 2022-02-13

Il contenuto duplicato si riferisce al contenuto che appare online in più di un luogo. Per "luogo" intendiamo una pagina con un URL univoco. Può essere esattamente lo stesso contenuto o quasi esattamente lo stesso e può trovarsi sullo stesso sito Web o su un altro sito.

Potresti non essere penalizzato - tecnicamente - da Google per contenuti duplicati, ma può danneggiare il posizionamento sui motori di ricerca. Questo perché è difficile per i motori di ricerca capire quale posizione del contenuto sia la più rilevante. Di conseguenza, nessuno degli URL finisce per avere un posizionamento elevato e nessuna singola pagina ottiene la massima visibilità di ricerca possibile.

Google dovrebbe essere in grado di rilevare contenuti duplicati, raggruppare tutti gli URL in un cluster e quindi scegliere il risultato migliore. Ma questo non funziona sempre correttamente e potrebbe essere scelto l'URL sbagliato. In definitiva, i proprietari di siti Web potrebbero notare classifiche più basse o traffico ridotto a causa di contenuti duplicati. Fortunatamente, ci sono modi per impedire che questo genere di cose accada ai tuoi siti.

Perché il contenuto duplicato è un problema

I contenuti duplicati influiscono sui motori di ricerca e sui proprietari dei siti in diversi modi:

  • I motori di ricerca non sanno quali URL includere o meno negli indici.
  • I motori di ricerca non sanno se le metriche di collegamento (autorità, fiducia, ecc.) devono essere indirizzate tutte a una pagina oa più pagine.
  • Non è chiaro quale URL classificare nelle SERP (pagine dei risultati dei motori di ricerca) e talvolta l'URL indesiderato può superare quello legittimo.
  • L'equità dei link (l'autorità e il valore che una pagina passa a un'altra) è diluita perché altri siti che vogliono includere un backlink al contenuto devono scegliere tra più URL. L'equità del collegamento viene quindi distribuita sui duplicati invece di concentrarsi su una sola pagina.

Anche con gli URL che indirizzano tutti al tuo sito Web, se uno ha attributi di collegamento che lo fanno sembrare ostile agli utenti e Google classifica quella versione dell'URL anziché l'originale, le persone potrebbero non voler fare clic su di esso. Ad esempio, yoursite.com/besttrails sembra molto più invitante di yoursite.com/besttrails/?utm_content=buffer&utm_medium=social . Ma se Google si classifica al secondo posto perché pensa che sia la versione principale del contenuto duplicato, le persone non faranno clic su di esso perché è intimidatorio e dall'aspetto inaffidabile.

Inoltre, il "budget" di scansione del tuo sito web si esaurisce quando hai contenuti duplicati. Google esegue la scansione dei siti Web per trovare nuovi contenuti e Google esegue nuovamente la scansione dei siti periodicamente per vedere se c'è qualcosa di nuovo. Se hai contenuti duplicati sul tuo sito, significa che ci vorrà più tempo per eseguire la scansione completa di tutte le pagine. Ciò può portare a un calendario più lento per Google per indicizzare e reindicizzare le pagine e mostrarle nei risultati di ricerca.

Norme sui contenuti duplicati di Google

Secondo Google:

Il contenuto duplicato su un sito non è motivo di azione su quel sito a meno che non sembri che l'intento del contenuto duplicato sia ingannevole e manipolare i risultati dei motori di ricerca.

Tuttavia, mentre Google non penalizza i proprietari di siti Web per la maggior parte dei casi di contenuti duplicati, la società continua dicendo:

Nei rari casi in cui Google percepisce che contenuti duplicati possono essere mostrati con l'intento di manipolare le nostre classifiche e ingannare i nostri utenti, apporteremo anche le opportune modifiche all'indicizzazione e alla classifica dei siti coinvolti. Di conseguenza, il posizionamento del sito potrebbe risentirne, oppure il sito potrebbe essere rimosso completamente dall'indice di Google, nel qual caso non apparirà più nei risultati di ricerca.

Cosa potrebbe considerare Google un'intenzione di ingannare gli utenti e/o manipolare il posizionamento nei motori di ricerca? Creazione intenzionale di domini, sottodomini e pagine con contenuti duplicati. Inoltre, pubblicare contenuti raschiati, soprattutto se non aggiungi nient'altro di valore.

Ricorda questo, però: anche se Google non ti penalizzerà ufficialmente o considererà dannosi i tuoi contenuti duplicati, può comunque danneggiare i tuoi sforzi SEO. Se Google ha smesso di classificare il tuo sito a causa di problemi di contenuti duplicati, puoi inviare una richiesta di riconsiderazione una volta che i problemi sono stati risolti.

Come accadono i contenuti duplicati

Di solito, il proprietario di un sito Web non crea di proposito contenuti duplicati. Ecco perché Google non lo penalizza troppo drasticamente. Questa è anche la differenza tra contenuto copiato e contenuto duplicato .

Il contenuto copiato è quando prendi la formulazione esatta da un altro sito Web e lo pubblichi da solo. Il contenuto duplicato è quando accidentalmente o inconsapevolmente hai un'altra versione del tuo contenuto da qualche altra parte online.

Qui, esamineremo i modi comuni in cui i contenuti duplicati finiscono online. Successivamente, parleremo di come risolvere il problema dei contenuti duplicati.

Pagine HTTP, HTTPS, WWW e non WWW

Se il tuo sito ha due versioni diverse, ad esempio www.yoursite.com e yoursite.com , lo stesso contenuto sarà su entrambe le versioni del sito, il che significa che sono presenti contenuti duplicati. Lo stesso vale per i siti http:// e https:// .

Impaginazione

L'impaginazione può verificarsi quando un articolo o la sezione dei commenti di un post del blog si estende su più pagine. O forse c'è una galleria di immagini con ognuna su una pagina separata. Questo tipo di duplicazione può verificarsi anche su una pagina con scorrimento infinito, in cui il nuovo contenuto viene popolato mentre l'utente continua a scorrere verso il basso.

Variazioni URL

I parametri URL, come i codici di monitoraggio , possono creare involontariamente contenuti duplicati. Ad esempio, una pagina del tuo sito web potrebbe essere yoursite.com/sneakers , ma se hai un codice di monitoraggio per vedere da dove le persone hanno fatto clic, potrebbe assomigliare a yoursite.com/newsletter?utm_source=newsletter . Anche se Google e altri motori di ricerca non considerano questo contenuto duplicato, potresti dover gestire parametri separati creando più voci anche nelle tue piattaforme di analisi.

Gli ID di sessione possono avere lo stesso effetto. Una sessione è una breve cronologia di ciò che un visitatore fa su un sito Web, ad esempio quando aggiunge qualcosa al carrello. La sessione rimane quando la persona fa clic su altre pagine in modo che il carrello rimanga intatto. L'ID sessione è il modificatore univoco per quella sessione e talvolta è memorizzato nell'URL (tuosito.com?sessionId=jow8082345hnfn8456). Questo può creare più URL diversi con lo stesso contenuto della pagina.

Lo stesso può accadere se si dispone di una versione ottimizzata per la stampante o di una versione mobile del contenuto. I motori di ricerca penseranno che ci siano più pagine dello stesso contenuto. Perché ci sono.

Questo è un evento comune anche sui siti di e-commerce, in particolare quando gli utenti filtrano i risultati di ricerca. L'URL rimane più o meno lo stesso, ma con un'aggiunta alla fine, come la dimensione o il colore. Questa è chiamata navigazione con facet o filtrata . Il contenuto delle pagine è quasi lo stesso, ma gli URL sono unici.

Anche le barre finali possono rendere un URL univoco. Ad esempio, tuosito.com/pagina e tuosito.com/pagina/ . Il modo più rapido per vedere se ciò causa un problema di contenuto duplicato è accedere a entrambe le versioni di una pagina. Se uno non si carica, non devi preoccuparti. Altrimenti, il reindirizzamento è un'opzione (ne parleremo tra poco).

Altri modi in cui accadono contenuti duplicati

  • Descrizioni dei prodotti di e-commerce: è comune che diversi siti di e-commerce abbiano contenuti duplicati quando si utilizza la descrizione di un prodotto del produttore.
  • Pagine di allegati di immagini: quando ogni allegato di immagini ha una pagina separata, questo può creare contenuti duplicati.
  • Pagine dei risultati di ricerca: aggiungono un parametro all'URL di ricerca, come yoursite.com?q=search-term .
  • Ambiente di staging: questa è una versione duplicata del tuo sito utilizzata per i test.
  • Pagine di tag e categorie: quando utilizzi un tag o una categoria, WordPress creerà automaticamente pagine di tag e categorie dedicate. Questo a volte può causare contenuti duplicati quando una pagina ha più categorie o tag.

Come risolvere il contenuto duplicato

Per alcuni dei problemi più piccoli sopra elencati, potresti trovare un'impostazione nel tuo plug-in SEO che ti aiuterà. Ad esempio, nel plug-in Yoast, puoi disabilitare gli URL delle pagine degli allegati per le immagini:

contenuto duplicato

WordPress ha anche un'opzione integrata per disattivare l'impaginazione dei commenti:

contenuto duplicato

In caso contrario, tuttavia, le seguenti pratiche sono i modi principali per risolvere i problemi di contenuto duplicato.

1. Trova il contenuto duplicato

Innanzitutto, devi trovare istanze di contenuto duplicato. Strumenti come Ahrefs Site Audit e Google Search Console possono eseguire la scansione del tuo sito e farti sapere se sono presenti avvisi sui contenuti duplicati.

Se stai cercando di trovare contenuti duplicati sul tuo sito per una parola chiave specifica, puoi digitarlo in Google:

site:yoursite.com intitle: parola chiave

Vedrai quindi tutte le pagine del tuo sito Web che includono quella parola chiave. Una buona regola pratica è cercare una parola chiave specifica in modo che sia più facile scorrere i risultati.

Se pensi che ci sia un articolo in particolare che è stato duplicato altrove online, puoi utilizzare un controllo del plagio come Grammarly o Copyscape per trovare altri esempi di frasi a corrispondenza esatta. Oppure puoi incollare una o due frasi intere in Google per vedere se viene visualizzata da qualche parte diversa dal tuo sito.

2. Modifica l'URL del contenuto tramite Canonicalization

Una volta che sai che ci sono contenuti duplicati online, è tempo di determinare quale pagina è quella principale da mantenere.

Canonizzi quella pagina principale per i motori di ricerca. La canonizzazione dice ai motori di ricerca che un URL è una versione principale di una pagina, che questa pagina dovrebbe apparire nei risultati di ricerca invece di eventuali duplicati che il motore potrebbe incontrare. Ecco due modi per canonizzare il contenuto:

301 Reindirizzamento

Crea un reindirizzamento 301 dalle pagine duplicate alla pagina principale. Le pagine duplicate smetteranno di competere tra loro e la pagina principale diventerà più popolare e rilevante, il che significa che inizierà a classificarsi più in alto. Abbiamo un articolo su come creare reindirizzamenti con WordPress per aiutarti.

Ottieni anche il vantaggio aggiuntivo di qualsiasi autorità di link juice/pagina dal trasferimento dell'URL reindirizzato anche al nuovo target.

Rel = Attributo “canonico”.

Questo attributo consente ai motori di ricerca di sapere che una pagina è una copia di un URL e che eventuali collegamenti, metriche e potere di ranking devono essere applicati all'URL principale specificato, non alla pagina copiata. L'attributo deve essere incluso nell'intestazione HTML di ogni pagina duplicata con un collegamento alla pagina originale su cui si desidera concentrarsi. Google ha una documentazione che approfondisce come aggiungere l'attributo e abbiamo contenuti più dettagliati sugli URL canonici e su WordPress per integrarlo.

Per evitare lo scraping dei contenuti, ovvero quando i bot copiano, scaricano e ripubblicano i contenuti del tuo sito web, aggiungi l' attributo rel="canonical" alle tue pagine web. L'attributo sarà autoreferenziale: punterà all'URL su cui si trova attualmente. Anche se il contenuto viene cancellato, fintanto che i bot portano il codice HTML completo, la tua versione sarà comunque considerata l'originale.

3. Modifica gli URL del tuo dominio utilizzando la Google Search Console

Google Search Console ti consente di designare il dominio preferito del tuo sito web, ad esempio tuosito.com invece di www.tuosito.com . Puoi anche far sapere a Googlebot come gestire diversi parametri URL. Ciò potrebbe risolvere alcuni o tutti i problemi relativi ai contenuti duplicati. Ma solo con Google. Non con altri motori di ricerca. Piattaforme come Bing e Yandex hanno i propri strumenti per i webmaster.

Altri suggerimenti per prevenire o correggere i contenuti duplicati

  1. Quando aggiungi link interni, utilizza la stessa versione del dominio, con o senza www , ad esempio. Inoltre, usa sempre la stessa versione di una pagina con o senza una barra finale. Non importa quale struttura scegli, ma sii coerente con essa.
  2. Se stai organizzando il contenuto sindacato, il sito Web che sta utilizzando il contenuto dovrebbe aggiungere un backlink al contenuto originale. Non una variazione dell'URL. Ma l'URL originale, principale, canonico.
  3. Non pubblicare pagine vuote come segnaposto. Ogni pagina vuota verrà indicizzata, il che può far pensare al motore di ricerca che hai molti contenuti duplicati.
  4. Riduci la quantità di contenuti simili che hai. Ad esempio, supponiamo che tu abbia un sito Web legale e ti rivolgi a diverse contee nella tua zona. Ogni pagina specifica della contea può includere informazioni simili se si parla dello stesso argomento di legge, come la legge sulle lesioni personali. Un'opzione è unire la pagina in una più grande di entrambe le contee, oppure puoi variare maggiormente il contenuto per mantenere le pagine separate.

Considerazioni finali sui contenuti duplicati

Trovare una piccola quantità di contenuti duplicati di solito non è motivo di preoccupazione. Ma i problemi tecnici che hanno un impatto su centinaia o migliaia di pagine devono essere affrontati. Inoltre, non farà male risolvere tutti i problemi relativi ai contenuti duplicati. Questa è solo una parte della gestione di un sito ordinato e ad alte prestazioni. Dopotutto, l'ultima cosa che vuoi fare è competere con te stesso e rovinare la tua classifica a causa dei contenuti su cui hai il controllo totale.

Una volta individuati i contenuti duplicati, potresti anche voler consultare il nostro articolo su come gestire la cannibalizzazione delle parole chiave per prevenire problemi di parole chiave duplicate.

Come sei riuscito a gestire i contenuti duplicati sui tuoi siti? Parliamo di strategie del mondo reale nei commenti!

Immagine in evidenza dell'articolo di NikAndr / shutterstock.com