Ghidul suprem pentru conținut duplicat și SEO
Publicat: 2022-02-13Conținutul duplicat se referă la conținutul care apare online în mai multe locuri. Prin „loc”, înțelegem o pagină cu o adresă URL unică. Poate fi exact același conținut sau aproape exact același, și poate fi pe același site sau pe alt site.
Este posibil să nu fiți penalizat – din punct de vedere tehnic – de Google pentru conținut duplicat, dar vă poate afecta clasarea motorului de căutare. Asta pentru că este greu pentru motoarele de căutare să-și dea seama care locație a conținutului este cea mai relevantă. Drept urmare, niciuna dintre adresele URL nu ajunge să se claseze înalt și nicio pagină nu obține cea mai mare vizibilitate posibilă în căutare.
Google ar trebui să fie capabil să detecteze conținut duplicat, să grupeze toate adresele URL într-un singur cluster și apoi să aleagă cel mai bun rezultat. Dar acest lucru nu funcționează întotdeauna corect și poate fi aleasă adresa URL greșită. În cele din urmă, proprietarii de site-uri web pot observa clasamente mai scăzute sau trafic redus din cauza conținutului duplicat. Din fericire, există modalități de a preveni astfel de lucruri să se întâmple site-urilor dvs.
De ce conținutul duplicat este o problemă
Conținutul duplicat afectează motoarele de căutare și proprietarii de site-uri în mai multe moduri:
- Motoarele de căutare nu știu ce URL-uri să includă sau nu în indexuri.
- Motoarele de căutare nu știu dacă valorile linkurilor (autoritate, încredere etc.) ar trebui direcționate către o singură pagină sau către mai multe pagini.
- Nu este clar ce adresă URL să se claseze în SERP-uri (paginile cu rezultate ale motoarelor de căutare), iar uneori adresa URL nedorită o poate depăși pe cea legitimă.
- Echitatea linkurilor (autoritatea și valoarea pe care o pagină le transmite alteia) este diluată deoarece alte site-uri care doresc să includă un backlink către conținut trebuie să aleagă între mai multe adrese URL. Echitatea link-urilor este apoi răspândită în duplicate în loc să se concentreze doar pe o singură pagină.
Chiar și cu adrese URL care direcţionează toate către site-ul dvs. web, dacă unul are atribute de link care îl fac să pară neprietenos pentru utilizatori, iar Google clasifică acea versiune a adresei URL în loc de cea originală, este posibil ca oamenii să nu dorească să facă clic pe ea. De exemplu, yoursite.com/besttrails arată mult mai primitor decât yoursite.com/besttrails/?utm_content=buffer&utm_medium=social . Dar dacă Google îl clasează pe al doilea pentru că consideră că aceasta este versiunea principală a conținutului duplicat, oamenii nu vor face clic pe el, deoarece este intimidant și nu are un aspect de încredere.
De asemenea, „bugetul” de accesare cu crawlere al site-ului dvs. web se epuizează atunci când aveți conținut duplicat. Google accesează cu crawlere site-urile web pentru a găsi conținut nou, iar Google accesează din nou site-urile periodic pentru a vedea dacă există ceva nou. Dacă aveți conținut duplicat pe site-ul dvs., aceasta înseamnă că va dura mai mult timp pentru a accesa cu crawlere toate paginile. Acest lucru poate duce la un orar mai lent pentru ca Google să indexeze și să reindexeze paginile și să le afișeze în rezultatele căutării.
Politica Google privind conținutul duplicat
Potrivit Google:
Conținutul duplicat de pe un site nu este un motiv de acțiune pe site-ul respectiv decât dacă se pare că intenția conținutului duplicat este de a fi înșelător și de a manipula rezultatele motorului de căutare.
Cu toate acestea, deși Google nu penalizează proprietarii de site-uri web pentru majoritatea cazurilor de conținut duplicat, compania continuă să spună:
În rarele cazuri în care Google percepe că conținutul duplicat poate fi afișat cu intenția de a ne manipula clasamentele și de a ne înșela utilizatorii, vom face, de asemenea, ajustările corespunzătoare în indexarea și clasarea site-urilor implicate. Ca urmare, clasarea site-ului poate avea de suferit, sau site-ul ar putea fi eliminat în întregime din indexul Google, caz în care nu va mai apărea în rezultatele căutării.
Ce ar putea considera Google o intenție de a înșela utilizatorii și/sau de a manipula clasamentele motoarelor de căutare? Crearea în mod intenționat de domenii, subdomenii și pagini cu conținut duplicat. De asemenea, publicarea conținutului răzuit – mai ales dacă nu adăugați nimic altceva de valoare.
Totuși, țineți minte acest lucru: chiar dacă Google nu vă va penaliza oficial sau nu vă va considera conținutul duplicat rău intenționat, aceasta vă poate afecta eforturile SEO. Dacă Google a încetat să clasifice site-ul dvs. din cauza unor probleme de conținut duplicat, puteți trimite o solicitare de reevaluare odată ce problemele au fost rezolvate.
Cum se întâmplă conținutul duplicat
De obicei, proprietarul unui site web nu va crea în mod intenționat conținut duplicat. De aceea Google nu o penalizează prea drastic. Aceasta este și diferența dintre conținutul copiat și conținutul duplicat .
Conținutul copiat este atunci când iei textul exact de pe un alt site web și îl publici pe cont propriu. Conținut duplicat este atunci când aveți accidental sau fără să știți o altă versiune a propriului conținut în altă parte online.
Aici, vom analiza modalitățile comune în care conținutul duplicat ajunge online. După aceea, vom vorbi despre cum să rezolvăm problema conținutului duplicat.
Pagini HTTP, HTTPS, WWW și non-WWW
Dacă site-ul tău are două versiuni diferite – www.site-ul tău.com și site-ul tău, de exemplu – același conținut va fi pe ambele versiuni ale site-ului, ceea ce înseamnă că există conținut duplicat. Același lucru este valabil și pentru site-urile http:// și https:// .
Paginare
Paginarea se poate întâmpla atunci când un articol sau secțiunea de comentarii a unei postări de blog se întinde pe mai multe pagini. Sau, poate există o galerie de imagini cu fiecare pe o pagină separată. Acest tip de duplicare se poate întâmpla și pe o pagină cu defilare infinită, unde se populează conținut nou pe măsură ce utilizatorul continuă să deruleze în jos.
Variante URL
Parametrii URL, cum ar fi codurile de urmărire , pot crea în mod neintenționat conținut duplicat. De exemplu, o pagină de pe site-ul tău web poate fi site-ul tău.com /adidași , dar dacă ai un cod de urmărire pentru a vedea de unde au făcut clic oamenii, ar putea arăta ca site-ul tău.com /newsletter?utm_source=newsletter . Chiar dacă Google și alte motoare de căutare nu iau în considerare acest conținut duplicat, este posibil să trebuiască să vă ocupați de parametrii separați care creează mai multe intrări în platformele dvs. de analiză.
ID-urile de sesiune pot avea același efect. O sesiune este o scurtă istorie a ceea ce face un vizitator pe un site web, cum ar fi atunci când adaugă ceva în coșul de cumpărături. Sesiunea rămâne atunci când persoana face clic pe alte pagini, astfel încât coșul său să rămână intact. ID-ul sesiunii este modificatorul unic pentru acea sesiune și uneori este stocat în adresa URL (yoursite.com?sessionId=jow8082345hnfn8456). Acest lucru poate crea mai multe adrese URL diferite cu același conținut de pagină.
Același lucru se poate întâmpla dacă aveți o versiune a conținutului pentru imprimantă sau pentru dispozitive mobile . Motoarele de căutare vor crede că există mai multe pagini cu același conținut. Pentru ca sunt acolo.
Aceasta este, de asemenea, o apariție comună pe site-urile de comerț electronic, în special atunci când utilizatorii filtrează rezultatele căutării. Adresa URL rămâne aproape aceeași, dar cu un addendum la sfârșit, cum ar fi dimensiunea sau culoarea. Aceasta se numește navigare fațetă sau filtrată . Conținutul paginilor este aproape același, dar adresele URL sunt unice.
Chiar și barele oblice finale pot face un URL unic. De exemplu, site- ul tău.com /pagina și site- ul tău.com /pagina/ . Cea mai rapidă modalitate de a vedea dacă acest lucru cauzează o problemă de conținut duplicat este să accesați ambele versiuni ale unei pagini. Dacă unul nu se încarcă, nu trebuie să vă faceți griji. În caz contrar, redirecționarea este o opțiune (mai multe despre asta într-un pic).

Mai multe moduri în care se întâmplă conținutul duplicat
- Descrieri de produse de comerț electronic: este obișnuit ca diferite site-uri de comerț electronic să aibă conținut duplicat atunci când folosesc descrierea producătorului a unui produs.
- Pagini atașate imagini: când fiecare atașament imagine are o pagină separată, aceasta poate crea conținut duplicat.
- Pagini cu rezultatele căutării: acestea adaugă un parametru la adresa URL de căutare, cum ar fi site-ul dvs.com?q=termen-căutare .
- Mediu de pregătire: aceasta este o versiune duplicată a site-ului dvs. folosită pentru testare.
- Pagini de etichete și categorii: atunci când utilizați o etichetă sau o categorie, WordPress va crea automat pagini de etichete și categorii dedicate. Acest lucru poate provoca uneori conținut duplicat atunci când o pagină are mai multe categorii sau etichete.
Cum să remediați conținutul duplicat
Pentru unele dintre problemele mai mici enumerate mai sus, este posibil să găsiți o setare în pluginul dvs. SEO care vă va ajuta. De exemplu, în pluginul Yoast, puteți dezactiva adresele URL ale paginilor atașate pentru imagini:
WordPress are și o opțiune încorporată pentru a dezactiva paginarea comentariilor:
În caz contrar, totuși, următoarele practici sunt principalele modalități de a rezolva problemele de conținut duplicat.
1. Găsiți conținutul duplicat
În primul rând, trebuie să găsiți cazuri de conținut duplicat. Instrumente precum Auditul site-ului Ahrefs și Google Search Console vă pot accesa cu crawlere site-ul și vă pot informa dacă există avertismente de conținut duplicat.
Dacă încercați să găsiți conținut duplicat pe site-ul dvs. pentru un anumit cuvânt cheie, puteți introduce acest lucru pe Google:
site:yoursite.com intitle: cuvânt cheie
Veți vedea apoi toate paginile de pe site-ul dvs. web care includ acel cuvânt cheie. O regulă de bază bună este să căutați un anumit cuvânt cheie, astfel încât să fie mai ușor să parcurgeți rezultatele.
Dacă credeți că există un anumit articol care a fost duplicat în altă parte online, puteți utiliza un verificator de plagiat precum Grammarly sau Copyscape pentru a găsi alte exemple de propoziții cu potrivire exactă. Sau puteți lipi o propoziție completă sau două în Google pentru a vedea dacă apare în altă parte decât pe site-ul dvs.
2. Ajustați adresa URL a conținutului prin canonizare
Odată ce știți că există conținut duplicat online, este timpul să determinați ce pagină este cea principală de păstrat.
Canonizezi pagina principală pentru motoarele de căutare. Canonicalizarea le spune motoarelor de căutare că o adresă URL este versiunea principală a unei pagini - că această pagină ar trebui să apară în rezultatele căutării în loc de orice duplicat pe care motorul le poate rula. Iată două moduri de canonizare a conținutului:
301 Redirecționare
Creați o redirecționare 301 de la paginile duplicate către pagina principală. Paginile duplicate vor înceta să concureze unele cu altele, iar pagina principală va deveni mai populară și mai relevantă, ceea ce înseamnă că va începe să se claseze mai sus. Avem un articol despre cum să creați redirecționări cu WordPress pentru a vă ajuta.
De asemenea, beneficiați de avantajul suplimentar al oricărei autorități de legătură/pagină de la adresa URL redirecționată care este transferată și către noua țintă.
Rel=Atribut „canonic”.
Acest atribut le permite motoarelor de căutare să știe că o pagină este o copie a unei adrese URL și că orice linkuri, valori și putere de clasare ar trebui aplicate adresei URL principale specificate, nu paginii copiate. Atributul ar trebui să fie inclus în capul HTML al fiecărei pagini duplicat cu un link către pagina originală pe care doriți să vă concentrați. Google are documentație care aprofundează despre cum să adăugați atributul și avem conținut mai detaliat despre URL-urile canonice și WordPress pentru a completa acest lucru.
Pentru a evita eliminarea conținutului, adică atunci când roboții copiază, descarcă și repostează conținutul site-ului dvs., adăugați atributul rel="canonical" la propriile pagini web. Atributul va fi autoreferențial — va indica adresa URL pe care se află în prezent. Chiar dacă conținutul este răzuit, atâta timp cât boții port codul HTML complet, versiunea dvs. va fi considerată în continuare originală.
3. Ajustați adresele URL ale domeniului dvs. folosind Google Search Console
Google Search Console vă permite să desemnați domeniul preferat al site-ului dvs. web, cum ar fi site-ul dvs., în loc de www.site -ul dvs. , de exemplu. De asemenea, puteți informa Googlebot cum să gestioneze diferiți parametri URL. Acest lucru poate clarifica unele sau toate problemele de conținut duplicat. Dar numai cu Google. Nu cu alte motoare de căutare. Platforme precum Bing și Yandex au propriile lor instrumente pentru webmasteri.
Mai multe sfaturi pentru prevenirea sau remedierea conținutului duplicat
- Când adăugați link-uri interne, utilizați aceeași versiune a domeniului, fie că este cu sau fără www , de exemplu. De asemenea, utilizați întotdeauna aceeași versiune a unei pagini cu sau fără o bară oblică finală. Nu contează ce structură alegi, dar fii consecvent cu ea.
- Dacă aranjați conținut sindicalizat, site-ul web care utilizează conținutul ar trebui să adauge un backlink la conținutul original. Nu este o variație a adresei URL. Dar URL-ul original, principal, canonic.
- Nu publicați pagini goale ca substituenți. Fiecare pagină goală va fi indexată, ceea ce poate face motorul de căutare să creadă că aveți o mulțime de conținut duplicat.
- Reduceți cât de mult conținut similar aveți. De exemplu, să presupunem că aveți un site web legal și vă ocupați de diferite județe din zona dvs. Fiecare pagină specifică județului poate include informații similare dacă vorbiți despre același subiect de lege, cum ar fi legea vătămărilor corporale. O opțiune este să îmbinați pagina într-una mai mare despre ambele județe sau puteți varia mai mult conținutul pentru a păstra paginile separate.
Gânduri finale despre conținutul duplicat
Întâlnirea unei cantități mici de conținut duplicat nu este de obicei un motiv de îngrijorare. Dar problemele tehnice care afectează sute sau mii de pagini trebuie rezolvate. În plus, nu va strica să clarificați toate problemele de conținut duplicat. Aceasta este doar o parte a rulării unui site neaglomerat și performant. La urma urmei, ultimul lucru pe care vrei să-l faci este să concurezi cu tine însuți și să-ți strici propriul clasament din cauza conținutului asupra căruia ai control total.
După ce ați descoperit conținutul duplicat, vă recomandăm să consultați și articolul nostru despre cum să gestionați canibalizarea cuvintelor cheie pentru a preveni problemele cu cuvintele cheie duplicate.
Cum ați reușit să faceți față conținutului duplicat de pe site-urile dvs.? Să vorbim despre strategiile din lumea reală în comentarii!
Imagine prezentată în articol de NikAndr / shutterstock.com