Czym dokładnie jest duplicate content? Dlaczego należy go unikać?

Czym dokładnie jest duplicate content? Dlaczego należy go unikać?

Jednym z kluczowych czynników rankingowych dla wyszukiwarki Google jest treść. Powinna być wysokiej jakości, merytoryczna, zoptymalizowana pod słowa kluczowe oraz spełniać oczekiwania użytkownika. Absolutną podstawą, której oczekuje algorytm wyszukiwarki, jest unikatowość tekstu. Dowiedz się, czym jest duplicate content i co możesz zrobić, aby uniknąć takiej treści na stronie.

Co to jest duplicate content?

Pojęcie to ma zastosowanie w przypadku, gdy treść znajdująca się na Twojej stronie jest powielona. To znaczy, że znajduje się na różnych witrynach i wtedy masz do czynienia z duplikacją zewnętrzną, ale taki sam content może być również wykorzystywany na wielu podstronach serwisów i wtedy jest to duplikacja wewnętrzna. Oba przypadki są sytuacjami niepożądanymi dla Twojej strony i powinieneś starać się ich unikać. Z duplikacją zewnętrzną możesz mieć do czynienia z różnych powodów:

  • Wielokrotne wykorzystanie tej samej publikacji zewnętrznej – przygotowałeś artykuł, który chcesz opublikować na innej stronie, aby pozyskać linki albo zainteresowanie Twoimi produktami. Zrobiłeś jednak tak, że dla oszczędności ten sam tekst pojawił się na wielu stronach. Innym przypadkiem takiej duplikacji jest dodanie artykułu ze strony w serwisach społecznościowych. Lepiej w takich przypadkach dodawaj w nich unikatową zajawkę.
  • Ktoś wykorzystał Twoje treści – niestety, ale kradzież artykułów i innego contentu w sieci jest codziennością. Istnieją nawet roboty, które automatycznie kopiują publikacje oraz tworzą z nich strony WWW. Są i takie, które od razu tłumaczą je na inne języki i budują na tej podstawie serwisy.
  • Copywriter wstawił tekst na swoją stronę – nie każdy, kto zajmuje się tworzeniem contentu, ma świadomość, jak działa algorytm wyszukiwarki. Może się zdarzyć, że niedoświadczony autor chciał się pochwalić swoją twórczością i zamiast wstawić link do napisanego artykułu, umieścił go w całości na swojej stronie.
  • Wykorzystałeś opisy producenta – w wielu branżach jest to standardowe działanie, choćby w przypadku książek czy filmów. Po prostu twórcy strony nie dają rady nadążyć z tworzeniem unikatowego contentu. Efekt? Wiele witryn ma dokładnie taką samą treść.
  • Informacja prasowa – taki tekst rozsyłasz do odbiorców, ale też wstawiasz na swoją stronę, skąd zainteresowani mogą go pobrać. Efekt? Ten sam content może się znaleźć w wielu serwisach w sieci.
  • Pozostawienie strony testowej – osoba, która pracowała przy tworzeniu witryny, prawdopodobnie działała na swoim serwerze. Problem pojawia się wtedy, gdy nie zablokowała indeksacji witryny, nie usunęła jej z hostingu po zakończeniu realizacji i tym samym ten serwis dostępny jest teraz pod dwoma adresami.

Nie inaczej sytuacja wygląda w przypadku duplikacji wewnętrznej. Ona również może wynikać z wielu przyczyn, ale w tym przypadku jest to w pełni zależne od Ciebie i Twojej strony. Oto przykładowe przyczyny wewnętrznego duplicate content:

  • Dwa razy dodałeś ten sam materiał – nie zauważyłeś, że artykuł już znajduje się w serwisie i umieściłeś go ponownie.
  • Brak przekierowania na jeden URL strony – dla algorytmu Google adresy https://www.grupa-icea.pl/, http://www.grupa-icea.pl/ i https://grupa-icea.pl/ są różne. Zatem robot będzie widzieć 3 serwisy, które są zduplikowane. Jednym z pierwszych kroków w optymalizacji strony jest przekierowanie 301 adresu na jeden – najczęściej w wersji bez WWW. Popularne systemy CMS mają takie przekierowanie ustawione automatycznie.
  • Nieodpowiednia struktura adresów URL – załóżmy, że masz w swoim sklepie produkt, który przypisałeś do dwóch kategorii. Jeśli struktura URL-i została źle zaplanowana, to efekt może być taki, że dokładnie ta sama rzecz będzie się znajdować pod dwoma adresami, np. twojastrona.pl/kategoria1/nazwa-produktu i twojastrona.pl/kategoria2/nazwa-produktu. To prosty sposób na duplikację treści.
  • Opis kategorii na wielu podstronach – dodanie takich treści jest słusznym krokiem, ale problem pojawia się wtedy, gdy ten sam content znajduje się na wielu podstronach paginacji. W takim przypadku warto skorzystać z rel=canonical wskazującego na stronę główną kategorii, ewentualnie wyłącz indeksację kolejnych stron paginacji.
  • Indeksowanie parametrów UTM – być może korzystasz z UTM, aby mierzyć skuteczność prowadzonych działań marketingowych. W takim przypadku internauci trafiają na stronę docelową po wpisaniu np. http://twojastrona.pl/?utm_source=google&utm_medium=cpc&utm_campaign=swieta Taki adres również może być zindeksowany przez Google i spowodować duplikację treści.

Każda forma duplikacji wymaga Twojej interwencji. Najpierw musisz jednak wiedzieć, jak wykryć problem.

Jak sprawdzić duplicate content?

Warto kontrolować zarówno kwestię zewnętrznej, jak i wewnętrznej duplikacji, ale niestety nie jest to łatwe zadanie. Możesz próbować sprawdzać to ręcznie, ale masz również do dyspozycji liczne narzędzia. Nie przeraź się jednak wynikami Twojej strony – według Raventools aż 29 proc. treści w sieci to duplicate content.


Źródło: https://raventools.com/blog/duplicate-content/, 15.12.2021

Jak zatem możesz sprawdzić, czy duplikacja treści dotyczy Twojego serwisu? Oto przykładowe metody:

  • Sprawdź tekst w Google – skopiuj z Twojej strony zdanie, najlepiej znajdujące się na początku artykułu, i wyślij takie zapytanie do wyszukiwarki. Obowiązkowo umieść je w cudzysłowie. Jeśli w wynikach zobaczysz inną witrynę niż Twoja z takim samym tekstem, to prawdopodobnie trafiłeś na duplicate content.
  • Siteliner – to narzędzie, dzięki któremu wykryjesz wewnętrzną duplikację treści. Możliwości wersji bezpłatnej są ograniczone, ale i tak możesz dzięki niej znaleźć ewentualne problemy. Wprowadź adres serwisu i poczekaj na wynik. Następnie możesz kliknąć „here”, a wtedy zobaczysz, na których podstronach narzędzie wykryło duplicate content.


Źródło: https://www.siteliner.com/, 15.12.2021

  • Copyscape – to narzędzie, za pomocą którego wykryjesz duplikację zewnętrzną. Wystarczy, że podasz adres strony, a rozwiązanie to sprawdzi, czy Twoje treści znajdują się na innych stronach.


Źródło: https://www.copyscape.com/, 15.12.2021

  • Wykorzystaj komendy obsługiwane przez Google – przeróżne problemy na stronie możesz wykryć za pomocą zapytań z odpowiednimi komendami. Jednym z częstych problemów jest nieprzekierowywanie wszystkich linków na stronie po zmianie adresu z http:// na https://. Żeby wykryć takie błędy, skorzystaj z następującego zapytania:

site:twojastrona.pl -inurl:https

Na podobnej zasadzie możesz znaleźć adresy zindeksowane w Google z parametrami utm lub innymi. Wykorzystaj do tego następujące zapytanie:

site:twojastrona.pl inurl:utm

  • Google Search Console – po zalogowaniu się do GSC znajdź opcję „Stan”. Tam zobaczysz m.in. strony wykluczone z indeksowania, a jedną z wymienionych przyczyn jest „Duplikat, przesłany URL nie został oznaczony jako strona kanoniczna”. Kliknij tę opcję i zobacz, jakich stron to dotyczy. Nie w każdym przypadku musi to oznaczać problem. Pojawiają się tam m.in. podstrony przekierowane za pomocą 301, gdzie wszystko może być w porządku.


Źródło: Google Search Console, 15.12.2021

Czy duplicate content szkodzi stronie?

Google sugeruje, aby treści na Twojej witrynie były wysokiej jakości, merytoryczne i unikatowe. Zdecydowanie najlepszym krokiem będzie postawienie właśnie na taki content. Są jednak takie branże, w których na wysokich pozycjach znajdziesz witryny, których treści są skopiowane – często chodzi o wspomniane opisy książek. Czy to oznacza, że Ty również możesz sobie pozwolić na wykorzystanie takich treści?

Pamiętaj, że po pierwsze wykorzystanie cudzego contentu wymaga zgody tej osoby. Druga kwestia – fakt, że dana witryna ma duplicate content, nie oznacza, że w jej przypadku ta treść nie wpływa negatywnie na ocenę tej strony przez algorytm Google. Pamiętaj, że o pozycji w wynikach wyszukiwania decyduje wiele czynników. Być może na niższych znajduje się serwis z unikatowym opisem, ale przegrywa choćby ze względu na słabszy profil odnośników, nieodpowiednie linkowanie wewnętrzne, a w dodatku bardzo wolno się ładuje. Zatem sama duplikacja nie spowoduje, że strona na pewno będzie zajmować niską pozycję na dane zapytanie – algorytm Google weźmie pod uwagę wiele czynników i na tej podstawie ustali pozycję witryny. Natomiast ogólnie duplikacja jest tym, co powinieneś eliminować ze swojej strony.

Jak usunąć duplicate content w serwisie?

Wiesz już, co to znaczy duplicate content. Jak możesz sobie poradzić z tym problemem? Wszystko zależy od tego, jaka jest przyczyna duplikacji. Oto przykładowe sposoby:

  • Przekierowanie 301 – ma ono zastosowanie do ustawienia jednego adresu strony WWW. Wykorzystaj go również wtedy, gdy widzisz, że użyłeś tych samych treści na różnych podstronach. Wtedy przekieruj jedną na drugą, a dzięki temu przeniesiesz ewentualną moc SEO tej podstrony.
  • Wyłącz indeksowanie strony – jeśli nie chcesz, aby dany materiał był dostępny w Google, to umieść w sekcji <head> tag noindex, a dokładnie kod: <meta name=”robots” content=”noindex”>.
  • Ustaw link kanoniczny – za jego pomocą wskazujesz robotowi Google, który adres dla danej treści jest źródłowym. Najczęściej spotkasz się z umieszczeniem w nim odnośnika do tej samej strony, na której znajduje się rel=”canonical”, ale może on również wskazywać na inne adresy URL. Ma to zastosowanie m.in. w przypadku dostępności w sklepie różnych wariantów kolorystycznych tego samego produktu. Każdy z nich powinien wskazywać na jedną stronę z unikatowym opisem – chyba że przygotujesz je dla wszystkich takich stron. Przykładowy kod wygląda następująco: <link rel=”canonical” href=”http://www.twoja-strona.pl/strona-zrodlowa.html” />.
  • Poproś o usunięcie treści – jeśli doszło do kradzieży contentu, to powinieneś spróbować skontaktować się z właścicielem witryny, który się tego dopuścił. Nie jest jednak powiedziane, że uzyskasz jakikolwiek kontakt – często takie treści trafiają na witryny, które są generowanie w pełni automatycznie.
  • Zgłoś wątpliwości dotyczące praw autorskich do Google – skorzystaj z możliwości zgłoszenia materiału do Google, wskaż na kwestię praw autorskich, a być może po rozpatrzeniu wniosku ta treść zostanie na stałe wyindeksowana.


Źródło: https://support.google.com/legal/troubleshooter/1114905?hl=pl, 15.12.2021

Duplicate content – koniecznie reaguj

Staraj się w miarę możliwość kontrolować duplikację contentu i rozwiązywać problemy. Nie jest powiedziane, że ten problem spowoduje obniżenie widoczności Twojej strony, ale niestety – może się tak stać. Dlatego próbuj jak najszybciej rozwiązywać duplikację.

Zobacz również
Grupa iCEA
Grupa iCEA
Ostatnie wpisy

    Zastanawiasz się, dlaczego Twoja strona NIE SPRZEDAJE?
    Umów się na bezpłatną konsultację SEO i dowiedz się, jak możemy poprawić Twoje wyniki sprzedażowe.
    Oceń tekst
    Średnia ocen 5/5 - Liczba ocen: 1

    Twój adres e-mail nie zostanie opublikowany.

    Chcesz zobaczyć o czym jeszcze pisaliśmy?

    Nazwa domeny a pozycjonowanie

    Nazwa domeny a pozycjonowanie

    W świecie SEO chodzą słuchy, że domena nie ma żadnego wpływu na pozycjonowanie strony. Z tego wpisu dowiesz się, czy to prawda, czy tylko internetowa legenda…
    Czy pozycjonowanie sklepu internetowego się opłaca?

    Czy pozycjonowanie sklepu internetowego się opłaca?

    Sklepy internetowe to wygodna forma zakupów. Rocznie liczba sklepów online wzrasta o 25%. Czy przy tak dużej konkurencji warto inwestować w pozycjonowanie i czy się ono opłaca?
    Czym jest kanibalizacja słów kluczowych? Jak jej uniknąć?

    Czym jest kanibalizacja słów kluczowych? Jak jej uniknąć?

    Jednym z zagrożeń, które mogą pojawić się przy pozycjonowaniu strony, jest kanibalizacja fraz kluczowych. Dowiedz się, w jakich sytuacjach takie zjawisko stanowi problem, jak je rozpoznać i co zrobić, by go uniknąć.
    Bezpłatny audyt

      Powiedz nam jaki zakres usług Cię interesuje,
      a skontaktujemy się w odpowiednim dla Ciebie terminie

        Jeżeli chciałbyś dołączyć do naszego zespółu, ale masz wątpliwości - skontaktuj się z nami.
        Wypełnij formularz kontaktowy: