Chắc chắn rằng bạn đang có một câu hỏi lớn về cụm từ “dulicate content” ngay bây giờ. Đây thực sự là vấn đề được không chỉ những người chuyên về Nội dung, Marketing, SEOers, v.v. quan tâm. Đây là chủ đề dành cho tất cả mọi người, mọi ngành nghề, nếu họ sở hữu hoặc vận hành một trang web. Vậy cụ thể dulicate content là gì? Hãy cùng tìm hiểu nhé!
Dulicate content là gì?
Theo nghĩa hẹp, dulicate content là nội dung từ một hoặc nhiều trang web khác nhau nhưng giống nhau hoặc giống nhau hoàn toàn. Hiểu theo nghĩa rộng hơn, dulicate content là gì? Đây là nội dung cung cấp ít hoặc không có giá trị cho khách truy cập. Vì vậy, những trang có ít hoặc không có nội dung hữu ích cũng bị coi là dulicate content.
Tại sao dulicate content lại có hại cho SEO?
Dulicate content có thể tác động tiêu cực đến SEO vì hai lý do:
Khi có nhiều phiên bản nội dung, công cụ tìm kiếm khó xác định phiên bản nào cần lập chỉ mục. Cùng với việc hiển thị phiên bản nào trên trang kết quả. Điều này làm giảm hiệu suất của tất cả các phiên bản nội dung khi chúng cạnh tranh với nhau.
Công cụ tìm kiếm gặp khó khăn trong việc tích hợp các số liệu liên kết. Ví dụ: mức độ liên quan của nội dung, tầm ảnh hưởng và độ tin cậy. Đặc biệt là khi các trang web khác liên kết đến nhiều phiên bản của nội dung đó.
Google có phạt dulicate content không?
dulicate content sẽ ảnh hưởng tiêu cực đến hiệu suất SEO của trang web của bạn. Tuy nhiên, miễn là bạn không cố ý sao chép nội dung từ các trang web khác thì điều này sẽ không dẫn đến việc trang web của bạn bị Google phạt.
Nếu bạn sử dụng nhiều phương pháp trên website của mình nhưng không cố ý lừa gạt Google thì bạn không phải lo lắng bị Google phạt.
Nếu bạn đã sao chép một lượng lớn nội dung từ một trang web khác. Thế thì bạn đang ở trên một ranh giới rõ ràng. Đây là những gì Google nói về vấn đề trùng lặp nội dung:
“Việc sao chép nội dung trên website sẽ không phải là căn cứ để xử phạt. Google chỉ phạt các trang web khi họ sử dụng dulicate content để đánh lừa và thao túng kết quả của công cụ tìm kiếm.
Nếu trang web của bạn đang gặp vấn đề về trùng lặp nội dung và bạn không làm theo khuyến nghị của Google. Sau đó chúng tôi chọn phiên bản nội dung tốt nhất của bạn để hiển thị trong kết quả tìm kiếm.”
Những nguyên nhân phổ biến dẫn đến dulicate content và cách khắc phục
Có rất nhiều nguyên nhân dẫn đến kỹ thuật SEO – lỗi trùng lặp nội dung. Tuy nhiên, tôi đã tổng hợp 15 nguyên nhân phổ biến gây ra vấn đề này và cách giải quyết chúng.
Faceted/Filtered Navigation
Điều hướng theo khía cạnh – Còn được gọi là điều hướng đa chiều. Tại đây, người dùng có thể lọc và sắp xếp các mục trên trang. Các trang web thương mại điện tử thường sử dụng nó rất nhiều.
Kiểu điều hướng này sẽ thêm các tham số vào cuối URL. Ví dụ:
Điều hướng có một tham số ở cuối URL
Bởi vì thường có nhiều tổ hợp bộ lọc. Điều hướng đa hướng dẫn đến trùng lặp nội dung hoặc gần trùng lặp.
Để hiểu rõ hơn lý do tại sao, hãy xem xét hai ví dụ sau:
- bbclothing.co.uk/en-gb/clothing/shirts.html?new_style=Đã kiểm tra
- bbclothing.co.uk/en-gb/clothing/shirts.html?Size=S&new_style=Đã xác minh
Các URL này là duy nhất nhưng nội dung gần như giống hệt nhau.
Ngoài ra, thứ tự của các tham số thường không quan trọng. Ví dụ: bạn có thể truy cập cùng một trang bằng 1 trong 2 URL sau:
- bbclothing.co.uk/en-gb/clothing/shirts.html?new_style=Checked&Size=XL
- bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL&new_style=Đã xác minh
Điều hướng theo khía cạnh là một vấn đề rất phức tạp. Nếu bạn nghi ngờ đây là nguyên nhân gây trùng lặp nội dung. Quyết định những trang bạn muốn Google lập chỉ mục. Sau đó, tăng số lượng trang hữu ích được lập chỉ mục và loại bỏ những trang không cần thiết.
Tracking Parameters
Các URL được tham số hóa cũng được sử dụng để theo dõi. Ví dụ: chúng tôi có thể sử dụng thông số UMT để theo dõi lượt truy cập trong phần chiến dịch bản tin của Google Analytics:
Ví dụ: example.com/page?utm_source=newsletter
Chuẩn hóa các URL được tham số hóa của bạn để có phiên bản thân thiện với SEO mà không cần theo dõi tham số.
Session IDs
ID phiên lưu trữ thông tin về khách truy cập trang web. Họ thường thêm một chuỗi dài vào URL như thế này:
Ví dụ: example.com?sessionId=jow8082345hnfn9234
Cách khắc phục:
Chuẩn hóa URL để có phiên bản thân thiện với SEO.
HTTPS với HTTP và non-www với www
Bạn có thể truy cập trang web bằng một trong 4 lựa chọn sau:
- https://www.example.com (HTTPS, www)
- https://example.com (HTTPS, không phải www)
- http://www.example.com (HTTP, www)
- http://example.com (HTTP, không phải www)
Phiên bản sử dụng HTTPS là hai URL đầu tiên. Dù bạn sử dụng phiên bản có www hay không có www, bạn vẫn có thể truy cập vào trang web.
Tuy nhiên, nếu bạn chưa cấu hình đúng máy chủ. Trang web của bạn sau đó sẽ có thể truy cập được bằng cách sử dụng những thay đổi này. Điều này chắc chắn là không tốt và có thể dẫn đến vấn đề trùng lặp nội dung .
Sử dụng chuyển hướng để đảm bảo rằng chỉ có một phiên bản trang web của bạn được truy cập.
URL phân biệt chữ hoa chữ thường
Các URL phân biệt chữ hoa chữ thường, nghĩa là 3 URL sau đây khác nhau:
- example.com/page
- example.com/PAGE
- example.com/pAgE
Cách sửa chữa:
Hãy nhất quán với liên kết nội bộ (tức là không liên kết nội bộ tới nhiều phiên bản URL). Nếu phương pháp này không giải quyết được vấn đề trùng lặp nội dung, bạn có thể thử chuẩn hóa hoặc chuyển hướng.
Dấu gạch chéo theo sau so với dấu gạch chéo không theo sau
Google không xem xét các URL có hoặc không có cạnh. Điều này có nghĩa là Google sẽ xem 2 URL sau là một:
- example.com/page/
- example.com/page
Nếu nội dung của bạn có thể truy cập được từ cả hai URL thì điều này sẽ dẫn đến lỗi trùng lặp nội dung. Để kiểm tra dulicate content, hãy thử sử dụng URL có và không có dấu gạch chéo để xem đây có phải là vấn đề không.
Ví dụ: Nếu bạn muốn tải lên bài đăng của mình có URL không có dấu gạch chéo, nó sẽ được chuyển hướng đến một URL có dấu gạch chéo.
Cách sửa chữa:
Chuyển hướng phiên bản không mong đợi. Ví dụ: không có dấu gạch chéo ngược, đến phiên bản mong muốn (ví dụ: có dấu gạch chéo ngược). Bạn cũng nên đảm bảo rằng các liên kết nội bộ của bạn luôn có liên quan. Chọn một phiên bản và sử dụng nó trên tất cả các URL.
URL thân thiện với bản in
Các URL có thể in được có cùng nội dung với bản gốc. Và nó chỉ là một URL khác.
- example.com/page
- example.com/print/page
Cách sửa chữa:
Bình thường hóa các phiên bản thân thiện về phiên bản gốc.
URL thân thiện với thiết bị di động
Tương tự như các URL thân thiện với in ấn, các URL thân thiện với thiết bị di động là các bản sao.
Ví dụ:
- example.com/page
- m.example.com/page
Cách sửa chữa:
Bình thường hóa phiên bản di động thành phiên bản gốc. Sử dụng rel=”alternate” để nhắc Google rằng URL thân thiện với thiết bị di động là một thay thế cho phiên bản nội dung dành cho máy tính để bàn.
URL AMP
Trang di động tăng tốc (AMP) cũng bị trùng lặp.
Ví dụ:
- example.com/page
- example.com/amp/page
Cách khắc phục:
Chuẩn hóa phiên bản AMP thành phiên bản không phải AMP. Sử dụng rel=”amphtml” để cho Google biết rằng URL AMP là phiên bản thay thế của nội dung không phải AMP.
Nếu bạn chỉ có nội dung AMP, hãy sử dụng thẻ chuẩn tự tham chiếu .
Trên đây là tổng hợp thông tin giải đáp dulicate content là gì cùng nguyên nhân và cách khắc phục.. Hi vọng bài viết này đã mang đến cho bạn những thông tin hữu ích!