Trùng lắp nội dung và thẻ canonical

Trước khi đọc bài này, bạn nên tìm hiểu về Cách xây dựng cấu trúc URL thân thiện ở bài trước.

Nội dung trùng lặp và chuẩn hóa nội dung bằng thẻ Canonical

Nội dung trùng lặp và chuẩn hóa nội dung bằng thẻ Canonical

 

Nội dung trùng lắp là một trong những vấn đề rắc rối và khó chịu nhất mà bất cứ website nào cũng có nguy cơ gặp phải. Suốt những năm qua, công cụ tìm kiếm đã thẳng tay trừng phạt các nội dung “loãng” và trùng lắp thông qua các hình thức phạt và hạ bậc thứ hạng.

Canonicalization chỉ xảy ra khi hai hoặc nhiều hơn hai phiên bản trùng lắp của một trang web xuất hiện trên các URL khác nhau. Đây là vấn đề thường mắc phải của các CMS (Hệ thống quản lí nội dung, ví dụ như WordPress, Joomla,…) hiện đại. Chẳng hạn như, bạn cung cấp một phiên bản bình thường cho nội dung, và một phiên bản chuyên dùng để in ấn cho cùng nội dung đó. Nội dung trùng lắp thậm chí có thể xuất hiện trên nhiều website khác nhau. Đối với công cụ tìm kiếm, tình trạng này là một vấn đề hết sức hóc búa – phiên bản nội dung nào chúng nên hiển thị cho người tìm kiếm bây giờ? Còn đối với giới làm SEO, vấn đề này được gọi là nội dung trùng lặp.

Các công cụ tìm kiếm thường rất khó tính trong việc chọn lựa các phiên bản có nội dung trùng lặp. Để không làm phật lòng người tìm kiếm, chúng hiếm khi cho hiển thị những nội dung trùng lặp nhưng thay vào đó, chúng sẽ chọn lựa kĩ càng một phiên bản gần giống với bản gốc nhất. Kết quả là, TẤT CẢ các nội dung trùng lắp của bạn sẽ phải chia nhau giá trị và mỗi nội dung nhận được thứ hạng thấp hơn nhiều.

canonicalization-version-2

canonicalization-version-2

Chuẩn hóa (canonicalization) là hoạt động tổ chức nội dung sao cho mỗi một nội dung chỉ có duy nhất một URL. Nếu bạn đặt nhiều phiên bản cùng một nội dung lên một website (hay lên các website khác), bạn sẽ có kết cục như hình minh họa ở trên. Phải chọn viên kim cương nào mới đúng đây?

Thay vào đó, nếu chủ website dùng chuyển hướng 301 cho ba trang web, công cụ tìm kiếm sẽ nhận được một trang chất lượng duy nhất để hiển thị trên trang kết quả tìm kiếm.

Khi nhiều trang khác nhau với khả năng xếp hạng như nhau được kết nối thành một trang duy nhất, chúng không cần phải tốn sức cạnh tranh với nhau nữa, chúng đã trở thành một tổng thể có tính tương quan và độ phổ biến rất cao. Điều này sẽ cải thiện đáng kể thứ hạng của chúng.

Sử dụng Canonical Tag để giải quyết vấn đề

Một lựa chọn khác từ công cụ tìm kiếm, có tên “Canonical URL Tag” (Thẻ URL Canonical) là một cách thức khác giúp giảm thiểu các phiên bản nội dung trùng lặp trên một website và chuẩn hóa chúng vào một URL riêng biệt. Điều này vẫn có thể áp dụng cho nhiều website khác nhau, từ một URL trên tên miền này đến một URL khác trên tên miền khác.

Dùng thẻ canonical ngay trong trang web chứa nội dung trùng lắp. Thẻ canonical này sẽ “nhắm đến” URL “chính” mà bạn muốn xếp hạng.

Cách sử dụng

<link rel=“canonical” href=“http://www.seomoz.org/blog”/>

Liên kết này sẽ báo cho công cụ tìm kiếm biết rằng, trang web nên được xem là một bản sao của URL www.seomoz.org/blog, do đó, về mặt kĩ thuật, tất cả các tiêu chí đánh giá liên kết & nội dung của công cụ tìm kiếm nên hướng về URL đó.

Nếu xét theo nhiều phương diện, thuộc tính của thẻ URL Canonical khá giống với chuyển hướng 301 của SEO. Về cơ bản, bạn đã báo cho công cụ tìm kiếm biết rằng tất cả các trang giống nhau đều qui về một mối (và 301 cũng vậy), nhưng không thật sự chuyển hướng khách truy cập đến URL mới (bạn càng đỡ đau đầu suy nghĩ).

Tiếp theo, chúng ta cùng tìm hiểu 1 nội dung hay là Rich snippet – đoạn trích nổi bật.

Add Comment