Bảo vệ nội dung và danh dự cho website của bạn

Trước khi đọc bài này, bạn hãy tìm hiểu về Rich snippet – đoạn trích nổi bật.

Các tay scraper lợi dụng thứ hạng của bạn ra sao?

Thật không may khi thế giới web hiện đang chứa hàng trăm ngàn (nếu không muốn nói là hàng triệu) các website “ăn bám” ,“chôm” nội dung trên các website khác và tiến hành sử dụng lại trên tên miền của chúng (đôi khi còn “chế biến” theo những cách khác người). Hoạt động ăn cắp nội dung rồi xuất bản lại gọi là “đạo nội dung” (scraping), và những tay scraper đã “bỏ túi” đáng kể vì website của chúng được xếp hạng cao hơn và đăng nhiều quảng cáo hơn (và cũng đáng buồn hơn, đó là nhờ chương trình Adsense của chính Google).

Google luôn tìm mọi cách ngăn chặn tình trạng copy nội dung

Google luôn tìm mọi cách ngăn chặn tình trạng copy nội dung

Google luôn tìm mọi cách ngăn chặn tình trạng copy nội dung

Khi bạn xuất bản nội dung theo bất cứ định dạng feed nào – RSS/ XML/ vân vân – nhớ ‘ping’ (thông báo) cho các dịch vụ theo dõi hoặc tạo blog chủ đạo (như Google, Technorati, Yahoo!,…). Bạn có thể tìm thấy hướng dẫn cách ping các dịch vụ như Google và Technorati trực tiếp từ website của họ, hay sử dụng dịch vụ Pingomatic để tự động hóa qui trình. Nếu bạn phát triển các chương trình xuất bản nội dung riêng, bạn nên áp dụng tính năng auto-pinging (tự thông báo) cho những nội dung.

Ngoài ra, bạn vẫn có thể dùng chiêu “gậy ông đập lưng ông”. Hầu hết các scraper sẽ xuất bản lại nội dung mà không màng chỉnh sửa, do đó, bằng cách đặt liên kết trỏ ngược trở lại website của mình, cộng với bài viết gốc bạn đã đăng, bạn có thể đảm bảo các công cụ tìm kiếm sẽ trông thấy các bản sao đã liên kết ngược trở lại website của bạn (và hiểu rằng bài viết của bạn chính là bài gốc). Để làm được điều này, bạn nên dùng liên kết tuyệt đối thay vì tương đối cho cấu trúc liên kết trong. Do đó, thay vì liên kết đến trang chủ của bạn bằng cách sử dụng:

<a href=”../>Home</a>

Bạn nên sử dụng:

<a href=”http://www.seomoz.org”>Home</a>

Bằng cách này, khi một scraper “để ý” và sao chép nội dung của bạn, liên kết vẫn trỏ về website của bạn.

Có nhiều cách thức cao cấp khác giúp khống chế tình trạng scraping, nhưng những cách thức đó đều rất khó thực hiện. Bạn nên chấp nhận sự thật rằng, website của bạn càng phổ biến và càng nổi tiếng, nội dung của bạn càng có nguy cơ bị “chôm chỉa” và xuất bản lại. Bạn có thể bỏ qua tình trạng này nhiều lần, nhưng nếu sự việc đã trở nên nghiêm trọng vì các scraper đã chiếm mất thứ hạng và lưu lượng truy cập của bạn, bạn nên nghĩ đến việc dùng một qui trình hợp pháp có tên gọi là “DMCA takedown”. May mắn thay, một cố vấn nội bộ của SEOmoz, Sarah Bird, đã đưa ra phương án tuyệt vời giúp giải quyết vấn đề này – Bốn cách giúp bạn củng cố quyền tác giả: Phải làm gì khi nội dung online bị đánh cắp.

Tiếp theo, chúng ta sẽ đến phần Phân tích từ khóa.

Add Comment