Quy trình hoạt động của công cụ tìm kiếm

Rate this post

Hiểu rõ Quy trình hoạt động của công cụ tìm kiếm rất quan trọng trong quá trình SEO, vì bạn sẽ biết được những gì bạn làm sẽ gây ảnh hưởng như thế nào đến kết quả.

Công cụ tìm kiếm có hai chức năng chính – Thứ nhất: thu thập thông tin & lập chỉ mục; và Thứ hai: cung cấp câu trả lời bằng cách đánh giá tính tương quan & kết quả hiển thị.

1. Thu thập thông tin và Lập chỉ mục

Thu thập và lập chỉ mục hàng tỉ tài liệu, trang web, tệp tin, tin tức, video và các nội dung đa phương tiện trên mạng lưới internet.

2. Cung cấp câu trả lời

Cung cấp câu trả lời tương quan với truy vấn của người dùng sau khi sàng lọc danh sách các trang có nội dung tương quan, các website đã được xếp hạng hoặc các mục thông tin đã thu thập.

1. Thu thập thông tin và lập chỉ mục

Hãy tưởng tượng World Wide Web là mạng lưới các trạm dừng của hệ thống tàu điện ngầm trong một thành phố lớn.

Mỗi trạm dừng là một tài liệu riêng biệt (thường là một trang web, nhưng đôi khi có thể là PDF, JPG hay một tập tin khác). Các công cụ tìm kiếm cần một con đường để “thu thập” thông tin của toàn thành phố, cũng như tìm kiếm các trạm dừng trên suốt đường đi, vì vậy, chúng sử dụng con đường tốt nhất sẵn có – đó là các liên kết.

“Cấu trúc liên kết của một website có nhiệm vụ kết nối các trang của chúng lại với nhau.”

Thông qua liên kết, các robot tự động của công cụ tìm kiếm, còn được gọi là “crawler” hay “spider”, có thể tiếp cận hàng triệu triệu nội dung có liên kết với nhau.

Khi các công cụ tìm kiếm thấy những trang này, chúng sẽ tiến hành phân tích mã (code) của những trang đó và lưu trữ các thông tin được chọn trong những hệ thống quản lý khổng lồ. Các thông tin này sau đó sẽ hiển thị trên trang kết quả theo truy vấn của người dùng. Để có thể chứa đựng hàng triệu trang web có thể hiển thị cho người dùng chỉ trong tích tắc, các công cụ tìm kiếm đã xây dựng các trung tâm dữ liệu khổng lồ nằm rải rác khắp các thành phố lớn trên toàn thế giới.

Các trung tâm lưu trữ thông tin đồ sộ này chứa hàng ngàn máy tính liên tục xử lí lượng thông tin khổng lồ. Khi người dùng tiến hành tìm kiếm trên bất cứ một công cụ tìm kiếm nào, họ muốn kết quả phải hiển thị ngay lập tức – chỉ cần chậm trễ từ 1 đến 2 giây thôi cũng khiến họ không vừa lòng, vì vậy, các bộ máy này phải làm việc cật lực để cung cấp câu trả lời nhanh nhất có thể.

Công cụ tìm kiếm Thu thập thông tin và lập chỉ mục

Công cụ tìm kiếm Thu thập thông tin và lập chỉ mục

2. Cung cấp câu trả lời

Công cụ tìm kiếm là những cỗ máy cung cấp câu trả lời. Khi người dùng tiến hành tìm kiếm, các công cụ tìm kiếm phải sẽ sàng lọc hàng triệu tài liệu của mình và làm hai việc – đầu tiên, gửi đi những kết quả có nội dung tương quan, hữu ích đối với truy vấn của người tìm kiếm – và thứ hai, xếp hạng những kết quả đó theo thang giá trị đã được công nhận. Nội dung “tương quan” và “quan trọng” là hai tiêu chí mà quá trình tối ưu hoá công cụ tìm kiếm luôn hướng đến.

Đối với công cụ tìm kiếm, sự tương quan không đơn giản là hiển thị các trang có chứa từ tìm kiếm. Trong thời kì đầu, các bộ máy tìm kiếm cũng chỉ quanh quẩn với phương pháp đánh giá khá đơn giản này và sau đó nhận ra rằng kết quả mà chúng hiển thị không đủ công bằng (đối với các webmaster) và chất lượng (đối với người tìm kiếm). Do đó, qua nhiều lần cải tiến, các kĩ sư thông minh của các công cụ tìm kiếm đã tìm ra những cách thức tốt hơn giúp hiển thị những nội dung có giá trị để thoả mãn nhu cầu của người dùng. Ngày nay, có hàng trăm yếu tố để đánh giá sự tương quan, và chúng ta sẽ thảo luận các yếu tố đó trong tài liệu hướng dẫn này.

Công cụ tìm kiếm đánh giá tầm quan trọng ra sao?

Hiện nay, các công cụ tìm kiếm thường đánh đồng tầm quan trọng với sự phổ biến – một website, trang web hay tài liệu càng phổ biến thì thông tin chúng chứa đựng bên trong càng có giá trị cao. Trên thực tế, phương thức đánh giá này khá thành công. Các công cụ tìm kiếm vẫn tiếp tục cung cấp kết quả thoả mãn người dùng bằng cách sử dụng các tiêu chí riêng để đánh giá độ phổ biến của một website.

Tính phổ biến và độ tương quan được xác định bằng các phương trình toán học rất tỉ mỉ – gọi là các thuật toán – để có thể tách “lúa” ra khỏi “trấu” và tiến hành xếp hạng giá trị từng hạt lúa căn cứ trên hương vị của nó (hay theo tiêu chí nào đó mà người nông dân thường dùng để đánh giá).

Các thuật toán này gồm hàng trăm yếu tố khác nhau. Trong lĩnh vực tiếp thị thông qua tìm kiếm, chúng tôi thường gọi chúng là các “yếu tố đánh giá thứ hạng”.

Bạn có thể hiểu, công cụ tìm kiếm tin rằng Ohio State là trang web phổ biến và tương quan nhất đối với truy vấn “Universities”, trong khi kết quả Harvard lại được đánh giá kém quan trọng & kém tương quan hơn.

Vậy làm sao tôi có thể đạt được thành công?

Các thuật toán phức tạp của công cụ tìm kiếm thoạt nhìn có vẻ rất khó lĩnh hội, và chính các công cụ đó hầu như không cung cấp phương pháp nào cụ thể để giúp bạn gặt được kết quả tốt hơn hay thu nhận được nhiều lưu lượng hơn. Các thông tin về qui trình tối ưu hoá cũng như các thủ thuật hay mà công cụ tìm kiếm cung cấp khá “ít ỏi” được chúng tôi tổng hợp bên dưới:

Thông tin SEO từ Google hướng dẫn dành cho Webmaster

Google đưa ra các phương pháp sau đây giúp website của bạn cải thiện thứ hạng trên trang kết quả tìm kiếm của chúng:

  • Hãy tạo các trang có nội dung hướng đến người dùng, không phải công cụ tìm kiếm. Không lừa gạt người dùng hay chỉ hiển thị nội dung đa dạng cho mỗi công cụ tìm kiếm, còn người dùng thì không. Hành động này sẽ bị đánh giá là cloaking (ngụy trang).
  • Tạo một website có hệ thống các liên kết văn bản rõ ràng. Mỗi một trang con phải có ít nhất một ‘liên kết văn bản cố định’ dẫn đến chúng.
  • Tạo một website hũu ích và giàu thông tin, viết những trang con miêu tả chính xác và rõ ràng nội dung của bạn. Hãy đảm bảo các thẻ tiêu đề và thuộc tính ALT cung cấp đủ thông tin và phải chính xác.
  • Dùng từ khóa để tạo các URL mang tính mô tả và thân thiện với con người. Chỉ dùng một phiên bản URL để tiếp cận nội dung, dùng chuyển hướng 301 hoặc yếu tố rel=“canonical” để định vị phần nội dung trùng lắp.

Thông tin SEO từ Bing hướng dẫn dành cho Webmaster

Các kĩ sư của Bing làm việc tại Microsoft đã đưa ra các phương pháp sau giúp website của bạn cải thiện thứ hạng trên trang kết quả tìm kiếm:

  • Bảo đảm sử dụng cấu trúc URL rõ ràng, giàu từ khóa.
  • Phải bảo đảm nội dung không bị chôn vùi trong rich media (như Adobe Flash, Player, JavaScript, Ajax) và phải xác minh rich media không giấu liên kết khỏi các crawler.
  • Tạo nội dung giàu từ khóa dựa trên kết quả phân tích thói quen tìm kiếm của người dùng. Thường xuyên cung cấp nội dung tươi mới.
  • Không đặt đoạn văn bạn muốn được đánh chỉ mục vào bên trong hình ảnh. Ví dụ, nếu bạn muốn tên hoặc địa chỉ công ty được đánh chỉ mục, đừng đặt chúng nằm trong logo của công ty.

Vậy, đây chỉ là phần nổi của tảng băng chìm, vì còn nhiều thật nhiều những thủ thuật khác nữa?

Đúng vậy! Nhưng không việc gì phải hoảng sợ!

Sau hơn 15 năm kể từ lúc chức năng tìm kiếm website xuất hiện trên internet, những online marketer đã đúc rút được hệ phương pháp phản ánh qui trình xếp hạng website của các công cụ tìm kiếm. Các marketer và người làm SEO đã sử dụng dữ liệu đó để giúp website của họ cũng như của khách hàng đạt được vị trí tốt hơn.

Ngạc nhiên ở chỗ, công cụ tìm kiếm thật ra rất ủng hộ những nỗ lực này, nhưng lại không công bố chúng một cách rộng rãi. Các buổi hội nghị liên quan đến vấn đề tiếp thị trực tuyến như Search Marketing Expo (Triển lãm tiếp thị trực tuyến), PubconCác chiến lược tối ưu hoá công cụ tìm kiếmDistilled & MozCon của SEOmoz đã thu hút khá nhiều kĩ sư cùng các đại diện từ những công cụ tìm kiếm chủ đạo. Các đại diện này thỉnh thoảng cũng giúp đỡ các webmaster bằng cách tham gia vào các blog, diễn đàn hay đội nhóm của họ.

Tiến hành thử nghiệm

Có lẽ không một công cụ ưu việt nào có thể giúp webmaster nghiên cứu hoạt động của công cụ tìm kiếm hơn là sự tự do sử dụng chính công cụ tìm kiếm đó để tiến hành các thử nghiệm, đưa ra các quan điểm kiểm tra và cấu thành các ý kiến. Nhờ qui trình lặp đi lặp lại và đôi khi hơi khó khăn này, người ta đã đúc rút được một lượng lớn kiến thức đáng kể về các chức năng của công cụ tìm kiếm.

  1. Đăng kí một website mới với cụm từ khoá vô nghĩa nào đó (vd, ishkabibbell.com)
  2. Tạo nhiều trang con cho website đó, tất cả đều nhắm đến một từ vớ vẩn na ná nhau (như yoogewgally)
  3. Kiểm tra các vị trí đặt đoạn văn, định dạng, từ khoá được sử dụng, cấu trúc liên kết, vân vân, bằng cách tạo ra các trang càng giống nhau càng tốt và chỉ có duy nhất một sự khác biệt nhỏ.
  4. Trỏ liên kết từ các trang đã được ‘đánh chỉ mục và thu thập’ của tên miền này đến tên miền khác.
  5. Ghi chép lại các hoạt động của công cụ tìm kiếm cũng như vị trí thứ hạng của các trang con.
  6. Tạo thay đổi nhỏ cho những trang đích giống hệt nhau để xác định yếu tố nào giúp tăng/ hay giảm thứ hạng của trang web.
  7. Ghi chép lại tất cả các kết quả khả quan và tiến hành thử nghiệm lại với tên miền khác hay với cụm từ khác – nếu các thí nghiệm cùng đưa về một kết quả, điều đó có nghĩa, bạn đã khám phá được một nguyên tắc hoạt động của công cụ tìm kiếm.

Một thí nghiệm mẫu chúng tôi đã thực hiện

Trong lần thí nghiệm này, chúng tôi bắt đầu với giả thuyết cho rằng, liên kết nằm ở vị trí cao hơn trong đoạn mã của trang sẽ có giá trị tốt hơn liên kết nằm dưới trong đoạn mã đó. Chúng tôi đã kiểm nghiệm điều này bằng cách tạo ra một tên miền vớ vẩn và cho nó liên kết đến ba trang khác, tất cả đều chứa cùng nội dung vớ vẩn như nhau. Sau khi công cụ tìm kiếm thu thập các trang này, chúng tôi phát hiện rằng, trang web được liên kết ở vị trí cao nhất trên trang chủ được xếp hạng ở vị trí thứ nhất.

Đây không phải là cách làm duy nhất giúp đem lại kiến thức cho những người làm online marketing.

Những thông tin gây tranh cãi về các dấu hiệu công cụ tìm kiếm có thể sử dụng, cũng như cách thức chúng xếp thứ tự kết quả hiển thị, có thể được tìm thấy trong các ứng dụng được gửi đến Cục Bản quyền Hoa Kỳ của các công cụ tìm kiếm. Có lẽ một trong những sáng chế nổi tiếng nhất chính là hệ thống sản sinh ra phiên bản sơ khai của Google trong các kí túc xá Stanford cuối những năm 90 – PageRank – có tên tài liệu là Patent #6285999 – Phương pháp xếp hạng node trong một cơ sở dữ liệu được liên kết. Bài viết nguyên bản về vấn đề này – Anatomy of a Large-Scale Hypertextual Web Search Engine – cũng là chủ đề đáng được nghiên cứu. Nếu bạn không có hứng thú với các phép tính phức tạp, bạn không cần phải sợ hãi. Mặc dù các phương trình toán học về mặt học thuật cũng rất thú vị, nhưng việc phải lĩnh hội những kiến thức phức tạp này thường khiến các marketer phải sợ hãi tránh né. Tuy nhiên, bạn không nhất thiết phải “thẩm thấu” tất cả các phép tính này mới có thể làm SEO!

Nhờ các phương pháp như phân tích bằng sáng chế, tiến hành thử nghiệm và kiểm tra trực tiếp, cộng đồng online marketing có thể hiểu được cách thức hoạt động cơ bản của công cụ tìm kiếm cũng như các yếu tố trọng yếu cần có để xây dựng website đạt được thứ hạng cao với lượng truy cập đáng kể.

Phần còn lại của tài liệu sẽ tập trung giải thích một cách rõ ràng và chính xác những thủ thuật hay bạn nên áp dụng! Từ từ nghiền ngẫm nhé!

Trong Seri này:

Chương 1 : Qui trình hoạt động của công cụ tìm kiếm
Chương 2 : Người dùng tương tác với công cụ tìm kiếm như thế nào
Chương 3 : Tại sao tiếp thị thông qua công cụ tìm kiếm lại cần thiết
Chương 4 : Qui tắc cơ bản giúp thiết kế & phát triển website thân thiện với công cụ tìm kiếm
Chương 5 : Phân tích từ khóa
Chương 6 : Ảnh hưởng của tính tiện dụng, trải nghiệm người dùng & nội dung lên thứ hạng website
Chương 7 : Tăng độ phổ biến & liên kết
Chương 8 : Các dịch vụ và công cụ của bộ máy tìm kiếm
Chương 9 : Các quan niệm sai lầm về công cụ tìm kiếm
Chương 10 : Đánh giá & Theo dõi thành công

Tiếp theo, chúng ta sẽ tìm hiểu Người dùng tương tác với công cụ tìm kiếm như thế nào.

Add Comment