Bước đầu tiên để đưa trang web của bạn lên Google là đảm bảo rằng Google có thể tìm thấy trang đó. Cách tốt nhất để làm điều đó là gửi sơ đồ trang web của bạn lên Google. Sơ đồ trang web là một tệp trên trang web của bạn nhằm cung cấp thông tin cho các công cụ tìm kiếm về những trang mới hoặc đã thay đổi trên trang web.

Sơ đồ trang web là gì (file SiteMap.txt) ?

Sơ đồ trang web là một tệp trong đó bạn có thể liệt kê các trang trên trang web của bạn để cho Google và công cụ tìm kiếm khác biết về cách sắp xếp nội dung trang web của bạn. Trình thu thập dữ liệu web trong công cụ tìm kiếm như Googlebot đọc tệp này để thu thập dữ liệu trang web của bạn theo cách thông minh hơn.

Ngoài ra, sơ đồ trang web của bạn có thể cung cấp dữ liệu có giá trị được liên kết với các trang bạn liệt kê trong sơ đồ trang web đó: dữ liệu là thông tin về một trang web, chẳng hạn như thời điểm trang được cập nhật lần cuối, mức độ thường xuyên trang được thay đổi và tầm quan trọng của các trang so với các URL khác trong trang web.

Bạn có thể sử dụng sơ đồ trang web để cung cấp cho Google dữ liệu về loại nội dung cụ thể trên các trang của bạn, bao gồm nội dung video và hình ảnh. Ví dụ: bạn có thể cung cấp cho Google thông tin về nội dung video và hình ảnh.

Hiện nay nếu bạn sử dụng website kinh doanh với mã nguồn của WordPress thì bạn không cần phải tạo sitemap thủ công bằng tay, mà đã có những plugin tích hợp vào website để giúp bạn làm điều này, cụ thể đó là Plugin rất nổi tiếng Seo By Yoast, chi chỉ cần cần đặt vào website sau đó plugin sẽ tự động sinh ra cho bạn một tệp sitemap.xml.

Ví Dụ : https://cuongdory.com/sitemap.xml

Bạn có cần một sơ đồ trang web hay không?

Nếu trang web của bạn được liên kết đúng cách, trình thu thập dữ liệu web của GG thường có thể phát hiện phần lớn nội dung trang web của bạn. Mặc dù vậy, sơ đồ trang web có thể cải thiện việc thu thập dữ liệu trang web của bạn, đặc biệt là nếu trang web của bạn đáp ứng một trong các tiêu chí sau:

  • Trang web của bạn thực sự lớn. Kết quả là có khả năng trình thu thập dữ liệu web của Google có thể bỏ qua việc thu thập dữ liệu một số trang mới hoặc được cập nhật gần đây.
  • Trang web của bạn có một kho lưu trữ lớn các trang nội dung bị tách riêng hoặc không liên kết với nhau. Nếu các trang trên trang web của bạn không tham chiếu lẫn nhau một cách tự nhiên, bạn có thể liệt kê chúng trong một sơ đồ trang web để đảm bảo rằng Google không bỏ qua một số trang của bạn.
  • Trang web của bạn mới và có ít liên kết bên ngoài đến trang. Googlebot và trình thu thập dữ liệu web khác thu thập dữ liệu web bằng cách theo các liên kết từ trang này sang trang khác. Kết quả là Google có thể không phát hiện các trang của bạn nếu không có trang web nào khác liên kết đến trang khác ( link nội bộ )
  • Trang web của bạn sử dụng nội dung đa phương tiện, được hiển thị trong Google Tin tức hoặc sử dụng các chú thích tương thích với sơ đồ trang web khác. Google có thể xem xét thêm thông tin từ sơ đồ trang web đối với tìm kiếm khi thích hợp.
Việc sử dụng một sơ đồ trang web không đảm bảo rằng tất cả các mục trong sơ đồ trang web của bạn sẽ được thu thập dữ liệu và lập chỉ mục, vì quy trình của Google dựa trên thuật toán phức tạp để lên lịch thu thập dữ liệu. Tuy nhiên, trong hầu hết các trường hợp, trang web của bạn sẽ được hưởng lợi từ việc có sơ đồ trang web và bạn sẽ không bao giờ bị phạt vì có sơ đồ trang web.

Google cũng tìm các trang thông qua liên kết từ các trang khác.

Không cho Google thu thập dữ liệu một trang bất kỳ ( file Robots.txt )

Đối với những thông tin bạn không muốn xuất hiện trên trình tìm kiếm của GG, hãy chặn quá trình thu thập dữ liệu không mong muốn bằng cách sử dụng file robots.txt

Tệp “robots.txt” cho công cụ tìm kiếm biết họ có thể truy cập và thu thập dữ liệu các phần trên trang web của bạn hay không. Tệp này phải được đặt tên là “robots.txt” và được đặt trong thư mục gốc của trang web.

cuongdory2

Bạn có thể không muốn một số trang nhất định của trang web được thu thập dữ liệu bởi vì các trang này có thể không hữu ích cho người dùng nếu nằm trong kết quả tìm kiếm của công cụ tìm kiếm chẵn hạn như các đường dẫn trong source code admin của website. Nếu bạn muốn ngăn không cho các công cụ tìm kiếm thu thập dữ liệu các trang của mình, Google Search Console có một trình tạo robots.txt thân thiện để giúp bạn tạo tệp này.

Lưu Ý :

  • Đừng để Google thu thập dữ liệu các trang kết quả tìm kiếm nội bộ của bạn. Người dùng không thích việc đã nhấp vào một kết quả tìm kiếm nhưng chỉ đến được một trang kết quả tìm kiếm khác trên trang web của bạn.
  • Cho phép thu thập dữ liệu các URL được tạo do dịch vụ proxy.

Xem Tiếp >>. Bài 3 : Giúp Google (và người dùng) hiểu nội dung của bạn

[Bài 2] Đưa website của bạn lên trình tìm kiếm của Google
5 1 vote

1 BÌNH LUẬN

BÌNH LUẬN

Please enter your comment!
Please enter your name here