Tìm hiểu Noindex Tag và cách sử dụng trong SEO

Những điểm chính

 

  • Khái niệm Noindex Tag: Đây là chỉ thị trong HTML hoặc HTTP Header yêu cầu công cụ tìm kiếm không lập chỉ mục trang.

 

  • Phân biệt Noindex và Nofollow: Hiểu rõ sự khác nhau giữa việc chặn index trang và chặn theo dõi liên kết.

 

  • Khi nào cần dùng Noindex: Áp dụng cho các trang hệ thống, trang cảm ơn, trang nội dung mỏng hoặc trùng lặp.

 

  • Cách triển khai: Bằng thẻ Meta Robots trong HTML hoặc X-Robots-Tag trong HTTP Header.

 

Noindex Tag là gì?

 

Noindex Tag là thẻ HTML dùng để báo cho bot tìm kiếm không index một trang hoặc file trên website.

 

Cách khai báo Noindex trong HTML

 

Thêm thẻ này vào phần <head>:


 
<meta name="robots" content="noindex">
 

Khai báo Noindex bằng HTTP Header

 

Trong header, thẻ này sẽ có dạng:


 
x-robots-tag: noindex
 

Khi Googlebot truy cập trang và phát hiện chỉ thị noindex, trang sẽ bị loại khỏi kết quả tìm kiếm—even khi trước đó đã được index. Lưu ý rằng không phải bot nào cũng tuân theo 100%, nhưng hầu hết bot của các công cụ tìm kiếm lớn (đặc biệt Google) đều thực hiện đúng.

 

Phân biệt Noindex và Nofollow

 

Tiêu chí Noindex Nofollow
Mục đích Ngăn trang xuất hiện trong kết quả tìm kiếm Ngăn bot theo dõi liên kết ra ngoài
Áp dụng Cả trang Từng liên kết
Hiệu quả Trang không được index Trang vẫn được index, nhưng không truyền sức mạnh SEO
Cách hoạt động Qua thẻ meta robots Thuộc tính rel="nofollow"

 

Bạn có thể kết hợp:

 

  • noindex, follow — không index trang nhưng vẫn theo dõi link

 

  • noindex, nofollow — không index và không theo dõi link

 

Nếu vẫn thấy trang hiển thị trên Google sau khi thêm Noindex, có thể Google chưa thu thập lại. Hãy gửi Indexing Request trong Google Search Console.


Noindex, seo, index web

 

Khi nào nên sử dụng Noindex Tag?

 

Hãy dùng Noindex khi muốn giới hạn tài nguyên crawl và loại bỏ các trang không mang lại giá trị SEO.

 

Nên Noindex cho:

 

  • Trang hệ thống: đăng nhập, đăng ký, quên mật khẩu, giỏ hàng, checkout.

 

  • Trang tương tác: trang Thank You sau khi gửi form hoặc mua hàng.

 

  • Trang nội dung mỏng hoặc trùng lặp: trang tag, trang kết quả tìm kiếm nội bộ, các danh mục không có nội dung.

 

  • Trang nháp, môi trường staging, file nội bộ.

 

Không nên Noindex các trang:

 

  • Trang chủ, trang giới thiệu, liên hệ

 

  • Trang sản phẩm/dịch vụ quan trọng

 

  • Bài viết blog có giá trị, có khả năng mang lại traffic

 

Cách triển khai Noindex Tag

 

Bạn có thể triển khai bằng HTML hoặc HTTP Header.

 

1. Thêm thẻ Noindex trong HTML

 

Dùng thẻ meta robots trong phần <head>:

 

<meta name="robots" content="noindex">
 

Giải thích cấu trúc:

 

  • name="robots": áp dụng cho mọi bot

 

  • content="noindex": chỉ thị không index

 

Bạn có thể thêm nhiều chỉ thị và ngăn cách bằng dấu phẩy, ví dụ:


 
<meta name="robots" content="noindex, nofollow">
 

2. Thêm Noindex trong HTTP Header (X-Robots-Tag)

 

Dành cho file không phải HTML như PDF, hình ảnh, video hoặc khi bạn cần kiểm soát bằng RegEx.

 

Ví dụ phản hồi HTTP:


 
x-robots-tag: noindex
 

Apache (.htaccess) – noindex tất cả file PDF

 

<FilesMatch "\.pdf$"> Header set X-Robots-Tag "noindex" </FilesMatch>
 

Nginx – noindex file PDF


 
location ~* \.pdf$ { add_header x-robots-tag "noindex"; }
 

Ưu điểm của phương pháp HTTP Header

 

  • Áp dụng được cho mọi loại file

 

  • Hỗ trợ RegEx để target nhiều trang cùng lúc

 

Nhược điểm

 

  • Cần quyền truy cập server

 

  • Cấu hình khó hơn trị trí trong HTML

 HỖ TRỢ TRỰC TUYẾN