fbpx
Logo

Canonical là gì trong SEO? Cách sử dụng Canonical tag hiệu quả

Theo dõi Miko Tech trên Google News

Canonical là gì? Trong lĩnh vực SEO, đây là một thuật ngữ khá quen thuộc. Nhờ có canonical tag, chúng ta có thể giải quyết vấn đề trùng lặp nội dung trên website. Trong bài viết hôm nay, Miko Tech sẽ cùng các các bạn tìm hiểu về canonical URL, thẻ canonical cũng như cách sử dụng thẻ một cách hợp lý. Cùng bắt đầu nhé!

Canonical URL là gì?

Canonical là gì? Canonical URL là phiên bản chính của tất cả các trang bị trùng lặp được công cụ tìm kiếm ghi nhận, chẳng hạn như Google.

Canonical URL
Canonical URL là phiên bản tốt nhất của các trang trùng lặp

Google không thích những trang trùng lặp nội dung và nó không muốn hiển thị những kết quả tìm kiếm giống hệt nhau. Vì đơn giản, những trang này khá lãng phí tài nguyên và không mang lại giá trị nào cả.

Mỗi khi Google tìm thấy những trang trùng lặp hoặc “na ná” nhau trên cùng một website, nó sẽ tự chọn ra một trang gốc đại diện cho tất cả các trang đó. Trang đại diện này sẽ được ưu tiên lập chỉ mục cũng như xếp hạng trên SERP. Tuy nhiên, không phải sự lựa chọn nào của Google cũng hợp lý, và đó là lý do chúng ta cần đến các thẻ canonical.

Thẻ Canonical là gì?

Thẻ canonical, hay còn gọi là thẻ rel=”canonical” là meta tag được sử dụng để thông báo cho Google biết trang nào là trang gốc trong trường hợp có nhiều URL chứa nội dung trùng lặp. Thẻ canonical thường xuất hiện ở phần <head> trong mã nguồn HTML của trang và nhìn như sau:

canonical
Thẻ canonical trong mã nguồn trang

Thông thường, canonical tag sẽ nằm trong mã nguồn của trang thay thế (các trang trùng lặp còn lại) và trỏ đến trang chính. Tuy nhiên, tại trang chính cũng cần có thẻ canonical trỏ về chính nó.

Dùng thẻ Canonical trong trường hợp nào?

Thẻ canonical được dùng để xử lý vấn đề trùng lặp nội dung. Các trang bị trùng lặp nội dung có thể khiến web xảy ra tình trạng cannibalization. Cannibalization (hay Ăn thịt từ khóa) là tình trạng xảy ra khi nhiều trang trên cùng một website cạnh tranh lẫn nhau với cùng một từ khóa. Tình huống tệ nhất là không trang nào được xếp hạng trên kết quả tìm kiếm.

canonical tag
Các trang trùng lặp khiến bot không biết nên ưu tiên trang nào

Quá nhiều nội dung trùng lặp cũng có thể ảnh hưởng đến thời hạn thu thập thông tin của website. Điều đó có nghĩa là thay vì khám phá nội dung quan trọng khác trên trang web của bạn, Googlebot có thể sẽ lãng phí thời gian để thu thập dữ liệu cho nhiều phiên bản của cùng một trang.

Bằng cách sử dụng canonical tag, chủ sở hữu web sẽ báo cho Google biết trang nào là phiên bản tốt nhất. Điều này giúp đảm bảo trang chính sẽ được ưu tiên xuất hiện trên kết quả tìm kiếm. Bên cạnh đó, nếu bạn có bakclink trỏ về các trang thay thế, khi bạn dùng thẻ canonical thì các link này sẽ được tính là trỏ về canonical URL và tạo hiệu quả tích cực lên thứ hạng.

Cách tối ưu các thẻ Canonical

Nếu bạn không dùng thẻ canonical đúng cách, Google sẽ không quan tâm tới nó. Thẻ canonical không được dùng hợp lý cũng sẽ gây hại đến hiệu suất SEO của trang. Những cách tối ưu thẻ Canonical là:

Mỗi trang chỉ được có một thẻ canonical

Lưu ý rằng bạn chỉ nên chỉ định một canonical URL trên mỗi trang để không khiến Google bị nhầm lẫn. Hãy cẩn thận để không vô tình gắn hai canonical URL trên trang. Nếu bạn thiết lập canonical tag trong CMS thì không cần thêm vào HTML theo cách thủ công nữa. Và nếu bạn thêm thẻ rel=”canonical” vào HTML thì không thêm nó vào HTTP header.

canonical code
Mỗi trang chỉ nên có một thẻ canonical

Xác định các URL có dấu gạch chéo hoặc không có

Khi thiết lập thẻ canonical, hãy chú ý xem trang có sử dụng dấu gạch chéo ở cuối hay không (là ký hiệu “/” ở cuối URL).

Ví dụ:

  • Có dấu gạch chéo: https://example.com/
  • Không có dấu gạch chéo: https://example.com

Nếu cùng một trang tồn tại đối với cả đường dẫn có dấu gạch chéo và không có dấu gạch chéo, Google có thể xem chúng là hai URL riêng biệt. Hãy đảm bảo rằng tham chiếu đến canonical URL của bạn là chính xác và cố gắng nhất quán trên toàn website.

Xác định các URL WWW hoặc non-WWW

Các phiên bản WWW và non-WWW của một URL được các công cụ tìm kiếm coi là các trang trùng lặp. Ví dụ, “https://example.com/” và “https://www.example.com/” được xem là hai trang trùng nhau. Hãy chọn 1 phiên bản mà sử dụng nó trên toàn website.

Dùng URL tuyệt đối

Các thẻ Canonical nên được tham chiếu bằng cách sử dụng URL tuyệt đối thay vì URL tương đối. Điều đó có nghĩa là bạn nên sử dụng URL đầy đủ, bao gồm cả tên miền như thế này:

<link rel="canonical" href="https://myworld.com/blog/" />

Không nên dùng URL tương đối như sau:

<link rel="canonical" href="/blog/" />

Sử dụng URL viết thường

Vì Google có thể coi các URL viết hoa và viết thường là hai URL khác nhau, nên trước tiên bạn cần đảm bảo các URL được viết thường. Sau đó, sử dụng các URL viết thường cho các thẻ canonical của bạn.

Cách thiết lập thẻ Canonical trong WordPress

WordPress là một hệ thống quản lý nội dung (CMS) mã nguồn mở nổi tiếng và phổ biến trên toàn thế giới. Với giao diện thân thiện và dễ sử dụng, WordPress cho phép người dùng mọi trình độ kỹ thuật tạo nên các trang web chuyên nghiệp một cách dễ dàng và nhanh chóng.

Các plugin WordPress đa dạng có thể giúp người dùng làm được nhiều việc mà không cần quá nhiều kiến thức kỹ thuật. Bạn cũng có thể gắn thẻ canonical cho web nhờ vào plugin.

Yoast SEO

Nếu bạn đang dùng plugin Yoast SEO thì hãy chuyển đến bài đăng cần gắn thẻ canonical và mở trình biên tập Yoast SEO, sau đó mở tab “Advanced”. Bạn sẽ nhìn thấy một mục Canonical URL mà bạn có thể nhập vào. Như vậy, bạn chỉ cần nhập link chính vào và lưu thay đổi là xong.

canonical URL Yoast SEO
Cài canonical URL trong Yoast SEO

Rank Math

Một plugin khác mà bạn cũng có thể sử dụng là Rank Math. Đầu tiên bạn mở một bài viết mà bạn cần thêm canonical tag. Tiếp theo, bạn nhấp vào mục “Advanced” ở góc trên bên phải. Nhìn xuống cuối bảng, bạn sẽ nhìn thấy ô canonical URL để nhập. Bạn chỉ cần nhập URL của bài viết bạn muốn ưu tiên là xong.

Canonical URL Rank Math
Canonical URL trong Rank Math

Những cách khác để thiết lập canonical URL

Thông thường, bạn sẽ chỉ định canonical URL bằng cách sử dụng thẻ canonical. Tuy nhiên vẫn còn những phương pháp khác mà bạn có thể thử như:

  • Sử dụng rel=”canonical” trong HTTP Header: tốt nhất cho các tài liệu không phải HTML.
  • Redirect các trang trùng lặp sang trang chính: tốt nhất cho các trang trùng lặp mà bạn không cần giữ lại.
  • Chỉ định canonical URL trong sitemap: phương pháp hay nhất cho tất cả chủ sở hữu trang web.

Sử dụng rel=“canonical” trong HTTP Header

HTTP Header rel=“canonical” cho phép bạn chỉ định một canonical URL cho các tài liệu không phải HTML. Ví dụ: nếu bạn có phiên bản .docx và .pdf của cùng một tài liệu trực tuyến, bạn có thể sử dụng phương pháp này để cho biết phiên bản ưa thích của mình.

Tuy nhiên, bạn cần có khả năng thay đổi cấu hình máy chủ của mình. Trong tệp .htaccess, hãy chỉ định một canonical URL bằng cách thêm mã giống như sau:

Link: <https://www.example.com/downloads/filename.pdf>; rel="canonical"

Redirect các trang trùng lặp sang trang Canonical

Redirect là phương pháp chống trùng lặp nội dung tốt nhất nếu bạn không muốn giữ các phiên bản thay thế của trang chính. Ví dụ: khi bạn có phiên bản HTTP và HTTPS của cùng một trang, Google thích giao thức HTTPS hơn, vì vậy tốt nhất là redirect phiên bản HTTP sang phiên bản HTTPS. Google khuyên bạn nên sử dụng 3xx redirect để có kết quả nhanh nhất. Bạn cũng có thể tham khảo 301 redirect mà chúng tôi đã từng nhắc đến trước đây.

301 redirect
Dùng 301 redirect cho nội dung trùng lặp

Chỉ định các Canonical URL trong sitemap

Khi tạo Sitemap cho trang web của bạn, hãy bao gồm các canonical URL thay vì các trang thay thế. Điều này giúp các công cụ tìm kiếm hiểu rõ cấu trúc trang web của bạn và định hướng người dùng đến các phiên bản nội dung chính thức mà bạn muốn xuất hiện trong kết quả tìm kiếm.

Cách kiểm tra thẻ Canonical trên trang web

Bạn có thể tìm hiểu đâu là trang được Google cân nhắn để trở thành canonical URL với Google Search Console. Sau khi đăng nhập, hãy tìm kiếm một URL ở trên thanh tìm kiếm.

canonical trong seo
Kiểm tra canonical URL qua Google Search Console

Sau khi Google Search Console chạy xong báo cáo, bạn kéo xuống xem mục “Lập chỉ mục” để xem canonical URL được Google ghi nhận là URL nào.

canonical link là gì
Canonical URL do người dùng chọn và Google chọn

Nếu URL do Google chọn không giống với URL mà bạn đã chọn, bạn sẽ cần đến những phương pháp xử lý trùng lặp trang.

Để kiểm tra canonical tags của trang trên diện rộng, bạn có thể dùng Site Audit Tool của SEMrush. Trước tiên, bạn nhập vào thanh tìm kiếm domain cần kiểm tra, tiếp theo chọn “Issue” và gõ “canonical” để xem.

SEMrush
Kiểm tra canonical tag bằng SEMrush

Những lỗi thường gặp khi triển khai canonical tag

Việc triển khai thẻ canonical đôi khi không hiệu quả là vì mọi người không sử dụng chúng đúng cách. Vậy, những lỗi phổ biến nhất khi tạo thẻ canonical là gì?

Trỏ các thẻ Canonical tới các trang được redirect

Hãy cẩn thận để không chỉ định một canonical URL có redirect. Điều này sẽ chỉ gây nhầm lẫn cho Google. Ví dụ: Trang A có redirect đến Trang B. Bạn không nên thiết lập trang A là canonical URL vì chúng sẽ khiến bot của công cụ tìm kiếm bị nhầm lẫn. Thay vào đó, bạn nên dùng thẻ canonical trỏ trực tiếp đến Trang B.

thẻ canonical lỗi
Không trỏ link rel=”canonical” đến trang có redirect

Sử dụng thẻ Canonical cho nội dung không trùng lặp

Hãy cẩn thận khi dùng canonical tag cho những trang web không bị trùng lặp nội dung. Điều này là do thẻ canonical sẽ không cung cấp bất kỳ giá trị nào cho Google và có thể khiến trang web của bạn bị chậm lại. Ngoài ra, thẻ canonical có thể gây nhầm lẫn cho người dùng vì họ có thể không biết trang web nào là trang web chính.

Chặn canonical URL bằng robots.txt

Việc sử dụng robots.txt để chặn một URL sẽ ngăn Google thu thập dữ liệu của URL đó, nghĩa là công cụ tìm kiếm không thể thấy bất kỳ thẻ canonical nào trên trang đó. Điều này cũng có nghĩa là những giá trị như backlink sẽ không được chuyển từ trang thay thế đến canonical URL.

robots.txt
Không dùng robots.txt chặn canonical URL

Thiết lập canonical URL là “noindex”

Không bao giờ được sử dụng cùng lúc noindex và rel=”canonical”. Hai thẻ này được sử dụng vì những mục đích khác nhau. Google thường sẽ ưu tiên thẻ canonical hơn thẻ ‘noindex’ nhưng nó vẫn là một sai lầm tai hại. Nếu bạn muốn ngăn công cụ tìm kiếm lập chỉ mục và thiết lập canonical URL, hãy sử dụng redirect 301 hoặc dùng rel=”canonical”.

Thẻ rel=”canonical” nằm ở <body>

Rel=”canonical” chỉ nên xuất hiện trong phần <head> của mã nguồn trang. Nếu thẻ canonical nằm ở <body>, nó sẽ bị bỏ qua. Nếu thẻ rel=”canonical” nằm trong phần <body>, các công cụ tìm kiếm có thể gặp khó khăn trong việc nhận diện và xử lý nội dung của trang web.

Lời kết

Thẻ canonical đóng vai trò quan trọng trong việc giải quyết vấn đề trùng lặp nội dung và tối ưu hóa công cụ tìm kiếm cho trang web. Việc áp dụng thẻ canonical sẽ giúp bạn tránh mất điểm về SEO do nội dung trùng lặp, cải thiện hiệu suất trang web và tạo ra trải nghiệm người dùng tốt hơn.

Hy vọng bài viết của Miko Tech đã giúp bạn hiểu canonical là gì và cung cấp những thông tin hữu ích về thẻ canocical. Nếu bạn còn bất cứ thắc mắc nào có thể để lại câu hỏi cho MiKo Tech nhé!

08.08.2023 Trần Tiến Duy

Bình luận đã bị đóng.

Bài viết liên quan
Bài viết nổi bật
Scroll
error: Content is protected !!