Canonical là gì? Trong lĩnh vực SEO, đây là một thuật ngữ khá quen thuộc. Nhờ có canonical tag, chúng ta có thể giải quyết vấn đề trùng lặp nội dung trên website. Trong bài viết hôm nay, Miko Tech sẽ cùng các các bạn tìm hiểu về canonical URL, thẻ canonical cũng như cách sử dụng thẻ một cách hợp lý. Cùng bắt đầu nhé!
Canonical URL là gì?
Canonical là gì? Canonical URL là phiên bản chính của tất cả các trang bị trùng lặp được công cụ tìm kiếm ghi nhận, chẳng hạn như Google.
Google không thích những trang trùng lặp nội dung và nó không muốn hiển thị những kết quả tìm kiếm giống hệt nhau. Vì đơn giản, những trang này khá lãng phí tài nguyên và không mang lại giá trị nào cả.
Mỗi khi Google tìm thấy những trang trùng lặp hoặc “na ná” nhau trên cùng một website, nó sẽ tự chọn ra một trang gốc đại diện cho tất cả các trang đó. Trang đại diện này sẽ được ưu tiên lập chỉ mục cũng như xếp hạng trên SERP. Tuy nhiên, không phải sự lựa chọn nào của Google cũng hợp lý, và đó là lý do chúng ta cần đến các thẻ canonical.
Thẻ Canonical là gì?
Thẻ canonical, hay còn gọi là thẻ rel=”canonical” là meta tag được sử dụng để thông báo cho Google biết trang nào là trang gốc trong trường hợp có nhiều URL chứa nội dung trùng lặp. Thẻ canonical thường xuất hiện ở phần <head> trong mã nguồn HTML của trang và nhìn như sau:
Thông thường, canonical tag sẽ nằm trong mã nguồn của trang thay thế (các trang trùng lặp còn lại) và trỏ đến trang chính. Tuy nhiên, tại trang chính cũng cần có thẻ canonical trỏ về chính nó.
Dùng thẻ Canonical trong trường hợp nào?
Thẻ canonical được dùng để xử lý vấn đề trùng lặp nội dung. Các trang bị trùng lặp nội dung có thể khiến web xảy ra tình trạng cannibalization. Cannibalization (hay Ăn thịt từ khóa) là tình trạng xảy ra khi nhiều trang trên cùng một website cạnh tranh lẫn nhau với cùng một từ khóa. Tình huống tệ nhất là không trang nào được xếp hạng trên kết quả tìm kiếm.
Quá nhiều nội dung trùng lặp cũng có thể ảnh hưởng đến thời hạn thu thập thông tin của website. Điều đó có nghĩa là thay vì khám phá nội dung quan trọng khác trên trang web của bạn, Googlebot có thể sẽ lãng phí thời gian để thu thập dữ liệu cho nhiều phiên bản của cùng một trang.
Bằng cách sử dụng canonical tag, chủ sở hữu web sẽ báo cho Google biết trang nào là phiên bản tốt nhất. Điều này giúp đảm bảo trang chính sẽ được ưu tiên xuất hiện trên kết quả tìm kiếm. Bên cạnh đó, nếu bạn có bakclink trỏ về các trang thay thế, khi bạn dùng thẻ canonical thì các link này sẽ được tính là trỏ về canonical URL và tạo hiệu quả tích cực lên thứ hạng.
Cách tối ưu các thẻ Canonical
Nếu bạn không dùng thẻ canonical đúng cách, Google sẽ không quan tâm tới nó. Thẻ canonical không được dùng hợp lý cũng sẽ gây hại đến hiệu suất SEO của trang. Những cách tối ưu thẻ Canonical là:
Mỗi trang chỉ được có một thẻ canonical
Lưu ý rằng bạn chỉ nên chỉ định một canonical URL trên mỗi trang để không khiến Google bị nhầm lẫn. Hãy cẩn thận để không vô tình gắn hai canonical URL trên trang. Nếu bạn thiết lập canonical tag trong CMS thì không cần thêm vào HTML theo cách thủ công nữa. Và nếu bạn thêm thẻ rel=”canonical” vào HTML thì không thêm nó vào HTTP header.
Xác định các URL có dấu gạch chéo hoặc không có
Khi thiết lập thẻ canonical, hãy chú ý xem trang có sử dụng dấu gạch chéo ở cuối hay không (là ký hiệu “/” ở cuối URL).
Ví dụ:
- Có dấu gạch chéo: https://example.com/
- Không có dấu gạch chéo: https://example.com
Nếu cùng một trang tồn tại đối với cả đường dẫn có dấu gạch chéo và không có dấu gạch chéo, Google có thể xem chúng là hai URL riêng biệt. Hãy đảm bảo rằng tham chiếu đến canonical URL của bạn là chính xác và cố gắng nhất quán trên toàn website.
Xác định các URL WWW hoặc non-WWW
Các phiên bản WWW và non-WWW của một URL được các công cụ tìm kiếm coi là các trang trùng lặp. Ví dụ, “https://example.com/” và “https://www.example.com/” được xem là hai trang trùng nhau. Hãy chọn 1 phiên bản mà sử dụng nó trên toàn website.
Dùng URL tuyệt đối
Các thẻ Canonical nên được tham chiếu bằng cách sử dụng URL tuyệt đối thay vì URL tương đối. Điều đó có nghĩa là bạn nên sử dụng URL đầy đủ, bao gồm cả tên miền như thế này:
<link rel="canonical" href="https://myworld.com/blog/" />
Không nên dùng URL tương đối như sau:
<link rel="canonical" href="/blog/" />
Sử dụng URL viết thường
Vì Google có thể coi các URL viết hoa và viết thường là hai URL khác nhau, nên trước tiên bạn cần đảm bảo các URL được viết thường. Sau đó, sử dụng các URL viết thường cho các thẻ canonical của bạn.
Cách thiết lập thẻ Canonical trong WordPress
WordPress là một hệ thống quản lý nội dung (CMS) mã nguồn mở nổi tiếng và phổ biến trên toàn thế giới. Với giao diện thân thiện và dễ sử dụng, WordPress cho phép người dùng mọi trình độ kỹ thuật tạo nên các trang web chuyên nghiệp một cách dễ dàng và nhanh chóng.
Các plugin WordPress đa dạng có thể giúp người dùng làm được nhiều việc mà không cần quá nhiều kiến thức kỹ thuật. Bạn cũng có thể gắn thẻ canonical cho web nhờ vào plugin.
Yoast SEO
Nếu bạn đang dùng plugin Yoast SEO thì hãy chuyển đến bài đăng cần gắn thẻ canonical và mở trình biên tập Yoast SEO, sau đó mở tab “Advanced”. Bạn sẽ nhìn thấy một mục Canonical URL mà bạn có thể nhập vào. Như vậy, bạn chỉ cần nhập link chính vào và lưu thay đổi là xong.
Rank Math
Một plugin khác mà bạn cũng có thể sử dụng là Rank Math. Đầu tiên bạn mở một bài viết mà bạn cần thêm canonical tag. Tiếp theo, bạn nhấp vào mục “Advanced” ở góc trên bên phải. Nhìn xuống cuối bảng, bạn sẽ nhìn thấy ô canonical URL để nhập. Bạn chỉ cần nhập URL của bài viết bạn muốn ưu tiên là xong.
Những cách khác để thiết lập canonical URL
Thông thường, bạn sẽ chỉ định canonical URL bằng cách sử dụng thẻ canonical. Tuy nhiên vẫn còn những phương pháp khác mà bạn có thể thử như:
- Sử dụng rel=”canonical” trong HTTP Header: tốt nhất cho các tài liệu không phải HTML.
- Redirect các trang trùng lặp sang trang chính: tốt nhất cho các trang trùng lặp mà bạn không cần giữ lại.
- Chỉ định canonical URL trong sitemap: phương pháp hay nhất cho tất cả chủ sở hữu trang web.
Sử dụng rel=“canonical” trong HTTP Header
HTTP Header rel=“canonical” cho phép bạn chỉ định một canonical URL cho các tài liệu không phải HTML. Ví dụ: nếu bạn có phiên bản .docx và .pdf của cùng một tài liệu trực tuyến, bạn có thể sử dụng phương pháp này để cho biết phiên bản ưa thích của mình.
Tuy nhiên, bạn cần có khả năng thay đổi cấu hình máy chủ của mình. Trong tệp .htaccess, hãy chỉ định một canonical URL bằng cách thêm mã giống như sau:
Link: <https://www.example.com/downloads/filename.pdf>; rel="canonical"
Redirect các trang trùng lặp sang trang Canonical
Redirect là phương pháp chống trùng lặp nội dung tốt nhất nếu bạn không muốn giữ các phiên bản thay thế của trang chính. Ví dụ: khi bạn có phiên bản HTTP và HTTPS của cùng một trang, Google thích giao thức HTTPS hơn, vì vậy tốt nhất là redirect phiên bản HTTP sang phiên bản HTTPS. Google khuyên bạn nên sử dụng 3xx redirect để có kết quả nhanh nhất. Bạn cũng có thể tham khảo 301 redirect mà chúng tôi đã từng nhắc đến trước đây.
Chỉ định các Canonical URL trong sitemap
Khi tạo Sitemap cho trang web của bạn, hãy bao gồm các canonical URL thay vì các trang thay thế. Điều này giúp các công cụ tìm kiếm hiểu rõ cấu trúc trang web của bạn và định hướng người dùng đến các phiên bản nội dung chính thức mà bạn muốn xuất hiện trong kết quả tìm kiếm.
Cách kiểm tra thẻ Canonical trên trang web
Bạn có thể tìm hiểu đâu là trang được Google cân nhắn để trở thành canonical URL với Google Search Console. Sau khi đăng nhập, hãy tìm kiếm một URL ở trên thanh tìm kiếm.
Sau khi Google Search Console chạy xong báo cáo, bạn kéo xuống xem mục “Lập chỉ mục” để xem canonical URL được Google ghi nhận là URL nào.
Nếu URL do Google chọn không giống với URL mà bạn đã chọn, bạn sẽ cần đến những phương pháp xử lý trùng lặp trang.
Để kiểm tra canonical tags của trang trên diện rộng, bạn có thể dùng Site Audit Tool của SEMrush. Trước tiên, bạn nhập vào thanh tìm kiếm domain cần kiểm tra, tiếp theo chọn “Issue” và gõ “canonical” để xem.
Những lỗi thường gặp khi triển khai canonical tag
Việc triển khai thẻ canonical đôi khi không hiệu quả là vì mọi người không sử dụng chúng đúng cách. Vậy, những lỗi phổ biến nhất khi tạo thẻ canonical là gì?
Trỏ các thẻ Canonical tới các trang được redirect
Hãy cẩn thận để không chỉ định một canonical URL có redirect. Điều này sẽ chỉ gây nhầm lẫn cho Google. Ví dụ: Trang A có redirect đến Trang B. Bạn không nên thiết lập trang A là canonical URL vì chúng sẽ khiến bot của công cụ tìm kiếm bị nhầm lẫn. Thay vào đó, bạn nên dùng thẻ canonical trỏ trực tiếp đến Trang B.
Sử dụng thẻ Canonical cho nội dung không trùng lặp
Hãy cẩn thận khi dùng canonical tag cho những trang web không bị trùng lặp nội dung. Điều này là do thẻ canonical sẽ không cung cấp bất kỳ giá trị nào cho Google và có thể khiến trang web của bạn bị chậm lại. Ngoài ra, thẻ canonical có thể gây nhầm lẫn cho người dùng vì họ có thể không biết trang web nào là trang web chính.
Chặn canonical URL bằng robots.txt
Việc sử dụng robots.txt để chặn một URL sẽ ngăn Google thu thập dữ liệu của URL đó, nghĩa là công cụ tìm kiếm không thể thấy bất kỳ thẻ canonical nào trên trang đó. Điều này cũng có nghĩa là những giá trị như backlink sẽ không được chuyển từ trang thay thế đến canonical URL.
Thiết lập canonical URL là “noindex”
Không bao giờ được sử dụng cùng lúc noindex và rel=”canonical”. Hai thẻ này được sử dụng vì những mục đích khác nhau. Google thường sẽ ưu tiên thẻ canonical hơn thẻ ‘noindex’ nhưng nó vẫn là một sai lầm tai hại. Nếu bạn muốn ngăn công cụ tìm kiếm lập chỉ mục và thiết lập canonical URL, hãy sử dụng redirect 301 hoặc dùng rel=”canonical”.
Thẻ rel=”canonical” nằm ở <body>
Rel=”canonical” chỉ nên xuất hiện trong phần <head> của mã nguồn trang. Nếu thẻ canonical nằm ở <body>, nó sẽ bị bỏ qua. Nếu thẻ rel=”canonical” nằm trong phần <body>, các công cụ tìm kiếm có thể gặp khó khăn trong việc nhận diện và xử lý nội dung của trang web.
Lời kết
Thẻ canonical đóng vai trò quan trọng trong việc giải quyết vấn đề trùng lặp nội dung và tối ưu hóa công cụ tìm kiếm cho trang web. Việc áp dụng thẻ canonical sẽ giúp bạn tránh mất điểm về SEO do nội dung trùng lặp, cải thiện hiệu suất trang web và tạo ra trải nghiệm người dùng tốt hơn.
Hy vọng bài viết của Miko Tech đã giúp bạn hiểu canonical là gì và cung cấp những thông tin hữu ích về thẻ canocical. Nếu bạn còn bất cứ thắc mắc nào có thể để lại câu hỏi cho MiKo Tech nhé!
Trần Tiến Duy tốt nghiệp cử nhân chuyên ngành Thương Mại Điện tử tại trường đại học Sư Phạm Kỹ Thuật TPHCM. Từng Phụ trách mảng SEO Website tại nhiều lĩnh vực như giáo dục, công nghệ, thực phẩm, đồ dùng gia dụng, …v.v
Trần Tiến Duy hiện đang là Giảng viên Digital Marketing với chuyên môn chính là SEO tại trường Cao Đẳng FPT Tp.HCM.
Với hơn 5+ năm kinh nghiệm training & quản lý nhân sự về quản lý các dự án SEO/ Content SEO.
Hiện tại Trần Tiến Duy là SEO Manager tại công ty Miko Tech Agency chuyên về Thiết Kế Website, với sự Quản lý của anh đã đưa Miko Tech trở thành công ty chuyên về Thiết Kế Website thuộc TOP ngành trên nền tảng Internet hiện nay. Ngoài ra anh Trần Tiến Duy còn đào tạo training nhân viên. Ngoài ra anh Trần Tiến Duy còn đào tạo training nhân viên khoá học SEO Website nội bộ cho Doanh nghiệp giúp Doanh Nghiệp tối ưu tốc độ website phát triển kinh doanh mạnh mẽ hơn trong thời đại công nghệ số 4.0 hiện nay.
Anh Trần Tiến Duy còn chia sẻ miễn phí những Tool SEO hiệu quả giúp anh em SEOer tiết kiệm thời gian và được rất nhiều anh em trong giới SEOer và sinh viên sử dụng tại website: trantienduy.com/tool/