Nếu website của bạn đang xây dựng trên nền tảng CMS wordpress và đang gặp về vấn đề phan trang cho web. Nếu web của bạn chỉ là trang nội bộ không qua quan tâm về SEO lên top thì bạn bỏ qua bài này, còn nếu web của bạn là web giới thiệu dịch vụ hay bán hàng thì việc trùng lặp phân trang ảnh hưởng đến SEO cực kỳ nhiều. Để biết làm sao bị trùng lặp phân trang bạn nên cài đặt google search console thì google sẽ gửi thông báo về cho bạn. Và việc xử lý trùng lặp phân trang như thế nào thì mời bạn xem tiếp bài dưới đây nhé.
Cách xử lí trùng lặp phân trang (page) trong wordpress
Không cho noindex các trang subpage.
Disallow bằng robots.txt
Sử dụng thẻ Canonical về trang page chính đầu tiên của chuyên mục, thẻ, và trang chủ.
Chỉnh sửa lại tiêu đề và mô tả cho các subcatagory một cách tối ưu nhất
Canonical
Bạn có thể dễ dàng thêm mã này vào tệp chủ đề functions.php (theme con) của mình hoặc bên trong một plugin tùy chỉnh.
Để đặt rel = canonical trỏ đến trang đầu tiên của danh sách được phân trang trong WordPress (dành cho danh mục hoặc thẻ) và sử dụng WordPress seo, bạn có thể dễ dàng thêm bộ lọc bằng một đoạn mã nhỏ.
Code bên dưới sử dụng cho Yoast SEO
add_filter(‘wpseo_canonical’, ‘my_wpseo_canonical’);
function my_wpseo_canonical($canonical) {
if (is_paged()) {
if (is_home()) {
return home_url();
}
if (is_archive()) {
$url = get_category_link(get_queried_object_id());
return $url;
}
}
return $canonical;
}
Code dành cho ai dùng the_seo_framework:
function filter_wpseo_canonical( $canonical ) {
// make filter magic happen here…
if (is_paged()) {
if (is_home()) {
return home_url();
}
if (is_archive()) {
$url = get_category_link(get_queried_object_id());
return $url;
}
}
return $canonical;
};
// add the filter
add_filter( ‘the_seo_framework_rel_canonical_output’, ‘filter_wpseo_canonical’, 10, 1 );
Noindex các sub archive
Blog đình đàm thạch phạm sử dụng noindex để chặn bộ máy tìm kiếm index các subpage.
Cách 1: Sử dụng theseoframework
Các plugin seo khác cũng có chức năng này.
Mình hay sử dụng cách này để không cho con bot của google index các trang này. Hiện tại mình sử dụng theseoframework cho hầu hết các blog của mình và rất hài lòng.
Trong phần Homepage Settings và Robots Meta Settings có mục Apply noindex to every second or later archive page?. Bạn tích vào thì nó sẽ tự động Noindex cho toàn bộ các subcatagory và subtag.
Cách 2: Chèn code vào header.php
<?php
// fix duplicate listing add noindex automatically to date, author and tag archives
if($paged > 1 || is_author() || is_tag() || is_date() || is_attachment()){
echo ‘<meta name=”robots” content=”noindex,follow” />’; }
?>
Sử dụng Disallow
Ngoài ra các bạn cũng có thể chặn index bằng cách khai báo Disallow với tệp tin robots.txt bằng cách thêm dòng sau đây vào bên dưới tệp tin này.
Disallow: /page/
Chỉnh sửa lại tiêu đề và mô tả các subpage
Thật ra các dạng trang phân trang /page/ trong wordpress rất khó mà trùng lặp được vì mỗi một trang page con sẽ tập hợp một số lượng bài viết nhất định khác nhau.
Chính vì thế mà nội dung giữa tập hợp giữa page/1 sẽ khác page/2 và page/3 … Khi gặp lỗi này các bạn chỉ cần chỉnh sửa lại tiêu đề, mô tả của các subpage là xong.
Các bạn nên thêm số trang %page%, %pagenumber%, %id%… vào Category Archive Titles và Category Archive Descriptions của các plugin seo sao cho hợp lí nhất để không gây trùng lặp.
Có nhiều cách xử lí trùng lặp phân trang /page/ trong các trang web, tùy trường phái seo và kiểu cấu trúc web của bạn mà chọn cách làm phù hợp nhất.
Trên là những cách xử lý cơ bản nhất, bạn đang có cách xử lý nào hay hơn hãy chia sẽ thêm cùng các bạn đọc nhé.
Chúc bạn thành công !