Theo dõi kết quả từ 300 website mới cho thấy 78% các trang thực hiện chiến lược lập chỉ mục có hệ thống có thể được Google index trong vòng 7 ngày.
Bài viết này sẽ trình bày chi tiết một quy trình đã được kiểm chứng: từ việc gửi website chính xác qua Google Search Console, đến tối ưu tốc độ tải, xây dựng khung nội dung, cho đến việc lấy backlink đầu tiên từ diễn đàn ngành.
Mỗi bước đều có tiêu chuẩn thực thi có thể đo lường được (ví dụ: tốc độ tải trên di động nên dưới 2 giây, tổng số từ bài viết trong tháng đầu nên trong khoảng 800-1200 từ).

Table of Contens
ToggleChủ động thông báo với Google “Tôi đã lên sóng” (Gửi cơ bản)
Nhiều người mới nhầm tưởng rằng chỉ cần website hoạt động thì Google sẽ tự tìm thấy. Tuy nhiên, dữ liệu thử nghiệm cho thấy nếu không gửi chủ động thì trung bình cần tới 27 ngày mới được index.
Giống như một cửa hàng mở mới cần treo biển hiệu, website cũng cần “báo cáo” với Google.
Google Search Console là kênh liên lạc trực tiếp hiệu quả nhất, nhưng hơn 60% người dùng mắc lỗi trong lần gửi đầu tiên.
Hoặc chỉ gửi trang chủ mà bỏ qua trang nội bộ, hoặc tạo sitemap sai khiến bot “lạc đường”.
Lựa chọn và thực hành 2 cách gửi phù hợp theo tình huống
① Gửi từng trang (phù hợp với trang cần index gấp)
- Đường dẫn thao tác: Đăng nhập Google Search Console → bên trái “Kiểm tra URL” → nhập URL đầy đủ → nhấn “Yêu cầu lập chỉ mục”
- Tốc độ hiệu lực: Dữ liệu thử nghiệm cho thấy khoảng 68% trang được crawl trong vòng 24 giờ (nếu không có trở ngại crawl)
- Trường hợp áp dụng: Trang ra mắt sản phẩm mới, trang ưu đãi giới hạn thời gian cần index sớm
② Gửi toàn site (khuyến nghị bắt buộc cho website mới)
Giá trị cốt lõi: Thông qua sitemap XML thông báo cấu trúc toàn site cho Google, giảm nguy cơ bỏ sót crawl.
Các công cụ tạo sitemap so sánh:
Người dùng WordPress: Plugin Yoast SEO / Rank Math tự động tạo (chỉ 10 giây)
Không dùng CMS: Dùng Screaming Frog crawl toàn bộ website và xuất sitemap.xml (miễn phí cho dưới 500 trang)
Trường hợp khẩn cấp cho người mới: Dùng công cụ trực tuyến XML-Sitemaps.com (phiên bản miễn phí giới hạn 500 trang)
3 bước cần kiểm tra sau khi gửi (Checklist tự kiểm tra)
Xác minh trạng thái được lập chỉ mục
- Đường dẫn: Search Console → Chỉ mục → Trang → Xem số lượng “Đã gửi” và “Đã lập chỉ mục”
- Trạng thái bình thường: Sau khi gửi 48h, tỷ lệ “Đã lập chỉ mục” nên đạt ít nhất 30%
Kiểm tra thống kê thu thập dữ liệu
- Trọng điểm kiểm tra: Thống kê thu thập dữ liệu → Theo loại phản hồi → Lọc các trang “Thất bại”
- Lỗi phổ biến: 404 (nên redirect 301), máy chủ quá tải (nên nén ảnh dưới 300KB)
Kiểm tra khả năng sử dụng trên thiết bị di động
- Công cụ: Search Console → Báo cáo khả năng sử dụng trên thiết bị di động
- Chỉ số chính: Cỡ chữ không dưới 16px, khoảng cách giữa các phần tử có thể click ≥ 8px
Danh sách lỗi thường gặp trên website mới (kèm giải pháp)
| Loại lỗi | Biểu hiện thường gặp | Giải pháp |
|---|---|---|
| Gửi trùng lặp | Cùng 1 trang được gửi thủ công quá 3 lần/tuần | Chuyển sang tự động gửi bằng code (ví dụ: theo dõi sự kiện trong Google Analytics 4) |
| Bị chặn bởi robots.txt | Disallow: / hoặc vô tình chặn file CSS/JS | Dùng công cụ kiểm tra robots.txt để xác minh quyền truy cập của bot |
| Thông số động hỗn loạn | Một sản phẩm tạo ra nhiều URL (?color=red&size=38) | Cấu hình quy tắc URL có thể đọc trong công cụ thông số URL của Google |
| Sitemap lỗi thời | Các trang chưa được index có timestamp trong sitemap cũ hơn 7 ngày | Cài đặt CMS để tự động cập nhật sitemap.xml |
Trường hợp thực tế: Một website nội thất sau 2 tuần chỉ index được trang chủ. Sau khi kiểm tra phát hiện có dòng “Disallow: /product/” trong robots.txt. Sau khi sửa, Google index hơn 800 trang sản phẩm trong vòng 24h.
Tối ưu cấu trúc site giúp bot dễ crawl hơn (Tối ưu kỹ thuật)
Google bot giống như khách đến lần đầu, nếu cấu trúc site phức tạp, đường dẫn rối rắm, bot dễ “lạc lối” hoặc “bỏ cuộc”.
Dữ liệu cho thấy các website có cấu trúc tối ưu thì độ sâu crawl trung bình tăng 2.8 lần, số trang được index tăng 47%.
Nhưng nhiều website mới mắc sai lầm: dùng JS tải nội dung động khiến bot không thấy, hoặc tốc độ tải trên mobile quá chậm làm gián đoạn crawl.
3 bước kiểm tra và sửa lỗi robots.txt nghiêm trọng
① Các lỗi thường gặp
- Chặn quá mức:
Disallow: /(chặn toàn site) hoặcDisallow: /css/(vô tình chặn file giao diện) - Không phân biệt chữ hoa/thường:
Disallow: /Admin(bot vẫn truy cập được /admin) - Không cập nhật rule: Các trang đã xóa vẫn cho phép crawl (dẫn đến nhiều lỗi 404)
② Công cụ tự kiểm tra
- Trình xác thực chính thức: Search Console → Công cụ kiểm tra robots.txt → Nhập đường dẫn để mô phỏng bot truy cập
- Kiểm tra bên thứ ba: So sánh kết quả crawl của Screaming Frog (lọc URL bị chặn bởi robots.txt)
③ Trường hợp sửa lỗi
Một nền tảng giáo dục có dòng Disallow: /course/?page= trong robots.txt khiến hơn 2000 trang khóa học không được crawl. Sau khi sửa thành Allow: /course/, số lượng trang được lập chỉ mục đã tăng từ 84 lên 1120 chỉ trong 3 ngày.
3 tiêu chí bắt buộc để tối ưu hóa trên thiết bị di động (kèm giải pháp)
| Chỉ số | Ngưỡng đạt chuẩn | Giải pháp tối ưu |
|---|---|---|
| Tốc độ tải trang | ≤2,3 giây | Nén ảnh bằng định dạng WebP (dụng cụ: ShortPixel), tải JS/CSS trì hoãn |
| Khoảng cách giữa các phần tử có thể nhấp | ≥8px | Dùng Lighthouse trong Chrome DevTools để kiểm tra khoảng cách các mục chạm |
| Độ dễ đọc của văn bản | Cỡ chữ chính ≥16px | Tránh dùng chữ trang trí dưới 12px (như dòng bản quyền) |
Gợi ý công cụ:
- Kiểm tra tốc độ: PageSpeed Insights (phải đạt chuẩn cả phiên bản mobile và desktop)
- Kiểm tra hiển thị: Search Console → Báo cáo khả năng sử dụng trên thiết bị di động
Thực hành tối ưu hóa điều hướng Breadcrumb (có ví dụ code)
① Cấu trúc HTML chuẩn
② Dữ liệu hiệu quả SEO
- Nhóm thử nghiệm (n=30): Sau khi thêm breadcrumb có cấu trúc, tần suất crawl trang danh mục tăng 120%
- Hành vi người dùng: Breadcrumb chiếm 7.2% tổng số lượt nhấp, tỷ lệ thoát giảm 11%
Nguyên tắc vàng tối ưu cấu trúc URL
① Kiểm soát độ sâu cấp bậc
- Cấu trúc lý tưởng:
domain.com/category/subcategory/product(≤4 cấp) - Ví dụ không tốt:
domain.com/2023/blog/08/seo/tips/url-design(6 cấp dễ bị bot bỏ qua)
② Xử lý tham số động
- Thiết lập trong Search Console: Công cụ URL Parameters → Chỉ định tham số có thể bỏ qua (như sắp xếp ?sort=price)
- Trường hợp thực tế: Một website bán giày đổi từ
/product?id=123sang/product/nike-air-max-123, tỷ lệ lập chỉ mục tăng từ 34% lên 89%
③ Chuẩn hóa website đa ngôn ngữ
- Phải thêm thẻ hreflang:
- Hậu quả sai sót: Các phiên bản ngôn ngữ bị xem là nội dung trùng lặp, tỷ lệ lập chỉ mục giảm 62%
Kỹ thuật nâng cao: Cách ít người biết giúp bot crawl nhanh hơn
Chủ động đẩy nội dung mới (phù hợp với các trang có nội dung cập nhật nhanh)
- Công cụ: Google Indexing API (cần lập trình tích hợp)
- Kết quả: Các trang tin tức sau khi đẩy sẽ được lập chỉ mục trung bình trong 15 phút
Dẫn link từ trang có độ uy tín cao
Chèn liên kết văn bản đến 3–5 trang mới từ các trang đã được lập chỉ mục (như trang chủ)
Thực tế: Tỷ lệ crawl các trang mới tăng từ 17% lên 68%
Giảm trùng lặp nội dung
Dùng thẻ để gom các trang tương tự lại (ví dụ phân trang ?page=2)
Đăng 5-10 bài viết chất lượng cao trước (Chiến lược nội dung)
Sai lầm lớn nhất của website mới là nghĩ rằng “đăng vài bài là được Google index”
Dữ liệu thực tế cho thấy: website nội dung mỏng (dưới 500 từ, không đúng nhu cầu tìm kiếm) có 83% khả năng mất hết traffic tự nhiên trong vòng 3 tháng.
Chiến lược hiệu quả thật sự là: giai đoạn đầu nên tập trung xây dựng 5-10 bài viết “mẫu mực”, vừa đúng mục đích tìm kiếm của người dùng, vừa tạo khung chuẩn cho các bài sau.
Ví dụ: Một website bán đồ cho thú cưng đã đăng 7 bài viết dạng “Hướng dẫn chọn thức ăn cho chó” (mỗi bài 1200+ từ, kèm Q&A theo tình huống) trong tháng đầu, được Google index toàn bộ chỉ trong 3 ngày, đồng thời tần suất crawl toàn site tăng gấp đôi.
Cấu trúc 3 tầng cho nội dung hỏi đáp (kèm mẫu)
① Cách đưa vấn đề lên trước (200 từ đầu bắt buộc có từ khóa)
【Tình huống người dùng】”Tại sao chó của tôi ăn xong là bị tiêu chảy?”
【Vấn đề chính】Thành phần thức ăn không phù hợp hệ tiêu hoá
【Số liệu】Theo thống kê từ bệnh viện thú y XX, 63% trường hợp tiêu chảy do nguồn protein không phù hợp
② Giải đáp theo từng tầng
- Phân tích thành phần: Liệt kê các thương hiệu có protein động vật ≥30% (đính kèm link mua)
- Phác đồ cho ăn: Tính lượng thức ăn theo cân nặng (chèn mã tính tự động)
- Xử lý tạm thời: Khuyến nghị cho ăn bí đỏ nghiền trong giai đoạn tiêu chảy (đính kèm video hướng dẫn)
③ Gài yếu tố tương tác
- Cuối bài đặt câu hỏi: “Chó nhà bạn có từng bị nôn khi đổi thức ăn không?” → Kích thích bình luận, tăng thời gian onsite
- Kết quả: Trang thú cưng này tăng thời gian trung bình từ 38 giây lên 4 phút 12 giây
Đào từ khóa: 3 mẹo để tránh traffic ảo
① Dùng Google Keyword Planner hiệu quả
Cài bộ lọc:
- Lượng tìm kiếm hàng tháng từ 50-1000 (tránh từ khóa cạnh tranh cao)
- Chiều dài từ khóa ≥4 từ (VD: “cách xử lý chó tiêu chảy do thức ăn” có tỷ lệ chuyển đổi gấp 3 lần “thức ăn cho chó”)
- Loại bỏ từ khóa thương hiệu (VD: “Royal Canin”)
② Bộ công cụ mở rộng long-tail keyword
- AnswerThePublic: Lấy ý tưởng câu hỏi kiểu “làm sao để…” (bản miễn phí tải được 50 từ)
- Semrush: Lọc các từ có “có nên/làm sao/tại sao”
- Case thực tế: Một trang thiết bị đo đạc lọc nhóm từ “cách hiệu chỉnh máy XX” → một bài viết đạt 24.000 lượt/tháng
Quy tắc vàng cho bố cục hình và chữ (Tối ưu đa thiết bị)
① Tỉ lệ đề xuất
| Loại nội dung | Tỷ lệ chữ | Tỷ lệ ảnh/video | Yếu tố tương tác |
|---|---|---|---|
| Dạng hướng dẫn | 40% | 50% | Nút thu gọn/mở rộng bước |
| Đánh giá sản phẩm | 60% | 35% | Bảng so sánh thông số |
| Danh sách/liệt kê | 30% | 65% | Menu điều hướng dạng anchor |
② Tối ưu hình ảnh
- Kích thước: Rộng chuẩn 1200px (hỗ trợ màn hình Retina)
- ALT Text: Từ khoá + mô tả bối cảnh (VD: “cách xử lý chó tiêu chảy – ảnh thực tế chó Golden ăn thử”)
- Công cụ nén: TinyPNG (nén 70% mà gần như không giảm chất lượng)
③ Những điều tránh trên mobile
- Tránh dùng ảnh trượt ngang (PC thì tốt, mobile dễ bấm nhầm hơn 60%)
- Khoảng cách ảnh và chữ ≥16px (tránh bấm nhầm)
Mẹo tăng tốc được index ít người biết nhưng hiệu quả
Mô hình liên kết nội bộ dạng kim tự tháp
Mỗi bài mới nên được ít nhất 3 bài cũ dẫn link (sử dụng từ khóa liên quan làm anchor text)
Ví dụ: Một website pháp luật dẫn link từ bài cũ “Thủ tục ly hôn” đến bài mới “Kỹ thuật thu thập chứng cứ giành quyền nuôi con” → bài mới được index trong vòng 48h
Dùng dữ liệu cấu trúc (structured data)
Các bài hướng dẫn nên thêm HowTo schema (ví dụ):
<script type=”application/ld+json”>
{
“@context”: “https://schema.org”,
“@type”: “HowTo”,
“name”: “Cách xử lý chó tiêu chảy do thức ăn”,
“step”: [{
“@type”: “HowToStep”,
“text”: “Bước 1: Ngưng cho ăn loại thức ăn hiện tại trong 24h”
}]
}
</script>
Kết quả: Trang có dữ liệu schema được index nhanh hơn trung bình 1.8 lần
Chiến lược “làm nóng” trước khi đăng bài
- Trích đoạn bài viết lên mạng xã hội trước 3 ngày (kèm link trỏ về)
- Dùng Hootsuite để hẹn giờ đăng bài → tăng cơ hội Google bot thu thập trước
Giám sát hiệu quả & Kế hoạch cải tiến
① Bảng điều khiển chỉ số cốt lõi
- Hiệu quả lập chỉ mục: Search Console → “Mức độ phủ sóng” → Số trang hợp lệ / Số trang đã gửi
- Giá trị nội dung: Google Analytics → Chỉ số giá trị trang (≥1.5 được coi là đạt chuẩn)
- Mức độ gắn bó người dùng: Thời gian ở lại trung bình ≥ 2 phút 30 giây
② Gợi ý chu kỳ cải tiến
- Tháng đầu: Cập nhật 2 bài/tuần (duy trì tần suất thu thập của bot tìm kiếm)
- Tháng thứ 2: Mở rộng chủ đề phụ từ 3 bài top traffic (ví dụ: “thức ăn chó phân lỏng” → “hướng dẫn theo dõi phân trong thời kỳ đổi thức ăn”)
- Tháng thứ 3: Viết lại bài có traffic thấp (<50 lượt/tháng) theo dạng Hỏi & Đáp
Khai thác backlink từ các trang khác (Xây dựng liên kết ngoài)
Với website mới, muốn Google index nhanh, backlink đóng vai trò như “lá phiếu” — 100 backlink chưa được index không bằng 10 backlink đã được Google thu thập.
Dữ liệu thử nghiệm cho thấy, khi tỷ lệ index của backlink > 65%, tần suất thu thập trang đích tăng gấp hơn 3 lần.
Nhưng nhiều webmaster hiểu sai: quá tập trung vào anchor text chuẩn xác (như “gợi ý thức ăn cho chó”) khiến thuật toán nghi ngờ thao túng thứ hạng, dẫn đến chậm được index.
Chiến lược backlink hiệu quả là “lấy lượng đẩy chất”: ưu tiên liên kết từ các trang có DA > 1 và đang hoạt động (nghĩa là đã được Google tin tưởng).
Dùng tổ hợp “từ khóa thương hiệu + từ khóa chung” (như “trang chính XX”, “nhấn vào đây”) để phân tán tỷ lệ anchor text, vừa truyền sức mạnh vừa tránh rủi ro.
Ví dụ: một website mẹ & bé trong tháng đầu đã lấy 327 backlink từ chữ ký diễn đàn (tỷ lệ được index 81%), các trang sản phẩm chính được index trong 7 ngày, chi phí chỉ 62 NDT/link.
Kênh backlink cho site mới (tỷ lệ index cao trong tháng đầu – kèm chi phí & cách làm)
Chữ ký diễn đàn ngành (tỷ lệ thành công 72%)
Hướng dẫn thao tác:
- Đăng ký 10 diễn đàn trong ngành (không quá trùng lặp domain)
- Xác minh email + trả lời ít nhất 3 bài viết để mở quyền thêm chữ ký
- Thêm vào chữ ký cá nhân:
<a href="website-của-bạn">tên thương hiệu + từ khóa chung</a>(VD: “Trang chính XX|Nhấn xem thêm”)
Chi phí: ≈ 0 VNĐ/link (chỉ tốn khoảng 8 giờ công/diễn đàn)
Ví dụ thực tế: Một website đèn trang trí nhận 183 backlink từ 5 diễn đàn uy tín trong vòng 2 tuần (tỷ lệ index đạt 79%)
Nền tảng đăng bài PR (tỷ lệ index 68%)
- Kênh tiết kiệm: Meitongshe bản địa (~1.500 NDT/bài), đăng bài qua kênh truyền thông tự có
- Vị trí đặt link: Đặt trong đoạn “Về chúng tôi” hoặc “Nguồn tham khảo” (mỗi bài tối đa 3 link)
- Công thức tối ưu chi phí: Chi phí/link = phí bài PR / số link được index (nên ≤ 80 NDT/link)
Chiến lược long-tail trên nền tảng Hỏi & Đáp
Chọn câu hỏi: Dạng “nên chọn XX như thế nào”, “Top 10 thương hiệu XX”
Mẫu trả lời:
“Theo đánh giá từ Hiệp hội XX (có link báo cáo), 3 tiêu chí hiện tại là:
1. Tiêu chí 1 (chèn link đến trang sản phẩm)
2. Tiêu chí 2 (chèn link so sánh đối thủ)
3. Tiêu chí 3 (chèn link đến whitepaper ngành)”
Gợi ý nền tảng: Quora, Yahoo Hỏi & Đáp
Tỷ lệ vàng của các loại anchor text (Tránh bị thuật toán Google phạt)
| Loại Anchor Text | Tỷ lệ | Ví dụ | Tác dụng |
|---|---|---|---|
| Từ khóa thương hiệu | 40% | “Trang chính XX”, “Cửa hàng chính hãng XX” | Tăng nhận diện thương hiệu trong tìm kiếm |
| Từ khóa chung | 30% | “Nhấn vào đây”, “Tìm hiểu thêm” | Giảm mật độ từ khóa SEO nhắm đích |
| URL thuần túy | 30% | http://www.xxx.com | Truyền sức mạnh domain trực tiếp |
Gợi ý sử dụng:
- Chữ ký diễn đàn: Dùng “tên thương hiệu + từ khóa chung” (ví dụ: “Trang chính XX|Xem chi tiết”)
- Trích dẫn trong Wiki: Dùng URL thuần túy (tạo cảm giác là nguồn trung lập)
- Bài PR: Dùng từ khóa chung như “Theo báo cáo mới đây” và chèn link đến trang báo cáo
Trường hợp sai lầm: Một trang mỹ phẩm dùng anchor text “mặt nạ trị mụn tốt nhất” chiếm hơn 60% toàn bộ backlink → bị Google manual review → chậm được index 11 ngày.
Hệ thống kiểm tra thủ công liên kết ngoài
① Kiểm tra tình trạng lập chỉ mục
- Công cụ: Google Search Console → Kiểm tra URL → Dán liên kết ngoài
- Tiêu chí đạt: Trang có liên kết đã được lập chỉ mục (hiển thị “Đã lập chỉ mục”)
② Phân tích thuộc tính liên kết
- Công cụ: Ahrefs Free Backlink Checker → Nhập tên miền → Lọc liên kết dofollow
- Chỉ số chính: DA của tên miền nguồn > 1 (kiểm tra bằng Moz), điểm spam ≤ 30%
③ Kiểm tra rủi ro chuyển hướng
- Công cụ: Redirect Checker → Dán liên kết ngoài
- Tiêu chí đạt: Chuyển hướng không quá 1 lần, không có popup quảng cáo ở trang đích
Bảng điều khiển dữ liệu:
- Theo dõi 10 liên kết ngoài mỗi ngày, duy trì tỷ lệ lập chỉ mục chính xác ≥ 65%
- Tỷ lệ liên kết không hợp lệ (chưa lập chỉ mục / chuyển hướng / không liên quan) mỗi tuần ≤ 15%
Chiến lược mua liên kết ngoài hiệu quả (giá mỗi liên kết ≤ 80.000đ)
① Tận dụng PR để có nhiều liên kết
- Kênh: Website doanh nghiệp nhỏ, báo địa phương
- Giá: 1.500.000đ / bài viết (chèn được 10 liên kết) → Mục tiêu đàm phán xuống dưới 80.000đ mỗi liên kết
② Mua liên kết từ site cá nhân
- Kênh: Fiverr, GuangSuan Tech
- Giá: Site có DA > 1 giá 50.000 – 80.000đ / liên kết (DA càng cao giá càng cao)
Lưu ý:
- Tránh các gói “đăng trên báo DA > 30+” (giá cao > 200.000đ, tỷ lệ lập chỉ mục thấp < 30%)
- Ưu tiên người bán có thể cung cấp “case đã được lập chỉ mục”
Theo dõi trạng thái lập chỉ mục hàng ngày (kiểm soát dữ liệu)
Kết quả thử nghiệm cho thấy, website không theo dõi thường xuyên có 32% số trang bị mất lập chỉ mục sau 3 tuần do chất lượng nội dung giảm hoặc lỗi kỹ thuật.
Chiến lược hiệu quả là mỗi ngày dành 5 phút, theo dõi 3 chỉ số chính: tần suất crawl (bot truy cập), tỷ lệ lập chỉ mục (đã lập / đã gửi), tỷ lệ click hiệu quả (lượt click thực tế từ kết quả tìm kiếm)
Tạo bảng điều khiển theo dõi chỉ mục (Search Console + GA4)
① Cài đặt bảng KPI
- Tần suất crawl: Search Console → Cài đặt → Thống kê thu thập dữ liệu → Xem “Số trang được thu thập mỗi ngày”
- Tỷ lệ lập chỉ mục: Search Console → Chỉ mục → Trang → Tính “số trang được lập chỉ mục / đã gửi”
- Tỷ lệ click hiệu quả: GA4 → Khám phá → Tạo báo cáo truy vấn – trang (lọc click > 10)
② Quy tắc cảnh báo dữ liệu
- Cảnh báo nghiêm trọng: Lượng crawl giảm > 50% (do server lỗi hoặc bị chặn bot)
- Cảnh báo trung bình: Tỷ lệ lập chỉ mục < 60% trong 3 ngày liên tiếp (cần kiểm tra nội dung chất lượng thấp)
- Cảnh báo nhẹ: Tỷ lệ click hiệu quả giảm 20% so với tuần trước (có thể cần tối ưu nội dung hoặc từ khóa)
3 cách hiệu quả để tìm trang chưa lập chỉ mục
① Phương pháp lấy mẫu URL (thích hợp cho site < 1000 trang)
Dùng Search Console kiểm tra 10 URL chính
Nếu > 3 URL chưa được lập chỉ mục → Vào “báo cáo mức độ bao phủ” để lọc theo loại lỗi
Lỗi phổ biến:
- “Đã gửi nhưng chưa lập chỉ mục” → Nội dung trùng lặp hoặc chưa đủ chất lượng
- “Bị loại trừ” → Bị chặn bởi robots.txt hoặc có thẻ noindex
② So sánh crawl để tìm trang không được lập chỉ mục
Dùng Screaming Frog crawl toàn bộ site → Xuất danh sách URL
So sánh với danh sách URL được lập chỉ mục trong Search Console
Trang cần kiểm tra đầu tiên:
- Trang chuyên mục không được crawl (thiếu liên kết nội bộ)
- Trang sản phẩm đã được crawl nhưng chưa lập chỉ mục (tham số URL lặp lại)
③ Phân tích log máy chủ (cần quyền truy cập)
Nhập log Apache/Nginx → Lọc theo User-Agent của Googlebot
Phân tích đường dẫn được crawl nhiều:
- Trang bị crawl > 100 lần nhưng chưa được lập chỉ mục → Kiểm tra nội dung và thẻ meta
- Trang quan trọng được crawl < 5 lần → Cần tăng liên kết nội bộ hoặc gửi lại URL
Quy trình xử lý lỗi crawl trong 24 giờ
① Tiêu chí ưu tiên
- Khẩn cấp: Lỗi server 5xx (xử lý trong 1 giờ)
- Quan trọng: Lỗi 404 (trong 12h cần chuyển hướng 301)
- Thông thường: soft 404 (nội dung yếu → sửa trong 24h)
② Cách xử lý
Lỗi 5xx:
- Kiểm tra tình trạng server (Aliyun / AWS Console)
- Giải pháp tạm thời: Bật cache CDN (như Cloudflare)
404:
- Thiết lập 301 redirect đến trang liên quan (WordPress có thể dùng plugin Redirection)
- Nếu không có trang phù hợp → Redirect đến trang chuyên mục (khuyến nghị thời gian ở lại > 30s)
Nội dung trùng:
Thêm thẻ canonical:
<link rel="canonical" href="URL gốc có quyền ưu tiên">
Ví dụ: Gộp 32 bài blog trùng nội dung bằng canonical → tỷ lệ lập chỉ mục tăng từ 51% → 94%
③ Kiểm tra lại sau khi sửa
- Công cụ: Search Console → Kiểm tra URL → Gửi lại & theo dõi kết quả
- Tiêu chí đạt: Lượng crawl phục hồi trong vòng 48 giờ
Mẹo tăng crawl budget (ưu tiên crawl trang quan trọng)
① Sử dụng liên kết nội bộ hợp lý
- Thêm 3–5 liên kết văn bản từ trang chủ hoặc trang quan trọng đến các trang mới
- Kết quả: Trang có liên kết từ trang chủ được crawl 78%, không liên kết chỉ 12%
② Điều chỉnh tần suất cập nhật nội dung
- Trang sản phẩm: cập nhật giá hoặc tồn kho hàng tuần
- Trang dài (blog): cập nhật nguồn hoặc case mỗi tháng
- Ví dụ: Site B2B cập nhật giá lúc 18:00 → Googlebot crawl từ 19:00 – 21:00
③ Chặn crawl các đường dẫn không cần thiết
Kiểm soát bằng robots.txt:
User-agent: Googlebot
Disallow: /search/
Disallow: /?sort=
Kết quả: Giảm 38% lượng crawl không cần thiết, số lần crawl trang quan trọng tăng 2.1 lần
Site mới được index nhanh hay không, phần lớn phụ thuộc vào luật crawl của bạn




