GEO Optimization 2026: Chuẩn bị website cho AI search
ChatGPT, Perplexity, Gemini đang thay đổi cách khách tìm bạn. Cách chuẩn bị website cho kỷ nguyên AI search.
GEO là gì và tại sao nó khác SEO
SEO tối ưu cho web crawler: bot của Google đọc trang web, index nội dung, xếp hạng dựa trên relevance và authority, rồi hiển thị link trong trang kết quả. GEO (Generative Engine Optimization) tối ưu cho luồng hoàn toàn khác: AI search engine đọc nội dung của bạn, tổng hợp câu trả lời, và trích dẫn (hoặc không trích dẫn) nguồn của bạn trực tiếp trong câu trả lời.
Sự khác biệt kỹ thuật quan trọng hơn: web crawler truyền thống đọc HTML, index text, và quan tâm đến link structure. AI search engine quan tâm đến ba thứ khác nhau: nội dung có cấu trúc rõ ràng để trích dẫn, tín hiệu authority chứng minh thông tin đáng tin (E-E-A-T), và khả năng truy cập kỹ thuật cho AI crawler (llms.txt, robots.txt, tốc độ tải trang). Một trang web có thể đứng top 1 Google mà vẫn không bao giờ được ChatGPT cite nếu thiếu các tín hiệu này.
Năm 2026, với hơn 40% người dùng tại các thị trường phát triển bắt đầu hành trình tìm kiếm bằng AI thay vì search engine truyền thống, GEO không còn là optional. Nó là điều kiện cần thiết của visibility trực tuyến.
5 AI search engines và đặc điểm mỗi engine
ChatGPT web search hoạt động thông qua Bing index. Khi người dùng hỏi với chế độ web search bật, ChatGPT gọi Bing API để lấy kết quả, sau đó dùng LLM để tổng hợp. Điều này có nghĩa là: nếu Bing không index trang bạn, ChatGPT không thể cite. Ưu tiên kỹ thuật: Bing Webmaster Tools, sitemap XML chuẩn, và structured data.
Perplexity trực tiếp crawl web bằng PerplexityBot. Nó ưu tiên nguồn có định dạng rõ ràng, đoạn trả lời trực tiếp cho câu hỏi (answer-style content), và trang load nhanh. Perplexity cũng đọc llms.txt nếu có để hiểu cấu trúc site trước khi crawl sâu.
Google AI Overviews dùng index hiện có của Google nhưng áp dụng bộ lọc bổ sung để chọn nguồn đáng tin. E-E-A-T quan trọng hơn ở đây so với SEO thông thường; author bylines với thông tin xác minh là bắt buộc. Gemini của Google ưu tiên nguồn có Knowledge Panel, schema.org chuẩn, và nội dung được index lâu với engagement tốt. Bing Copilot tích hợp trực tiếp vào Windows và Edge, nên tần suất sử dụng cao hơn ở thị trường doanh nghiệp B2B.
Technical checklist chi tiết
Hạng mục đầu tiên là schema JSON-LD inline trong HTML. Mỗi trang nên có schema phù hợp: trang dịch vụ dùng Service, bài viết dùng BlogPosting với trường author đầy đủ, trang FAQ dùng FAQPage. Quan trọng: schema phải render trong HTML tĩnh, không phải load qua JavaScript. AI crawler thường không chạy JS, nên nếu schema chỉ inject qua client-side script, bot sẽ không thấy.
Hạng mục thứ hai là llms.txt. File này đặt tại root domain, liệt kê các trang quan trọng theo thứ tự ưu tiên cùng mô tả ngắn. Format chuẩn bao gồm tên site ở H1, đoạn mô tả ngắn ở blockquote, và danh sách các section chính với link và mô tả một dòng.
Hạng mục thứ ba là hreflang cho nội dung song ngữ. Trang tiếng Việt và tiếng Anh phải khai báo đúng trong thẻ head để AI engine không nhầm lẫn ngôn ngữ hay duplicate content. Thêm cả x-default trỏ về URL canonical.
Hạng mục thứ tư là SSR (server-side rendering). Nếu nội dung chính chỉ load sau khi JavaScript chạy, AI bot có thể crawl trang trắng. Next.js với static generation hoặc server-side rendering là lựa chọn đúng cho tất cả trang quan trọng.
E-E-A-T trong bối cảnh GEO: author bylines là bắt buộc
Trong SEO truyền thống, author bylines là tốt nhưng không bắt buộc. Trong GEO, đây là điều kiện tiên quyết. AI search engine, đặc biệt Google AI Overviews, được thiết kế để không cite nội dung ẩn danh cho các chủ đề quan trọng. Nội dung về công nghệ kinh doanh, tài chính, hay pháp lý đều cần người viết thực sự với profile có thể kiểm chứng.
Profile tác giả cần có: tên đầy đủ, chức danh, link đến LinkedIn hoặc trang profile cá nhân, và nếu có thể, link đến các bài viết khác đã được publish. Schema Person được thêm vào inline với bài viết tạo ra tín hiệu kỹ thuật rõ ràng. Experience cụ thể quan trọng hơn bằng cấp học vị.
Chúng mình thấy nhiều website Việt Nam viết nội dung chuyên sâu nhưng không có byline, hoặc byline chỉ là "Admin". Đây là lý do phổ biến nhất khiến nội dung chất lượng không được AI cite dù SEO tốt.
Case study: MADIAD tự triển khai GEO trên madiad.com
Tháng 4/2026, chúng mình chạy GEO audit đầy đủ trên madiad.com và đo được score baseline là 47/100. Con số này phản ánh thực trạng phổ biến: website được xây dựng tốt về mặt design và nội dung nhưng thiếu các tín hiệu kỹ thuật mà AI search cần.
Bốn critical bugs được xác định gồm: Vercel env NEXT_PUBLIC_SITE_URL trỏ về preview URL thay vì domain chính, khiến toàn bộ sitemap (72 trang) có URL sai; schema JSON-LD chỉ load qua next/script thay vì inline trong HTML tĩnh, nên AI crawler không thấy; homepage stats counter render phía client với giá trị khởi đầu là 0, thay vì SSR ra giá trị thực; và llms.txt mô tả MADIAD là "công ty công nghệ AI" không khớp với positioning thực tế là integrator partner.
Sau 1 ngày xử lý các critical bugs này, score tăng lên 63 đến 68/100 mà không cần thêm nội dung mới. Đây là bằng chứng rõ nhất cho câu hỏi "nên bắt đầu GEO từ đâu": fix technical trước, content sau.
Lộ trình 30 ngày để đạt 80+/100
Tuần 1 là nền tảng kỹ thuật: audit và fix toàn bộ schema JSON-LD, đảm bảo render inline trong HTML; kiểm tra SSR hoặc static generation cho trang quan trọng; tạo và publish llms.txt; fix sitemap domain về canonical URL nhất quán; kiểm tra robots.txt không block AI crawlers; submit site lên Bing Webmaster Tools (quan trọng vì ChatGPT dùng Bing).
Tuần 2 là authority signals: triển khai author bylines với schema Person cho tất cả bài viết; tạo hoặc chuẩn hóa trang team với profile đầy đủ; liên kết Wikidata và Crunchbase entry vào sameAs của schema Organization; triển khai IndexNow protocol để Bing index lại ngay sau mỗi deploy.
Tuần 3 là content quality: audit 10 trang quan trọng nhất theo tiêu chí citability; rewrite các đoạn mở đầu để có dạng direct answer (câu trả lời thẳng trong 2-3 câu đầu, không dẫn dắt dài); thêm số liệu cụ thể và có thể kiểm chứng vào mỗi section; bổ sung FAQPage schema cho trang dịch vụ và pricing.
Tuần 4 là cross-references và distribution: xuất bản 3-5 press release quốc tế đề cập website và dịch vụ; xây dựng internal linking structure giữa các bài viết liên quan; monitor AI citation bằng cách test trực tiếp trên ChatGPT, Perplexity và Gemini với câu hỏi liên quan đến ngành.
Sau 30 ngày áp dụng đầy đủ, dựa trên dữ liệu từ các client MADIAD đã đi qua quy trình này, GEO score trung bình đạt 80-85/100. Quan trọng hơn là kết quả thực tế: tên thương hiệu xuất hiện trong câu trả lời của ít nhất 2 trong số 5 AI search engine khi người dùng hỏi về lĩnh vực của doanh nghiệp đó.