เชื่อว่าตอนนี้หลายคนคงสับสนว่าเราจะต้อง optimize ยังไงบ้างให้ติด AI Overview หรืออาจจะยังไม่มั่นใจว่าสิ่งที่ทำอยู่ตอนนี้มันส่งผลให้ติดจริงไหม?
งั้นก่อนอื่นมาดูเบื้องหลังการทำงานของ AI Overview กันค่ะว่ามีกระบวนการแบบไหน และมีเกณฑ์การคัดเลือกเว็บยังไง ซึ่งหลังจากรู้แล้วเนี่ย ขั้นต่อไปที่จะหยิบเอาไป optimize บอกเลยว่า no.1 แน่นอน
AI Overview ทำงานยังไง?
จากเอกสารสิทธิบัตรของ Google (Google patent) เรื่อง Generative Summaries For Search Results อธิบายการทำงานของ Google AI Overview (AIO) ภาพใหญ่ไว้แบบนี้ค่ะ
กรอบ Client Device: การรับ input จากผู้ใช้, การตีความ context, และการแสดงผล ในฝั่ง client
กรอบนี้มีเพื่อบอกว่า การตีความเพื่อแสดงผลของ AIO เนี่ย ไม่ได้ใช้แค่ “Keyword” ที่ผู้ใช้เสิร์ชมานะ แต่จะดู context อื่น ๆ ด้วย เช่น device ของผู้ใช้คืออะไร, เสิร์ชจากที่ไหน (location), ก่อนหน้านี้เสิร์ชอะไรมา
แสดงว่า personalized หรอ? → ถูกต้อง! แต่ไม่ใช่ทุกกรณีหรอกค่ะที่จะ personalized ถ้าเป็นการเสิร์ช keyword ที่เป็นข้อเท็จจริงทั่วไปหรือมีคำตอบที่ชัดเจนและเป็นสากล คำตอบก็จะออกมาเหมือนกันเปี๊ยบ
กรณี personalized ก็จะเป็น keyword พวก “…ใกล้ฉัน”, “จองตั๋วเครื่องบิน…” ที่ Google ต้องอาศัยข้อมูลพวก location, date, time เพื่อให้คำตอบตรงกับความต้องการของผู้ใช้มากที่สุด
มาดูคำอธิบายของแต่ละ engine กัน
- User input engine → รับ input ตรงจากผู้ใช้ (query, question)
- Implied input engine → สร้าง input แฝง เช่น context ก่อนหน้า, user behavior, session signals *อาจไม่เกิดขั้นตอนนี้ก็ได้
- ให้เข้าใจว่าเจ้านี่เป็นตัวแตก query fanout ก็ได้นะ (แต่สิทธิบัตรใช้คำว่า related queries, multiple candidate queries, context expansion)
- Context engine → รวม user input + implied input ส่ง context ไปยัง NL system
- Rendering engine → แสดงผล response ที่ได้กลับมาจาก LLM (ไม่ได้มีส่วนในการ generate นะ มีหน้าที่แค่ render กับคุม UX)
- Application → ตัว host (เช่น search app, browser, assistant)
กรอบ NL Based Response System: การสร้าง ยืนยัน และใส่แหล่งอ้างอิงให้ AI Overview
อย่าเพิ่งตกใจว่าตัวหนังสืออะไรเยอะแยะไปหมด มาดูคำอธิบายทีละตัวตามลำดับการทำงานจริงกัน
- SRD Selection Engine → เลือก Search Result Documents (SRDs) ซึ่งก็คือลิสต์เอกสารที่จะถูกนำไปประมวลผลคำตอบและจัดทำ citation เป็นเอกสารที่ match กับ input query โดยคลังเอกสารที่เอามาให้ engine ตัวนี้เลือก จะถูกส่งมาจาก Search Systems (160)
- จากขั้นตอนนี้ เห็นชัดเลยว่าใช้ระบบ RAG
- LLM Selection Engine → เลือกว่าจะใช้ LLM ตัวไหนมาวิเคราะห์และสร้างคำตอบ ใช้กี่ตัว โดยใช้ Classifier(s) มาช่วยตัดสินใจ
- LLM Input Engine → แปลง SRDs + context เป็น input ที่ LLM ใช้ได้ เช่น chunking, ordering, filtering
- LLM Response Generation Engine → เรียกใช้ LLM(s) มา generate natural-language response (ยังไม่มีลิงก์ reference) *เน้นย้ำว่า LLM ไม่ได้ generate คำตอบเอง แต่ใช้ source จาก SRDs มาประมวลผล
- Response Linkifying Engine → ใช้ Encoder(s) ช่วย matching ข้อความใน response กับ SRDs ที่ใช้จริง (ขั้นนี้แหละถึงจะใส่ลิงก์ reference)
- Response Confidence Engine → ประเมินความน่าเชื่อถือและความเชื่อมั่นของ response เพื่อตัดสินว่าจะแสดง response ไหม
- Interaction Engine → รับ interaction จากผู้ใช้ เช่น click, expand response, follow up to link reference เพื่อส่ง feedback ไปปรับปรุงการแสดงผลในอนาคต
กรอบ Search System(s): ระบบ search และจัดเก็บ document
คนทำ SEO ใจชื้นได้เลยค่ะ เพราะกรอบนี้สะท้อนว่าระบบ search ยังสำคัญ!
อย่างที่อธิบายไปในกรอบที่แล้ว ว่า AI Overview ใช้ข้อมูล SRD(s) ในการให้ LLM สร้างคำตอบสรุปออกมา ซึ่งเจ้า SRD มันก็คือข้อมูลจาก search แสดงว่ามันคือการทำ SEO ดี ๆ นี่เองแหละ!!! (แต่ต้องทำแบบมีเทคนิคเหนือชั้นกว่าปกติ)
- SRD Engine → ดึง document ต่าง ๆ ที่ตอบ query ได้ และทำการ match query/semantic/entity/vector เข้ากับ documents โดยเอกสารอาจจะอยู่ในรูปแบบ webpage, passage, entity document, structured / unstructured content
- เอกสารพวกนี้ยังไม่ถูกประเมินคุณภาพเชิงลึก
- Features Engine → ประเมินคุณภาพของเอกสาร ไม่ว่าจะเป็น relevance, authority, freshness, topicality, historical performance **แต่ไม่ใช่ตัวตัดสินว่าเอกสารไหนจะอยู่หรือไป แค่คำนวณคะแนนคุณภาพ
- Results Engine → ตัวตัดสินว่าเอกสารไหนถูกเลือก และจัดอันดับของเอกสาร ซึ่งเอกสารเหล่านี้เองที่เป็น SRDs ที่เป็นแหล่งข้อมูลให้ NL system โดยอาจจัดเก็บในรูปแบบ ordered list (ranking), scored list, structured result
AI Overview เลือกเอกสาร (SRDs) ยังไง?
พอดูการทำงานของ AI Overview แล้ว เราจะเห็นว่า part ที่สำคัญก็คือ SRDs ทำยังไงให้เว็บเราถูกเลือกเป็นแหล่งข้อมูล?
อย่างที่อธิบายไปว่า AI Overview มีการใช้ SRD Selection Engine เพื่อคัดเลือก SRDs เข้ามาใช้ในการสร้างสรุป ซึ่งการประเมินเอกสารจะพิจารณาจาก 5 มิติ
1. Query-Dependent Measures (ประเมินจากคำค้นหา)
เป็นการประเมินความเกี่ยวข้องของเอกสารกับ Query ที่ป้อนเข้ามาโดยตรง ซึ่งจะดูจากมาตรวัดเหล่านี้:
- Positional Ranking: เป็นปัจจัยหลักที่ระบบใช้พิจารณา เอกสารที่มีอันดับการค้นหาสูง มีโอกาสถูกรวมอยู่ใน AI Overview มากขึ้น โดยเอกสารที่จัดอยู่ในตำแหน่งที่ 1 มีโอกาสถึง 53% ที่จะถูกนำไปใช้ และอันดับที่ 10 มีโอกาส 36.9% (Rich Sanger, 2024)
- Selection Rate หรือ CTR: ดูจากการมีส่วนร่วมของผู้ใช้ (user engagement) ที่มีการคลิกลิงก์เข้าไปอ่านจริง
- Language and Locality Measure: เปรียบเทียบภาษาของ Query กับภาษาของ SRDs และจับคู่ location ของ Query กับ location ที่เกี่ยวข้องกับเอกสาร เพื่อดูว่าตรงกับสิ่งที่ผู้ใช้ต้องการมากที่สุดหรือไม่
2. Query-Independent Measures (ประเมินจากคุณภาพเนื้อหา)
เป็นการประเมินคุณภาพ เช่น ความน่าเชื่อถือ และความหลากหลายของเอกสาร (มีความ unique):
- Trustworthiness: ประเมินความน่าเชื่อถือโดยเฉพาะจากสามปัจจัยนี้
- Author → มีความน่าเชื่อถือและความเชี่ยวชาญ
- Domain → ชื่อเสียงและอำนาจโดยรวมของเว็บไซต์ (DA)
- Inbound Links (Backlinks) → คุณภาพและปริมาณของลิงก์จากแหล่งที่น่าเชื่อถือ
- Freshness: เนื้อหาเป็นปัจจุบันและมีการอัปเดตบ่อย โดยดูจากวันที่สร้างและวันที่อัปเดตล่าสุด
- Overall Popularity: ดูพวก social shares, user interactions, และ traffic
- Diversity Among the Selected Documents: เพื่อการเสนอเนื้อหาที่ดีและครอบคลุมที่สุดให้กับ user ตัว AI Overview จำเป็นต้องหา document ที่มีความ unique และสอดคล้องกับ query หลัก (แต่ต้องมีคุณภาพด้วยนะ) ดังนั้น หากเว็บไม่ได้ติดใน rank ต้น ๆ แต่ก็มีโอกาสถูกนำไปติดใน AI Overview ถ้าเนื้อหาสามารถตอบ user ได้ค่ะ
3. User-Dependent Measures (ประเมินจากผู้ใช้)
เป็นการประเมินว่าเอกสารไหน เหมาะกับผู้ใช้คนนี้มากที่สุด ในบริบทของการค้นหาครั้งนั้น ซึ่งดูจาก
- User Profile Attributes: ใช้ข้อมูลคุณลักษณะของผู้ใช้ เช่น ภาษา พื้นที่ หรือความสนใจโดยรวม เพื่อเลือกเอกสารที่สอดคล้องกับพื้นฐานและความคุ้นเคยของผู้ใช้ เช่น ผู้ใช้ในแต่ละประเทศอาจได้ SRDs คนละชุด แม้ใช้ query เดียวกัน
- Overlap with Recent Queries: พิจารณาว่าเอกสารมีความสอดคล้องกับ query ที่ผู้ใช้ค้นมาก่อนหน้านี้ไหม เพื่อประเมินว่าผู้ใช้กำลังค้นหาข้อมูลต่อเนื่องในหัวข้อเดียวกันหรือกำลังเปลี่ยนเรื่อง
- Recency of Queries: ดูความใกล้ของเวลาในการค้น query ต่าง ๆ query ที่เกิดขึ้นใกล้กันมาก มักสะท้อน intent เดียวกัน จึงมีผลต่อการเลือก SRDs ที่ช่วยตอบคำถามต่อเนื่องได้ดีขึ้น
- Interactions with SRDs: พิจารณาการมีปฏิสัมพันธ์ของผู้ใช้กับ SRDs ก่อนหน้า เช่น การคลิก การอ่าน หรือการเลือกเอกสารบางประเภท เพื่อเรียนรู้ว่าเอกสารลักษณะใด “ใช้งานได้จริง” สำหรับผู้ใช้คนนั้น
- Profile Data: ใช้ข้อมูลโปรไฟล์โดยรวมของผู้ใช้ (ในระดับ aggregate หรือข้อมูลรวม) เพื่อปรับการเลือกเอกสารให้เหมาะสม แต่ไม่เปลี่ยนข้อเท็จจริงของเนื้อหา เป็นการเลือก “จากของที่ดี” ให้ตรงกับผู้ใช้มากขึ้น
4. Related Queries and Contextual Relevance (ประเมินจาก Query ที่เกี่ยวข้อง)
ในกรณี query ที่ผู้ใช้เสิร์ชมา (input query) มีความซับซ้อน AI Overview จะมีการดึงเอกสารด้วย query อื่นที่เกี่ยวข้องกับ query หลัก (ถ้าเปรียบกับ ChatGPT ก็ query fanout นั่นเองค่ะ) เพื่อให้คำตอบครอบคลุม ไม่แคบ หรือไม่ขาดบริบทสำคัญ
โดยกระบวนการแตก sub-queries หรือ related queries ก็มาจากทั้ง long-tail keyword ที่เราเห็นเวลาพิมพ์บน search bar แล้ว google แนะนำคำค้นหาอื่น ๆ ที่คนส่วนใหญ่เสิร์ช (People also search for) หรือมาจากการที่ระบบสั่งให้ model LLM ตัวนึง สร้าง sub-queries ขึ้นมาเอง (Reformulated Queries) ได้ด้วยเช่นกัน
Example
| Input query: SEO คืออะไร Related queries: ความหมายของ SEO, SEO ย่อมาจากวิธีทำ SEO |
ซึ่ง AI Overview มีเกณฑ์การเลือก related queries แบบนี้ค่ะ
- Correlation Threshold: มีการวัดความสัมพันธ์ระหว่าง input query กับ related queries ด้วยวิธีที่เรียกว่า “embed distance” (แปลง query เป็นตัวเลข vector) ซึ่งถ้าค่าความสัมพันธ์มากกว่า threshold ที่ระบบตั้งไว้ หมายความว่า related queries นั้นได้ไปต่อ หรือก็คือมีการดึงเอกสารจาก related queries นั้นด้วยนั่นเอง
- Topical and Entity Overlap: ระบบจะประเมินว่า related queries อยู่ใน topic cluster เดียวกันไหม และมี entity เช่น บุคคล สถานที่ แนวคิด สิ่งของ ที่ทับซ้อนกันไหม
- ตัวอย่าง ผู้ใช้ค้นหาเรื่อง “AI Overview คืออะไร” แล้วตามด้วยเรื่อง “ทำยังไงให้ติด AI Overview” ระบบจะรู้ถึงความเกี่ยวข้องของสองหัวข้อนี้ เพราะมีความทับซ้อนใน entity เดียวกันคือ “AI Overview” แล้วจะให้ความสำคัญกับเอกสารที่ครอบคลุมทั้งสองเรื่องนี้เพื่อให้ result มีความต่อเนื่อง
- Temporal Proximity: ระบบจะเช็กว่ามีการส่ง input query และ related queries มาจาก อุปกรณ์หรือบัญชีเดียวกัน ในช่วงเวลาที่ไล่เลี่ยกันบ่อยแค่ไหน ถ้าเวลาใกล้กันมาก (ค้นหาต่อเนื่อง) ระบบจะตีความว่าผู้ใช้กำลังมีความสนใจในหัวข้อนั้น ๆ อย่างต่อเนื่อง หรือตีความได้ว่า input query และ related queries มีความเกี่ยวข้องกันสูง
- Amount of Time Passage: ระบบจะดูจากระยะห่างของช่วงเวลาที่ค้นหา input query กับ related quries หากมีช่วงเวลาผ่านไปนาน ระบบอาจลดน้ำหนักความเกี่ยวข้องระหว่าง 2 queries นี้ เพื่อลดการนำข้อมูลที่ไม่สอดคล้องกับบริบทปัจจุบันมาใช้
5. Context & Profile Data Utilization (ประเมินจากสถานการณ์)
เป็นขั้นตอนที่ระบบนำข้อมูลบริบทและโปรไฟล์มาใช้ ปรับและจูนการเลือกเอกสาร ให้เหมาะกับสถานการณ์การค้นหานั้น
- Automatic Generation of Implied Queries: ระบบสามารถสร้าง query ที่ “ผู้ใช้อาจหมายถึง” โดยอัตโนมัติจากบริบทของการค้นหาหรือ profile ของผู้ใช้ เพื่อดึงเอกสารที่ช่วยเติมเต็มคำตอบให้สมบูรณ์ แม้ผู้ใช้จะไม่ได้พิมพ์คำถามนั้นออกมาตรง ๆ
- Context and Profile Overlap: ระบบจะประเมินว่าข้อมูลที่เลือกมานั้น สอดคล้องกับบริบทการค้นหาและลักษณะของผู้ใช้ในขณะนั้นหรือไม่ เพื่อให้ AI Overview นำเสนอคำตอบที่ “ถูกเรื่อง ถูกระดับ และถูกจังหวะ”
มาขมวดกันนิดนึง จากเกณฑ์การคัดเลือกเอกสารหรือเอาจริง ๆ ก็คือการเลือกเว็บมา citation เนี่ย ไม่ได้ห่างไกลจากการทำให้เว็บติดอันดับ SEO ที่ดีเลยนะคะ หลัก ๆ ขอแค่ → ตรงกับ search intent (แน่นอนอยู่แล้ว ไม่งั้นไม่มีทางติดอันดับ), เขียน title ให้น่ากดไปอ่าน, ถูกหลัก E-E-A-T, ข้อมูลต้องอัปเดตและมี unique แค่นี้ก็มีโอกาสเกินครึ่งแล้วที่จะปรากฎใน citation
เพียงแต่ ต้องอาศัยเทคนิคการเขียนให้เนื้อหาของเรามีโครงสร้างโดนใจระบบการเก็บข้อมูลของ AI สักหน่อย เช่น ตอบไปเลย ไม่ต้องเกริ่นเยอะ, ใช้ bullet list, เปรียบเทียบเป็นตาราง และเขียนย่อหน้าละ 2-3 บรรทัดก็พอ เพราะถ้าหน้านั้นเนื้อหาเยอะมาก AI จะไม่ได้เก็บข้อมูลทั้งหน้า แต่อาจจะเก็บเป็นประโยคแยกกัน หรือเก็บแค่ section H2 + paragraph
แนวทางการทำให้เว็บแสดงผลบน AI Overview
หลังจากอ่านวิธีการทำงานกับวิธีการคัดเลือกเอกสาร (เว็บ) ของ AI Overview เริ่มสับสนงุนงงแล้วใช่ไหมคะ ไม่เป็นไร จะสรุปให้ว่าเรามีทางไหนที่สามารถทำแล้วติด AI Overview ได้บ้างกันแน่?
จากแผนภาพด้านบน เรามี 3 ทางเลือกค่ะ แต่ๆๆ เห็นไหมคะว่า ไม่ว่าจะเลือกทางไหน ก็ต้องทำ SEO ก่อนนะ ไม่งั้น AI Overview ไม่มีทาง choose เราแน่นอน เพราะเราเป็นคนแปลกหน้าสำหรับเขานะคะ 😭
สำหรับใครที่ทำ SEO อยู่แล้ว มาดูหนทางสู่การติดในผลลัพธ์ AI Overview กัน
Pathway 1: Focus on Target Query
ดันอันดับให้เว็บติดหน้า 1 (Top10) ใน target keyword ก่อนค่ะ ก็จะเป็นพวก keyword ใหญ่ ๆ search volume สูง ๆ มักจะเป็นกลุ่ม informational keyword มีคำตอบตายตัว หรือเป็น evergreen content ไม่ได้ต้องการคำตอบที่ซับซ้อนอะไรนั่นเอง เนื่องจาก keyword ที่แสดงผล AI Overview ส่วนใหญ่ยังเป็น informational keyword
Pathway 2: Focus on Related Queries
การทำ target query มักมีการแข่งขันสูง จึงต้องทำ content แยกใน related queries ให้ติดอันดับดี ๆ ด้วยเหมือนกัน เพราะอย่างที่บอกไปว่าระบบของ AI Overview จะมีการแตก sub-queries เพื่อหาเอกสารที่เกี่ยวข้องและครอบคลุมที่สุดมาตอบ user ดังนั้น เว็บเราต้องเป็นแหล่งข้อมูลให้กับ AI Overview ค่ะ
ดูจากกราฟจะเห็นว่า การติด top rank ใน related queries หรือ reformulated queries มีโอกาสติด citation ของ AI Overview มากกว่า direct match queries ซะอีก โดยมีโอกาสประมาณ 60% เลย
Share sub-pathway
หลังจากทำ content ใน target query และ related queries ให้ติดหน้าแรกแล้ว แต่ AI Overview ยังไม่หยิบเว็บเราไปแสดง ต้องทำยังไงต่อ?
- Top 2 Ranking: เน้นดันให้เว็บติดอันดับ 1 และ 2 เพราะมีโอกาสถูกเลือกสูงสุด โดยอันดับที่ 1 มีโอกาสสูงถึง 53%
- Match Embedding Distance: อย่างที่บอกว่าการเก็บและ extract ข้อมูลของระบบ AI ไม่ได้เก็บข้อมูลทั้งหมดของหน้า แต่ AI จะชอบโครงสร้างที่ชัดเจน และกระชับ ลองเขียนให้มีโครงสร้างตาม checklist นี้ดูค่ะ
| เขียนคำตอบทันที (สั้น, ตรง, และได้ใจความ) ใช้ bullet points, numbered steps เขียน paragraphs ละ 2-3 บรรทัด เขียนหัวข้อเชิงคำถาม (e.g., “…คืออะไร?”, “…ทำอย่างไร?”) เปรียบเทียบในรูปแบบตาราง |
- Unique Information: เนื้อหาของ top rank มักจะเหมือน ๆ กันไปหมดใช่ไหมคะ เพราะฉะนั้น การที่จะช่วยให้ AI Overview ตัดสินใจได้ว่าจะใช้เว็บไหนมาอ้างอิง เว็บนั้นจะต้องมีเนื้อหาที่เป็น unique insights มีงานวิจัยอ้างอิง เลขสถิติ หรือ case studies เพื่อให้ content มี exclusive value มากที่สุดค่ะ
- Multi-Modal Content: ในหน้าเว็บควรประกอบด้วยสื่อต่าง ๆ ที่หลากหลาย เพราะ research พบว่า หน้าเว็บที่มีการผสมผสาน content ทั้ง ข้อความ รูปภาพ วิดีโอ และ Structured Data จะมีอัตราการถูกเลือกไป citation สูงขึ้นถึง 156% และหากทำได้ครบทุกรูปแบบอาจเพิ่มโอกาสได้ถึง 317% !!! (Khadija Zaman, 2025)
Pathway 3: YouTube Content
นอกเหนือจากการทำ content ในเว็บแล้ว อีกทางเลือกคือการทำอันดับใน YouTube เพราะเป็นหนึ่งในโดเมนที่ถูกอ้างอิงบ่อยที่สุดใน AI Overview
ดังนั้น การทำ content ลงช่องทาง YouTube โดยปรับแต่งชื่อและคำอธิบายให้น่าสนใจ ตรงกับ intent ของ target query ก็จะช่วยให้มีโอกาสติดใน AI Overview ด้วยเช่นกัน
สรุปการทำงานของ Google AI Overview และสิ่งที่คนทำ SEO ต้องโฟกัส
- AI Overview ใช้ข้อมูลจาก Search เป็นหลัก ไม่ได้ generate ลอย ๆ → เอกสารที่ถูกนำมาอ้างอิง (SRDs) มาจากระบบค้นหา ดังนั้น SEO ยังเป็นฐานสำคัญที่สุด
- การถูกเลือกเป็น SRD คือด่านหลักของการติด AI Overview → ระบบพิจารณาทั้งความเกี่ยวข้อง คุณภาพ ความน่าเชื่อถือ และบริบทผู้ใช้ ก่อนนำไปสร้างคำตอบ
- อันดับดีช่วยเพิ่มโอกาส แต่เนื้อหา unique คือจุดชนะ → เว็บที่ครอบคลุม related queries และให้ข้อมูลแตกต่าง มีโอกาสถูก cite แม้ไม่ติดอันดับ 1
- โครงสร้างเนื้อหาสำคัญพอ ๆ กับเนื้อหา → คำตอบที่สั้น ชัด มี bullet, ตาราง และหัวข้อชัดเจน ช่วยให้ AI ดึงไปใช้ได้ง่าย
References
- https://patentimages.storage.googleapis.com/d3/2e/de/63defc51bec99a/US11769017.pdf
- https://richsanger.com/ai-overview-optimization-insights-from-googles-patent/
- https://richsanger.com/how-googles-ai-overview-works-for-seo/
- https://richsanger.com/google-ai-overview-study-link-selection-based-on-related-queries/
- https://wellows.com/blog/google-ai-overviews-ranking-factors/











