แหล่งข้อมูลของ Search Console ที่ใช้กันอย่างแพร่หลายที่สุดในปัจจุบัน คือ Google Search performance ทั้งตัว Tools ที่เรียกว่า Performance report และ Search Analytics API
โดยโพสต์นี้จะมาอธิบายว่า Google ประมวลผลลัพธ์เหล่านี้อย่างไร คัดกรอง คัดเลือกข้อมูลเหล่านี้อย่างไรโดยละเอียดกันครับ จะครอบคลุมไปถึงระยะเวลาที่ใช้ในการเก็บข้อมูลและการประมวลผลข้อมูลเหล่านี้ด้วย
หากคุณกำลังสงสัยขั้นตอนกระบวนการเก็บและคัดกรองข้อมูลของ Google NerdOptimize จะมาอธิบายแบบละเอียดเจาะลึกให้คุณเข้าใจได้ไม่ยาก
Search performance เบื้องต้น
ตัว Performance report จะกล่าวถึงตัวชี้วัดทั้ง 4 ที่แสดงให้เห็นว่ายอดเสิร์ชของเราเป็นอย่างไรบ้าง ถ้าจะให้พูดสั้น ๆ ก็คือ
- ยอดคลิก (Clicks): ยอดคลิก นับจากที่ยูสเซอร์ค้นใน Google และคลิกเข้ามาในเว็บไซต์ของเรา
- ยอดการมองเห็น (Impressions): ยอดการมองเห็น นับจากที่ยูสเซอร์ค้นใน Google และเห็นเว็บไซต์ของเรา
- อัตราการคลิก CTR (Click-through rate): ยอดคลิกหารด้วยยอดการมองเห็น
- อันดับ (Position): อันดับในหน้าเสิร์ชโดยเฉลี่ย
แต่ละตัวชี้วัดบ่งบอกถึงตัวเว็บไซต์ได้หลายแง่มุม ไม่ว่าจะเป็น คีย์เวิร์ดที่คนค้นหา หน้าเว็บที่คนเข้ามา ประเทศของยูสเซอร์ อุปกรณ์ที่ยูสเซอร์ใช้ หรือการค้นหาที่ทำให้คนเข้ามาในเว็บเรานั่นเอง
วิธีเข้าดูข้อมูล Search performance มีหลายแบบ เช่น ดู Product Interface, Search Analytics API หรือใช้ Looker Studio connector และ Spreadsheets ก็ได้
ถ้าใช้ตัว Product Interface อยู่ก็สามารถเข้าไปดูผลการวิเคราะห์ข้อมูลได้จากการกดตั้งฟิลเตอร์ หรือว่าดูแบบกราฟในภาพก็ได้เช่นกัน
ข้อมูลในส่วนนี้จะช่วยให้เห็นว่า เว็บไซต์ของเรายังต้องการการ Optimize ในส่วนไหนเพิ่มเติมเพื่อให้คนเข้าถึงเว็บไซต์ได้มากยิ่งขึ้น เพิ่มยอด Traffic จาก Google ได้อย่างเต็มประสิทธิภาพ
การคัดกรองและจำกัดข้อมูล
Data ที่สรุปเรียบร้อยแล้วไม่ว่าจะเป็นในรูปแบบของ Report หรือข้อมูลที่เรากด Export ออกมาให้เป็นชีท จะเป็นข้อมูลที่ได้รับการสรุปและคัดกรองเรียบร้อยแล้ว ซึ่งเกณฑ์ในการคัดกรองข้อมูลดังกล่าวจะมีอยู่ 2 ปัจจัยหลักๆ ได้แก่ การคัดกรองแบบความเป็นส่วนตัว และ ลิมิตการเก็บข้อมูลรายวัน ครับ
การคัดกรองแบบความเป็นส่วนตัว (Privacy Filtering)
การค้นหาบางประเภท (Anonymized Queries การค้นหาแบบไม่เปิดเผยตัวตน) จะไม่นับรวมในข้อมูล Search Console เพื่อคุ้มครองความเป็นส่วนตัวของยูสเซอร์ที่ค้นหาข้อมูล
Anonymized Queries คือกลุ่มคำค้นหาที่มีคนเสิร์ชไม่กี่สิบคนในระยะ 2-3 เดือน และเป็นคำค้นหาที่ไม่ปรากฏใน Search Performance เพื่อรักษาความเป็นส่วนตัวของยูสเซอร์ แต่สามารถดูได้จากตารางยอดรวมได้อยู่
เรามาลองอธิบาย”คำค้นหาแบบไม่เปิดเผยตัวตน”แบบให้เห็นภาพชัดขึ้น โดยดูจากข้อมูลเหล่านี้กัน เป็นข้อมูลคีย์เวิร์ดและยอด Traffic ที่เข้ามาในเว็บไซต์ โดยแยกคีย์เวิร์ด และ Anonymized Queries ออกจากกัน จะเห็นว่าเว็บไซต์โดยทั่วไปจะมีคำค้นหาขั้นต่ำ 4 คำ (แต่เพราะเป็นแค่การยกตัวอย่าง เราจะขอยกมาแค่ 4 คำพอนะครับ)
Queries | Clicks |
classic literature | 150 |
poetry | 125 |
science fiction | 100 |
non fiction | 75 |
Total for itemized queries | 450 |
Total overall | 550 |
ถ้าลองบวกยอดคลิกทั้งหมดจะพบว่า มียอดคลิกทั้งหมด 450 ครั้ง แต่ยอดคลิกโดยรวมอยู่ที่ 550 ครั้ง โดยตัวเลขที่เพิ่มขึ้นนั้นเพิ่มมาจากคำค้นหาแบบไม่เปิดเผยตัวตนนั่นเอง ซึ่งปัจจัยอื่นที่อาจจะส่งผลต่อตัวเลขที่ปรากฏอาจมาจากลิมิตการเก็บข้อมูลรายวันอีกด้วย
เมื่อนำ Search Console มาทำรีพอร์ทรายงานผลจริง อาจจะเห็นตัวเลขที่ไม่สอดคล้องกัน 2 แบบหลักๆ
1. ในตารางรายงานผลไม่มีแถวรายงานตัวเลขของ Anonymized Queries (เพราะที่ใส่ไว้ในตัวอย่างคือใส่ไว้เพื่ออธิบายให้เห็นภาพเท่านั้น) ดังนั้นถ้าบวกยอดคลิกแล้วจะพบว่าตัวเลขไม่เท่ายอดรวม เช่น ยอดคลิกรวมแล้วได้ 450 แต่ว่ายอดรวมเป็น 550
2. ถ้าใส่ฟิลเตอร์กรองผล ก็จะไม่มี Anonymized Queries ในผลลัพธ์ ดังนั้นถ้าบวกยอดคลิกโดยรวมมาเทียบกับยอดคลิกแบบที่ใส่ฟิลเตอร์ก็จะเห็นว่าตัวเลขที่ได้จะไม่เท่ากัน เช่น ถ้าในตัวอย่างนี้ เราใส่ฟิลเตอร์แสดงผลเฉพาะคำค้นหาที่มีคำว่า “fiction” ก็จะเห็นยอดคลิกแค่ 275 ครั้ง รวมแล้วได้ 450 ครั้ง แต่ยอดโดยรวมจะเป็น 550 ครั้ง
ลิมิตการเก็บข้อมูลรายวัน
เนื่องจากระยะเวลาที่ใช้ในการเก็บข้อมูลและการประมวลผลข้อมูลนั้นมีจำกัด Search Console จึงไม่สามารถแสดงผลข้อมูลทั้งหมดที่มีได้ แต่ว่าข้อมูลส่วนมากใน Search Console ไม่ค่อยได้รับผลกระทบจากข้อจำกัดนี้ นอกจากเว็บไซต์ใหญ่ๆบางเว็บเท่านั้น ซึ่งสำหรับเว็บเหล่านั้นก็ไม่ต้องกังวล เพราะข้อมูลที่มีก็เพียงพอจะเป็นตัวอย่างข้อมูล หรือ Data Sample ที่มีคุณภาพได้แล้ว
ปริมาณข้อมูลที่เราสามารถดึงจาก Search Console ได้จะอยู่ที่ 1,000 แถว
ณ ปัจจุบันถ้าดึงข้อมูลผ่านทาง Search Analytics API และ Looker Studio connector จะได้มากที่สุดประมาณ 50,000 แถว ต่อวัน ต่อเว็บ และต่อประเภทของการค้นหา ซึ่งเพียงพอต่อการดึงข้อมูลส่วนมากอยู่แล้ว
ถ้าใช้ API ปกติตัวเลขจะอยู่ที่ 1,000 แถว แต่ก็สามารถใช้ rowLimit เพื่อเพิ่มเป็น 25,000 แถว และ startRow เพื่อดึงข้อมูลในแถว 25,001-50,000 แบบแยกทีละหน้าได้
และหากต้องการข้อมูลที่ไม่ต้องมีคำค้นหาหรืออิงจาก URL อย่างพวก ประเทศของยูสเซอร์ อุปกรณ์ที่ยูสเซอร์ใช้ Search Console ก็สามารถแสดงข้อมูลและดึงข้อมูลดังกล่าวได้เลย
แหล่งที่มา : https://developers.google.com/search/blog/2022/10/performance-data-deep-dive