ถ้าจะเปรียบกูเกิลเป็นแมงมุมที่คอยไต่ไปหาเหยื่อ เพื่อนำอาหารมาเก็บยังรัง มันก็เป็นแค่แมงมุมตาบอดตัวหนึ่ง
เมื่อก่อนผมเคยตั้งคำถามกับตัวเองว่า ทำไมกูเกิลมันจึงวิ่งไปหาข้อมูลมาให้เราเร็วนัก ตอนที่เราป้อนคำใดๆ แล้วกดปุ่ม Enter โคตรสุดยอดเลย วิ่งปรู้ดปร้าดไปหาข้อมูลตามเว็บต่างๆมาเสนอเราด้วยเวลาเพียง เศษเสี้ยวหนึ่งของวินาที
ตอนหลังผมจึงทราบเสียใหม่ว่า กูเกิลมันไม่ได้วิ่งพล่านไปหาข้อมูลจากเว็บต่างๆ มาเสนอเราตอนที่เราป้อนคำไป แต่มันไปหาข้อมูลมาเก็บไว้ก่อนในฐานข้อมูลของมัน แล้วพอเราค้นหามันก็ค้นหาจากฐานข้อมูลเอา
ย้อนหลังจากวันปัจจุบันไปประมาณสิบกว่าปี (ประมาณ แปลว่า เดา) เด็กสองคนชอบท่องเว็บแล้วชอบเก็บเป็นบุ๊กมาร์คไว้ แล้วหมอสองคนนี่ก็ไม่ยักกะขี้เกียจทำบุ๊กมาร์ค และไม่ยักกะคิดว่ารก ถ้าเป็นผมนะ ได้ห้าบุ๊กมาร์คเท่านั้นแหละ มันรกหูรกตา พอทำมากเข้าๆ ฟ้าเริ่มไม่เข้าข้างพี่แกแล้ว พี่แกเริ่มหาลิ้งก์ที่ต้องการไม่เจอ เพราะเยอะเสียเป็นกระบุงโกย ทั้งสองก็เลยเขียนโปรแกรมช่วยค้นหาบุ๊กมาร์คของตัวเอง (ผมก็ไม่รู้นะว่ามันเยอะขนาดไหน ถึงกับต้องเขียนโปรแกรมหา) หนึ่งในนั้นเกิดความคิดว่า บางลิ้งก์เราก็ไม่เคยเข้า บางเว็บเข้าบ่อย อย่างเว็บโป๊ะเป็นต้น(อันนี้ผมเติมเอง) ให้เว็บที่เราสองคนชอบเข้าออเดอร์เฟิร์ส คือเรียงไว้ก่อน ดีฝ่า
หลังเขียนเสร็จพี่แกก็ชื่นชมกับผลงานของตัวเอง จนยิ้มกันแก้มไม่หุบ พอไปไหนมาไหนเพื่อนๆเห็น ทำไมหมอนี่หน้าบานจัง ก็เลยถาม พอทราบความก็ลองใช้ตัวค้นหานั้นบ้าง เพื่อนบอก เออ… เข้าท่าว่ะ ยิ่งขี้เกียจๆอยู่ ทำไปทำมาทำไปหลายท่าจนใช้กันทั่วมหาลัย
ถึงขั้นเลยเถิดมาเป็นกูเกิลเว็บค้นหาข้อมูลผู้ยิ่งใหญ่ในปัจจุบัน
กรรมวิธีในการหาลิ้งก์มาเก็บไว้ในฐานข้อมูลของตัวเองนั้น กูเกิลเขียนโปรแกรมตัวหนึ่ง ที่ทำหน้าที่เหมือนเบราเซอร์ที่ไม่มีหน้าตาและกำหนด url ที่จะให้ดึงข้องมูลเบื้องต้นไว้ไม่กี่ลิ้งก์ เมื่อดึงข้อมูลจาก url แรกมามันก็จะอ่านสิ่งที่ได้มาทั้งหมด แล้วก็ดูว่าในสิ่งที่ได้มามีิ้ลิ้งก์ไปไหนต่อ มันก็จะไปดึงข้อมูลจากลิ้งก์นั้นๆ ขึ้นมา แล้วก็ทำตามกระบวนการเดิม นอกจากมันจะดูว่ามีลิ้งก์ไปไหนบ้าง มันก็ดูว่าเนื้อหาในหน้านั้นเกี่ยวกับเรื่องอะไร ก็พยายามเดาเอา เมื่อได้แล้วก็เอาไปเก็บในฐานข้อมูล โปรแกรมนี้โมดิฟายมาจากโปรแกรมตัวทีทำให้พี่แกยิ้มหน้าบานไม่หุบนั่นแหละ โดยเฉพาะ นายลารี่ เพจ ยิ้มยันเห็นเหงือก
ลองคิดดูอ่านมาหนึ่งหน้า เจอลิ้งกสิบลิ้งก์ อ่านทั้งสิบลิ้ง ในหนึ่งลิ้งก์เจออีกสิบ เป็นร้อยกว่าละ ทำไปอย่างนี้แบบไม่มีที่สิ้นสุด มันก็เก็บข้อมูลได้ทั่วโลก
ตอนหลังๆเมื่อกูเกิลมีอิทธิพลมากขึ้น กูเกิลก็เริ่มเสนอแนวทางที่จะไม่ให้โปรแกรมของตัวเองทำงานหนักมานัก และให้มันทำงานให้รวดเร็วขึ้น ก็บอกว่า เอางี้สิ ผู้ดูแลเว็บไซต์ทำแผนผังเว็บไซต์ให้เราในรูปแบบของ xml เราจะได้เขียนโปรแกรมให้ไปดูไฟล์นี้ก่อนวิ่งสะเปะสะปะเข้าเว็บท่าน
ก็เป็นอันว่า sitemap.xml นั้นมีประโยชน์เพื่อให้พวก search engine เก็บข้อมูลในเว็บไซต์ของเราอย่างเป็นระบบ และรวดเร็ว ถ้ามันเก็บข้อมูลจากเว็บเราได้เร็ว เว็บเราก็ปรากฎในเว็บค้นหาอย่างกูเกิลได้เร็ว ได้ประโยชน์ทั้งคู่ วินวิน
คนที่ใช้เวิร์ดเพรสเป็นตัวทำเว็บนั้นสบายหน่อย เพราะมีปลักอินที่ชื่อ Google XML Sitemaps ไว้ให้ใช้งาน ไม่ต้องมานั่งหลังขดหลังแข็งสร้างไฟล์ sitemap.xml เอง วิธีการนั้นก็ง่ายมากๆเพียงดาวน์โหลดมาติดตั้ง ไม่ต้องปรับแต่งอะไรเพิ่มเติม ถึงมันจะมีค่าให้ปรับก็ตาม เมื่อขี้เกียจแล้วก็ขี้เกียจให้ตลอด
เสื้อผ้าเด็ก says:
10/08/2553 at 10/08/2553
ขอบคุณค่า
TakoYaki says:
07/09/2553 at 07/09/2553
ไม่ต้องปรับแต่งอะไรเพิ่มเติม ถึงมันจะมีค่าให้ปรับก็ตาม
เมื่อขี้เกียจแล้วก็ขี้เกียจให้ตลอด
<– แอบขำค่ะ ฮาๆ แต่ WordPress นี่ทำให้สะดวกจริงแหล่ะค่ะ :)
diysms says:
07/09/2553 at 07/09/2553
ต้องมีไว้ใช้งานละ
ee155761 says:
02/02/2554 at 02/02/2554
155761Test
ee42439 says:
02/02/2554 at 02/02/2554
42439Test
Pond says:
18/04/2554 at 18/04/2554
ขอบคุณครับ แต่ว่าผมลองเอา ชื่อเว็บ/?feed=rss2 ใส่ใน Site Map ดูอ่ะครับมันได้เฉยเลย ผมก็เลยลบปลั๊คอินตัวนี้ออกไปเลย ลองดูครับ ^^