ความเดิมตอนที่แล้ว ผมได้พูดว่า Regular Expression ไม่ได้เป็นอะไรมากไปกว่า เครื่องมือค้นหาข้อความที่ต้องการ ที่สามารถใส่ความไม่แน่ใจเข้าไปช่วยได้ด้วย Regular Expression คืออะไร

ยกตัวอย่างอีกที

ผมต้องการค้นหาชื่อเพื่อนคนหนึ่ง แต่ผมไม่แน่ใจแล้วว่า ชื่อเขาสะกดด้วย ดอเด็กหรือดอชะดา

ผมจะเขียน Regular Expression ออกมาได้อย่างนี้

ธนเจ(ด|ฏ)

หาซิ สะกดด้วยดอเด็กหรือดอชะดาก็ได้

ทีนี้ความไม่แน่ใจของคนเรามันมีหลายอย่าง เช่น ไม่แน่ใจว่าใช้ตัวอักษรไหนกันแน่,ไม่แน่ใจว่ามีตัวสะกดหรือไม่มี,แน่ใจว่ามีตัวสะกดแต่ไม่รู้กี่ตัว,ไม่แน่ใจว่าสะกดด้วยตัวอะไร,มันขึ้นต้นด้วยคำนั้นแน่ๆ แต่ไม่รู้ลงท้ายด้วยอะไร เป็นต้น

นี่เป็นตัวอย่าง ยังไม่ใช่ทั้งหมด

จากความไม่แน่ใจที่กล่าวมา Regular Expression จึงต้องมีตัวอักษรพิเศษ เพื่อใช้แทนความไม่แน่ใจในแบบต่างๆ CPU มันจะได้รู้ว่าไม่แน่ใจตรงไหน แบบไหน มาดูตัวอย่างสักตัว บทหน้าเราค่อยกล่าวถึงสัญลักษณ์ทั้งหมด

| สัญลักษณ์ที่ใช้แทนคำว่าหรือ

ตัวอย่าง

พอลล่(า|ะ)

หาคำว่า พอลล่าหรือพอลล่ะ ลงท้ายด้วยสระอาหรือสระอะก็ได้ ถ้าในข้อความที่ใช้สำหรับหามีอยู่ก็จะเจอ

(ต|ตู)ด

หาคำว่า ตดหรือตูด ขึ้นต้นด้วยตอเต่าหรือตอตูก็ได้