ความเดิมตอนที่แล้ว ผมได้พูดว่า Regular Expression ไม่ได้เป็นอะไรมากไปกว่า เครื่องมือค้นหาข้อความที่ต้องการ ที่สามารถใส่ความไม่แน่ใจเข้าไปช่วยได้ด้วย Regular Expression คืออะไร
ยกตัวอย่างอีกที
ผมต้องการค้นหาชื่อเพื่อนคนหนึ่ง แต่ผมไม่แน่ใจแล้วว่า ชื่อเขาสะกดด้วย ดอเด็กหรือดอชะดา
ผมจะเขียน Regular Expression ออกมาได้อย่างนี้
ธนเจ(ด|ฏ) |
หาซิ สะกดด้วยดอเด็กหรือดอชะดาก็ได้
ทีนี้ความไม่แน่ใจของคนเรามันมีหลายอย่าง เช่น ไม่แน่ใจว่าใช้ตัวอักษรไหนกันแน่,ไม่แน่ใจว่ามีตัวสะกดหรือไม่มี,แน่ใจว่ามีตัวสะกดแต่ไม่รู้กี่ตัว,ไม่แน่ใจว่าสะกดด้วยตัวอะไร,มันขึ้นต้นด้วยคำนั้นแน่ๆ แต่ไม่รู้ลงท้ายด้วยอะไร เป็นต้น
นี่เป็นตัวอย่าง ยังไม่ใช่ทั้งหมด
จากความไม่แน่ใจที่กล่าวมา Regular Expression จึงต้องมีตัวอักษรพิเศษ เพื่อใช้แทนความไม่แน่ใจในแบบต่างๆ CPU มันจะได้รู้ว่าไม่แน่ใจตรงไหน แบบไหน มาดูตัวอย่างสักตัว บทหน้าเราค่อยกล่าวถึงสัญลักษณ์ทั้งหมด
| สัญลักษณ์ที่ใช้แทนคำว่าหรือ
ตัวอย่าง
พอลล่(า|ะ) |
หาคำว่า พอลล่าหรือพอลล่ะ ลงท้ายด้วยสระอาหรือสระอะก็ได้ ถ้าในข้อความที่ใช้สำหรับหามีอยู่ก็จะเจอ
(ต|ตู)ด |
หาคำว่า ตดหรือตูด ขึ้นต้นด้วยตอเต่าหรือตอตูก็ได้
Leave a Reply