The Future of Search Engine

By : Jakkrit Siririn


ในตอนที่แล้ว เราได้พูดถึง Semantic-based Knowledge Management หรือ การจัดการความรู้เชิงอรรถศาสตร์ ซึ่งเป็นต้นคิดของการสร้าง Semantic Search Engine

ความแตกต่างระหว่าง Search Engine (เช่น Google) ซึ่งเป็นเพียง Text-based Information และ Content-based Information กับ Semantic Search Engine (เช่น DuckDuckGo) ซึ่งเป็น Term-based Information สามารถยกตัวอย่างง่ายๆ ได้ดังนี้

ถ้าเป็น Search Engine ธรรมดา เมื่อเราค้นคำว่า รถยนต์ Search Engine จะไปนำข้อมูลที่มีคำว่า รถยนต์ มานำเสนอให้เรา แต่หากเป็น Semantic Search Engine นอกจากจะได้ข้อมูลที่มีคำว่า รถยนต์ ยังแถมยี่ห้อรถยนต์ให้เราอีกด้วย เช่น TOYOTA HONDA ยิ่งถ้าเป็น Symbiotic Web ก็จะยิ่งฉลาดกว่า Semantic Web เพราะถ้าเป็น Symbiotic Web หากเราค้นหาคำว่า รถยนต์ นอกจากจะให้ข้อมูลคำว่า รถยนต์ ยังแถมยี่ห้อรถยนต์ คือ TOYOTA และ HONDA ยังพ่วงมอเตอร์ไซค์ HONDA ให้เราอีกด้วย

ผู้ช่วยศาสตราจารย์ ดร.ไกรศักดิ์ เกษร (2554) แห่งภาควิชาวิทยาการคอมพิวเตอร์และเทคโนโลยีสารสนเทศ คณะวิทยาศาสตร์ มหาวิทยาลัยนเรศวร ได้เขียนบทความวิชาการเรื่อง การค้นหาข้อมูลเชิงความหมาย: แนวคิดใหม่ของโปรแกรมการค้นหา (Search Engine) และแนวทางการพัฒนาในอนาคต ตีพิมพ์ในวารสารวไลยอลงกรณ์ปริทัศน์ ปีที่ 1 ฉบับที่ 2 กรกฎาคม-ธันวาคม 2554 โดยได้กล่าวว่า ในยุคแห่งระบบสารสนเทศและสังคมออนไลน์ ข้อมูลต่างๆ ได้กระจายอยู่ทั่วไปบนระบบเครือข่ายอินเทอร์เน็ต (Internet) และมีแนวโน้มที่จะเพิ่มมากขึ้นอย่างรวดเร็วต่อไปในอนาคต ข้อมูลที่กระจายอยู่ทั่วไปบนอินเทอร์เน็ตมีทั้งข้อมูลที่เป็นตัวอักษร (Textual Information) และข้อมูลมัลติมีเดีย (Multimedia Information) เช่น รูปภาพ (Image) วีดีโอ (Video) และเสียง (Audio)

อย่างไรก็ตามการข้อมูลจำนวนมากบนอินเทอร์เน็ตดังกล่าวได้นำปัญหามาสู่ผู้ใช้ นั่นคือ ผู้ใช้ไม่สามารถที่จะค้นหาข้อมูลที่ต้องการได้อย่างสะดวกและรวดเร็ว เพราะโปรแกรมค้นหา (Search Engine) ไม่สามารถค้นหาเอกสารที่ผู้ใช้ต้องการได้อย่างถูกต้องแม่นยำ ปัญหาดังกล่าวทำให้นักวิจัยคิดที่จะพัฒนาศาสตร์หนึ่งทางวิทยาการคอมพิวเตอร์เรียกว่าวิธี การค้นคืนข้อมูลสารสนเทศ (Information Retrieval: IR) ให้มีประสิทธิภาพมากขึ้น เพื่อผู้ใช้งานสามารถหาข้อมูลได้ตรงกับความต้องการมากที่สุด

จะสังเกตว่า เราเข้าใช้บริการของ Google ทุกวันเพื่อหาข้อมูลที่เราสนใจ ปรากฏการณ์นี้ถือเป็นสัญญาณบ่งชี้ว่า Search Engine มีความสำคัญอย่างยิ่งต่อชีวิตประจำวันของผู้ใช้อินเทอร์เน็ต แต่ปัญหาสำคัญของ Search Engine ในปัจจุบันก็คือการเป็นเพียงระบบค้นหาข้อมูลโดยการดูว่ามีคำสำคัญ (Keywords) ในข้อคำถาม (Query) ปรากฏอยู่ในเอกสารที่ค้นหาหรือไม่ ถ้าไม่มีข้อมูลไม่มีในระบบ Search Engine จะถือว่าเอกสารนั้นไม่เกี่ยวข้องกับ Query แต่ในความเป็นจริงแล้ว เอกสารบางอย่างอาจจะเกี่ยวข้องกับ Query ถึงแม้ว่าจะไม่มี Keywords ปรากฏร่วมกันเลยก็ตาม ความสัมพันธ์ในลักษณะนี้เรียกว่า ความสัมพันธ์เชิงความหมาย (Semantically Related) ดังนั้น แนวคิดในการพัฒนา Search Engine ใหม่ คือการค้นหาข้อมูลโดยพิจารณาจากแนวคิด (Concept) หรือความหมายของ Query (Conceptual Search/Semantic Search) และทิศทางการพัฒนา Search Engine ในอนาคตกำลังได้รับความสนใจจากนักวิจัยจำนวนมาก คือการค้นหาสารสนเทศเฉพาะบุคคล (Personalized Information Retrieval) และการค้นคืนสารสนเทศข้ามภาษา (Cross-Language Information Retrieval) ไกรศักดิ์ เกษร (2554)

ความแตกต่างระหว่าง Google ซึ่งเป็น Text-based Information และ Content-based Information กับ Semantic Search Engine ซึ่งเป็น Term-based Information เช่น DuckDuckGo เป็น GAP หรือช่องว่างที่สำคัญในรอยต่อระหว่างยุค Web 2.0 กับ Web 3.0 กล่าวคือ Web 2.0 (ค.ศ.2000-ค.ศ.2010) เป็นยุค Social Network ส่วน Web 3.0 (ค.ศ.2010-ค.ศ.2020) หรือ Semantic Web เป็นแนวคิดเครือข่ายเชิงอรรถศาสตร์ หรือ Semantic Network ที่มี Semantic Search Engine เป็นพระเอก

นอกจาก DuckDuckGo แล้ว Semantic Search Engine หรือ The Future of Search Engine ยังมีอีกหลายตัว อาทิ Kngine Hakia Hakia Evri Powerset Powerset ฯลฯ

ซึ่งนอกจากจะเป็นภาพแสดงแทนรอยต่อระหว่าง Web 2.0 กับ Web 3.0 แล้ว ยังเสมือนกระจกสะท้อนอนาคตที่กำลังขับเคลื่อนจากยุค Web 3.0 ไปยัง Web 4.0 ซึ่งกำลังใกล้จะเดินทางมาถึง

Web 4.0 (ค.ศ.2020-ค.ศ.2030) คือ Symbiotic Web หรือเว็บไซต์ที่ทำงานแบบ Artificial Intelligence (AI) หรือปัญญาประดิษฐ์ ตัวอย่างที่เกิดขึ้นแล้วคือการทำงานของโปรแกรม Siri ใน iPhone นั่นเองครับ

 

Reviews

Comment as: