Abstract:
ยีนที่สำคัญเป็นหน่วยพันธุกรรมขั้นพื้นฐานสำหรับการดำรงอยู่ของสิ่งมีชีวิต การค้นหาหรือระบุยีนที่สำคัญจึงมีประโยชน์อย่างมากในการศึกษาและพัฒนายาต้านเชื้อแบคทีเรียและเชื้อโรคต่าง ๆ และปัจจุบันวิธีการทางการคำนวณมีส่วนช่วยให้สามารถระบุยีนหรือโปรตีนที่สำคัญทำได้รวดเร็วขึ้นและประหยัดค่าใช้จ่ายได้มากขึ้นด้วย วิธีการต่าง ๆ เหล่านี้รวมถึงการเรียนรู้ด้วยเครื่อง (Machine Learning) และการศึกษาคุณสมบัติทางโทโปโลยีโครงข่าย (Network Topology) ของโครงข่ายปฏิสัมพันธ์ระหว่างโปรตีนอีกด้วย ดังนั้นในโครงงานผู้จัดทำได้ศึกษาและประยุกต์ใช้การค้นหาเพื่อนบ้านใกล้ที่สุดผกผัน (Reverse nearest Neighbor Search) เข้ามาช่วยหายีนที่สำคัญในโครงข่ายปฏิสัมพันธ์ระหว่างโปรตีนของแบคทีเรีย E.coli โดยนำข้อมูลโครงข่ายปฏิสัมพันธ์ระหว่างโปรตีนในแบคทีเรีย และข้อมูลยีนที่สำคัญ มาวิเคราะห์ร่วมกันเพื่ออนุมานหายีนหรือโปรตีนที่สำคัญตัวใหม่ ซึ่งจะเป็นประโยชน์ต่อการพัฒนายาต้านเชื้อแบคทีเรียต่อไปได้ในอนาคต และนำผลที่ได้จากการระบุยีนที่สำคัญโดยวิธีการค้นหาเพื่อน บ้านผกผันมาเปรียบเทียบประสิทธิภาพกับวิธีการพิจารณาของดีกรีของโหนดยีน และวิธีการค้นหาเพื่อนบ้านที่ใกล้ที่สุด (Nearest Neighbor Search) พบว่าการระบุยีนที่สำคัญโดยใช้การค้นหาเพื่อนบ้านที่สุดผกผันมีประสิทธิภาพที่สุด โดยมีค่าความถูกต้อง (accuracy) 74.02% ค่าความแม่นยำ (precision) 41.01%