การหาความสัมพันธ์ระหว่างปัญหาและวิธีการแก้ปัญหาจากเอกสารภาษาไทยบน เว็บบอร์ด

บทคัดย่อ

จุดประสงค์ของงานวิจัยนี้คือการหาและสกัดความสัมพันธ์ระหว่างปัญหาและวิธีการแก้ปัญหาโดยเฉพาะความสัมพันธ์อาการ-วิธีการรักษา ซึ่งเป็นความสัมพันธ์ระหว่างปัญหาคืออาการกับวิธีการแก้ปัญหาคือวิธีการรักษาจากเอกสารบนเว็บบอร์ดของโรงพยาบาล  ผลของงานวิจัยนี้คือองค์ความรู้อย่างมีเหตุและผลบนพื้นฐานเอกัตถประโยคหรืออีดียู (EDU, Elementary Discourse Unit) หลายๆประโยค ซึ่งเป็นเป็นประโยชน์ต่อชาวบ้านหรือบุคคลทั่วไปในการแก้ไขปัญหาสุขภาพระดับเบื้องต้นผ่านระบบถามตอบอัตโนมัติ   อย่างไรก็ตามงานวิจัยนี้มีสามปัญหาหลัก: ปัญหาแรกคือ การระบุอีดียูที่มีแนวความคิดอาการและอีดียูที่มีแนวความคิดวิธีการรักษา   ปัญหาที่สองคือ การหาขอบเขตของอีดียูที่มีแนวความคิดอาการ และการหาขอบเขตของอีดียูที่มีแนวความคิดวิธีการรักษา   และปัญหาที่สามคือ การหาความสัมพันธ์อาการ-วิธีการรักษาจากเอกสาร   ดังนั้นงานวิจัยนี้ได้นำคู่คำ (Word-occurrence) ที่มีแนวความคิดอาการและแนวความคิดวิธีการรักษามาระบุอีดียูที่มีแนวความคิดอาการและอีดียูที่มีแนวความคิดวิธีการรักษาตามลำดับ   งานวิจัยนี้ได้ใช้เทคนิคเอสวีเอม (SVM, Support Vector Machine) มาทำการหาขอบเขตของอีดียูที่มีแนวความคิดอาการและขอบเขตของอีดียูที่มีแนวความคิดวิธีการรักษา   และสุดท้ายงานวิจัยนี้ขอเสนอการใช้เทคนิคการเรียนรู้ของเครื่อง (Machine Learning Techniques) ดัวยเนย์อีฟเบย์ (Naïve Bayes) มาทำการเรียนรู้ความสัมพันธ์ปัญหา-วิธีการแก้ปัญหา  ฉะนั้นจากงานวิจัยนี้ผลลัพธ์การสกัดความสัมพันธ์อาการ-วิธีการรักษามีความถูกต้องคิดเป็นค่าความแม่นยำ (Precision) และค่าระลึก (Recall) คือ 84% และ72% ตามลำดับ

Abstract

This paper aims to determine and extract the Problem-Solving relation, especially the Symptom-Treatment relation, which is the relation between the problems as the disease symptoms and the solving steps as the treatment steps from hospital-web-board documents downloaded from the non-governmental organization websites of the certain hospitals.  The research results are the reasoning knowledge (based on multiple simple sentence or EDUs, Elementary Discourse Units) which benefits for inexpert-people to solve their health problems in preliminary through the automatic question-answering system.  The research contains three problems: first is how to identify a symptom-concept EDU and a treatment-concept EDU. Second is how to determine a symptom-concept-EDU boundary and a treatment-concept-EDU boundary. Third is how to determine the Symptom-Treatment relation from documents. Therefore, we apply a word co-occurrence having a symptom/treatment concept to identify a disease-symptom-concept/treatment-concept EDU, respectively, and also apply Support Vector Machine as the machine learning technique to solve their boundaries.  We propose using Naïve Bayes to determine the Symptom-Treatment relation from documents with two feature groups, a symptom-concept-EDU group and a treatment-concept-EDU group.  Finally, the result of extracting the Symptom-Treatment relation shows successfully the precision and recall of 84% and 72%, respectively.