สรุป Data Science Talk 3.0 by 100x and Clazy Cafe [07-Dec-2019]

Kanin Kearpimy
3 min readDec 8, 2019

จบกันไปแล้วสำหรับงาน Data Science Talk 3.0 จัดโดยทีมงาน 100x ร่วมกับ Clazy Cafe เพื่อนำผู้เชี่ยวชาญด้าน Data ในวงการต่างๆ มาแบ่งปันประสบการณ์ ซึ่งในครั้งนี้ มีผู้ชำนาญถึง 3 ท่านจากวงการประยุกต์ใช้ศาสตร์ Data Science ของการแพทย์ ธุรกิจและสังคม เข้ามาแบ่งปันกันอย่างน่าติดตาม จะเป็นอย่างไรกันบ้าง เชิญติดตามต่อได้เลย

ในการคิดค้นยาหนึ่งชนิด จะต้องผ่านกระบวนการขั้นต่ำ 10 ปี เพื่อหาสารประกอบในการยับยั้งสิ่งผิดปกติในร่างกาย แต่เราสามารถลดระยะเวลาตรงนั้นให้เหลือ 3 ปีได้

ท่านแรก Dr. Naravut Suvannang นักวิจัยจากมหาวิทยาลัยมหิดล ได้ร่วมแบ่งปันการประยุกต์ Data Science ในวงการแพทย์ไว้อย่างน่าสนใจ

ในทางการแพทย์ประยุกต์ใช้ Data Science อยู่มากเหมือนสาขาอื่นๆ อาทิ

  • Medical image Analysis: ใช้ AI ในการตรวจหาโรคจากฟิล์ม เอกซเรย์ ซึ่งในสายนี้มีคนสนใจเยอะมาก เพราะค่อนข้างจับต้องได้ที่สุด
  • Genetics and Genomics: วิเคราะห์ Code ทางร่างกาย ซึ่งหา pattern ที่ผิดพลาดไปภายในร่างกาย อาจจะทำให้เกิดโรค เช่นมะเร็งได้ (รักษาเร็ว ได้หายเร็ว รักษาช้า ได้ช้า)
  • Creation of drugs: กระบวนการสร้างยา ด้วยการใช้ data เข้ามาค้นหาสารประกอบที่เหมาะสมกับโรค ด้วยการ Matching สารตั้งต้น (เชื้อโรค) กับสารประกอบ (ตัวยา) ที่สามารถหักล้างกันได้
  • Virtual Assistance for patient and customer support: ใน case นี้สิ่งที่จับต้องได้ที่สุด ก็คงหนีไม่พ้น Chatbot หรือ intelligence assistance ที่คอยช่วยเหลือผู้ป่วยในการใช้ชีวิต หรือการรักษาที่ดีขึ้น
  • Predictive medicine: การพยากรณ์ว่าผู้ป่วยเสี่ยงต่อการเป็นโรคมากน้อยเพียงใด จากการใช้ข้อมูลย้อนหลังต่างๆ เช่น ประวัติการใช้ยา เป็นต้น

แล้ว Data Science จะมาช่วยในการอออกแบบยา (Creation of Drugs) ได้อย่างไร

ยาคือสิ่งที่ช่วยให้ร่างกายดีขึ้นจากสิ่งผิดปกติ ซึ่งประวัติของยาเริ่มมาตั้งแต่การเป็น เวทมนต์ สมุนไพร ยาเคมี และยาที่รักษาได้อย่างแม่นยำ (ทราบว่าตัวยาสามารถฆ่าสิ่งผิดปกติได้)

คนเราอาจจะมีปฏิกิริยาที่ไวต่อยาไม่เหมือนกัน ดังนั้นการปรับเปลี่ยนปริมาณของยา (หรือสารประกอบทางเคมี) ให้ตรงกับผู้ป่วยมากที่สุด จะทำให้การรักษาเหมาะสมมากขึ้น เราเรียกสิ่งนี้ว่า Precision Medicine

กระบวนการในการออกแบบยานั้นมีหลาย stages ซึ่งจากตัวสารประกอบที่มีมากถึง 10,000 จะมีเพียงสารประกอบหลักหน่วยเท่านั้น ที่จะออกมาเป็นยาได้ทาง Dr.Naravut ยกตัวอย่างได้อย่างน่าสนใจว่า

หากจะรักษาโรคมะเร็งนั้น จำเป็นต้องทราบก่อนว่า สารตัวใดในร่างกายผิดปกติ จากนั้นจึงไปหาว่าแล้วสารประกอบตัวใดบ้างที่จะยับยั้งความผิดปกติดังกล่าวได้ แล้วจึงนำมาทดลองเพื่อสร้างยา โดยในกระบวนการค้นหาสารประกอบเพื่อนำมาทดลองนั้นใช้เวลามาก แต่สามาถลดได้ด้วยการใช้ Data ของยาเข้ามา เพื่อหากลุ่มของสารประกอบที่มีโอกาสสูงในการทำลายหรือยับยั้งสิ่งผิดปกติได้ แล้วจึงนำมาทำการทดลอง

มาถึง Speaker คนที่ 2 คุณ Idsarut Sangsuan — Data Analytics Consultant จาก PulseMetrics บริษัทที่ปรึกษาด้าน Data Science จากสิงค์โปร์ คุณ Idsarut กล่าวประโยคเปิดไว้อย่างน่าสนใจ

ในฝั่ง Business นั้นการใช้งาน Data Analytics คือการหา “Decision”

สามารถแบ่ง Data Analytics ได้เป็น 4 ขั้น

  1. Descriptive Analytics: อะไรเกิดขึ้นกับธุรกิจบ้าง ใช้แค่ข้อมูลย้อนหลังที่มีการเก็บอยู่แล้ว
  2. Diagnostic Analytics: หาเหตุผลของสิ่งที่เกิดขึ้นภายในธุรกิจ (เริ่มวิเคราะห์ปัจจัยภายในและภายนอก ที่ไม่ได้มีแต่ data แล้ว)
  3. Predictive Analytics: พยากรณ์ว่าอะไรจะเกิดขึ้นจากปัจจัยและข้อมูลต่างๆ
  4. Prescriptive Analytics: นำผลพยากรณ์มาช่วยในการตัดสินใจ (Decision)

ซึ่งระหว่างการบรรยายได้มีการยก Case ทางธุรกิจที่ใช้ Data Analytic เข้าไปใช้งานอย่างน่าสนใจ ซึ่งแต่ละ project ก็จะมีการใช้ techniques ที่แตกต่างกัน

หากเราจะวัด Campaign Performance เพื่อเลือก Promotion ที่ดีที่สุดและใช้วิธีการเรียบง่ายที่สุด (ในทางสถิติ) จะทำได้อย่างไร? — AB Testing อาจเป็นคำตอบ

การใช้งาน A-B Testing คือการแบ่งกลุ่ม Target เป็น A, B แล้วแต่ละกลุ่มใช้ Condition ต่างกัน (ในทางปฏิบัติอาจจะแบ่งเป็น A, B, C ก็ได้ โดย A, B คือกลุ่มที่จะมีการใช้เงื่อนไขตามที่เราอยากทดลอง แต่ C จะไม่มีการใช้งานเงื่อนไขใดๆ เลย)

  • One Customer 1 to 2 condition: ใช้ Period of time เพื่อแบ่งเป็น Condition และ Target ต่างๆ เช่น ตอนเช้าให้ promotion 1 ตอนบ่ายให้ promotion 2
  • Many Customer to Many Condition: กลุ่ม A ใช้ Condition A และกลุ่ม B ใช้ condition B จากนั้นวัดผลจากสิ่งที่ customer interact

สิ่งที่ A/B Test จะให้คือ Result ที่วัดผลได้ว่า ลูกค้ากลุ่มใดสนใจ Campaign และมีการ interact มากกว่ากัน ซึ่งก็จะมีส่วนช่วยตัดสินใจการนำเสนอ Campaign ต่อไป

ถ้าเราอยากรทราบว่าใครจะซื้อ Mobile phone จากเราบ้าง เราจะ Prediction อย่างไร ?

Customer จะมีข้อมูลโดยทั่วไปเมื่อเขาทำการซื้อสินค้าบางสิ่ง ซึ่งสามารถแบ่ง Group ข้อมูลได้เป็น 2 อย่าง

  1. Profile
  • อัตราเงินเดือน
  • อาชีพ
  • เพศ

2. Purchase

  • สินค้าที่ซื้อในช่วง 3 เดือนที่ผ่านมา
  • รูปแบบของสินค้าที่ซื้อ

ทั้ง Profile & Purchase สามารถนำข้อมูลมาสร้างเป็น Classification Model ขึ้นมาเพื่อแบ่งว่าลูกค้าท่านใดมีโอกาสซื้อ Mobile Phone อาทิ หากเป็นลูกค้าที่มี Profile เงินเดือนมากกว่า 30k อาชีพ นักธุรกิจ เพศชาย และมี Purchase ที่พึ่งซื้อสินค้า Iphone ในราคา 35k อาจจะมีโอกาส (Score) ในการซื้อ Mobile Phone ออกใหม่สูงกว่า (High % Score)

Speaker ท่านสุดท้าย คุณ Dollapak, Data Engineer ผู้อุทิศตัวทำงานในสายเพื่อสังคมจาก Institute of Public Policy and Development — IPPD

ได้ยกข้อมูลการเปลี่ยนแปลงทางสังคมต้อง drive ด้วยคน 4 แบบ ได้แก่

  1. Helper: คนที่คอยช่วยเหลือ รักษาจิตใจคนภายในกลุ่ม
  2. Rebel: พึ่งเข้าหาเป้าหมาย แล้วแก้ปัญหาเลย
  3. Advocate: คนที่คอยปราณีปรานอม คนทั้งภายในและภายนอก
  4. Organiser: มองภาพรวม และจัดประชุมเพื่อวาง Goal.

คุณ Dollapak ได้แบ่งปันประสบการณ์เกี่ยวกับการรวมทีมเพื่อสร้างการเปลี่ยนแปลงในสังคมด้วย Data อย่างน่าสนใจ อาทิเช่น กระบวนการขององค์กรบางแห่ง ที่มีการเปิดเผยข้อมูลสำคัญ แต่ไม่สามารถนำมาใช้งานในทาง Digital ได้ทันที ซึ่งก็ถือเป็นความท้ายทายในสังคมปัจจุบัน ที่ต้องรับมือการรูปแบบของ Data ที่มีความหลากหลาย และไม่พร้อมใช้งาน

กระบวนการ Data Collection ณ ปัจจุบันยังเป็นกระบวนการ manually กล่าวคือให้คนไปจดข้อมูล ซึ่งก่อให้เกิดความยุ่งยากในการใช้งาน อย่างมากสุดข้อมูลที่มีการใช้งานได้ก็คือ PDF Files.

ก็ถือเป็นอึกหนึ่ง Series ของ 100x และ Clazy Cafe สำหรับการจัด Event ดีๆ เพื่อสร้าง knowledge และความเข้าใจด้าน Data มากยิ่งขึ้น สำหรับ Event ต่อไปที่จะมีขึ้นเร็วๆ นี้จะเป็นเช่นไร รอติดตามกันได้เลยครับ

--

--

Kanin Kearpimy

Software Engineer who passionate in Machine Learning. Love Mathematic, Programming, Public Speaking, and Writing.