GT-200 Test

posted on 09 Feb 2010 10:46 by house in Social-Politic
เห็นข่าววิธีตรวจ GT200 แล้วต้องเขียนดักไว้ก่อน(เดี๋ยวมีคนแถ)

ยังไม่เห็นรายละเอียดการเทสต์เต็มๆนะครับ แต่เข้าใจว่าใช้วิธีทดสอบแบบเดียวกับซานเดียแล็ป สหรัฐอเมริกา

หลักง่ายคือ มีกล่อง 4 กล่อง หนึ่งในนั้นมีระเบิดอยู่ แล้วก็ให้ทดลองหา
คนซ่อน กับ คนหา ไม่เจอหน้ากัน และ ทำซ้ำ 20 ครั้ง

คำถาม:
คิดว่าถ้าเครื่องนี้มันห่วยจริง มันควรค้นเจอไม่เกินกี่ครั้ง?

คำตอบ:
นึกภาพตอนเข้าห้องสอบแบบเบลอๆแล้วเจอข้อสอบปรนัยดูนะครับ ไม่รู้อะไรเลย กามั่วลูกเดียว ก็ยังได้คะแนนติดมือมาบ้าง จริงมั้ย?
ดังนั้นแล้ว เราหาค่าคาดหวังได้ว่า มันควรจะตอบถูก(จากการมั่ว) ประมาณ
20*(1/4) = 5 ครั้ง
 
 
เอาละ ทีนี้ถ้ามันตอบได้ 6 หรือ 7 ครั้ง จะเรียกว่ามันทำงานได้รึเปล่า?

เอากลับไปเทียบกับข้อสอบอีกที เราคงรู้ว่า มันฟลุ้คได้ คนไม่ค่อยรู้เรื่องแล้วมั่วได้คะแนนดีๆ ก็มีเหมือนกัน
ในทางวิชาการ เราใช้สถิติเข้ามาทดสอบ เพื่อหาว่า โอกาสของการฟลุ้ค แบบนี้มีเท่าไหร่ โดยทั่วไป ถ้าเกิน 10% วงการวิชาการจะไม่ยอมรับว่าใช้การได้ครับ(บางวงการที่เกี่ยวข้องกับชีวิตคน เช่นแพทย์ ต้องการผลที่เชื่อมั่นได้ 99.99%)

มาลองดูกันดีกว่า ในทางสถิติ กรณีแบบนี้ใช้ Binomial Significant Test (ผมใช้เป็นอย่างเดียว ดังนั้นอย่าถามที่มาของสูตร) ดูว่าโอกาสฟลุ้คตอบถูก r ครั้งมีเท่าไหร่

p(r)binomial = nCr*pr*qn-r = (n!prqn-r)/(r!(n-r)!) -1)
n = จำนวนครั้งของการทำ(20 ครั้ง)
r = จำนวนครั้งที่ตอบถูก(?)
p = ความน่าจะเป็นที่มั่วถูก(1/4 = 0.25)
q = ความน่าจะเป็นที่มั่วผิด(3/4 = 0.75)

แต่จริงๆแล้ว ฟลุ้คตอบถูกเกิน r ครั้งก็ต้องนับด้วย ดังนั้นต้องคำนวณผลรวมของ p(k, r  <= k <= n)

ผลออกมาตามตารางนี้
ทำให้ดูง่ายๆได้แบบนี้ 
 
จากตารางจะเห็นได้ว่า ถ้าตอบถูกน้อยกว่า 9 ครั้ง วงการวิชาการถือว่าแหกตาครับและถ้าใช้ความเข้มงวดแบบเดียวกับมาตรฐานทางการแพทย์ ต้องตอบถูกเกินกว่า 13 ครั้ง

ปล. การเทสนี้ทำในห้องปิด/ไม่มีสิ่งปนเปื้อน/ใช้เวลาไม่จำกัด ลองนึกๆดูว่า ในสภาพแวดล้อมที่ดีสุดๆขนาดนี้ ถ้าใช้งานได้ต่ำกว่า 9 ครั้ง ในหน้างานจริง ที่มีสิ่งปนเปื้อน/สถานที่เปิด/มีเวลาจำกัด ความสามารถมันจะลดลงไปได้อีกระดับไหน? ผมว่าลบไปอีก 10-20% เผื่อได้เลย

ปล2. นี่เป็นการทดสอบว่ามันดีกว่าการมั่วหรือไม่นะครับ ผล 100% แปลว่ามันดีกว่าการมั่ว แต่ไม่ได้ทดสอบว่ามันทำได้ตามที่โฆษณาหรือไม่ ถ้าเอาผลเทส เทียบคำโฆษณา คงมันส์กว่านี้(ตอบถูก 13 ครั้ง เชื่อได้ 100% ว่าดีกว่าการมั่ว แต่ก็ยังตอบถูกแค่ 65%)


edit @ 9 Feb 2010 10:55:59 by house

edit @ 9 Feb 2010 11:14:30 by house

Comment

Comment:

Tweet

ความจริงก็ไม่น่าจะต้องทดสอบอีกนะ ทั้งอเมริกา อังกฤษ เค้าก็ทดสอบแล้ว...
^- เขาไม่ยอมให้ผ่า -*-

ในแล็ปผมว่าถ้าไม่ตุกติก อย่างเก่งก็ 6-7 ครั้งครับ ไม่ผ่านสถิติทดสอบแน่ๆsurprised smile

#3 By house on 2010-02-09 11:12

ได้ข่าวว่าเขาจะทดสอบเหมือนกัน
แต่ก็ไม่ค่อยรู้รายละเอียด

ถ้าถามเรานะ... เราว่าไปขอเขามาผ่าเหอะ ให้มันรู้กันไปเลยว่ามันกลวง - -''

ถ้าทดสอบแล้วมันเกิดเจอ (เนื่องด้วยความฟลุ้ค หรืออะไรก็ตาม) เดี๋ยวอ้างว่าใช้ได้ บลาๆๆ
ทดสอบในแล็บกับตอนเอาไปใช้งานจริงมันไม่เหมือนกันหรอก
sad smile

#2 By HeDw!g on 2010-02-09 11:10

PinG~ แปะดาวครับ น่าสนใจมาก ผมก้ออยากรู้ว่าเครื่องนี้มันโม้จริงอ่ะป่าว big smile

Hot! Hot! Hot!

#1 By Pl@y-M@Te on 2010-02-09 11:00