p-value বুঝতে হলে আপনাকে প্রথমেই বুঝতে হবে সিগনিফিকেন্স লেভেল কী। সহজ কথায়, সিগনিফিকেন্স লেভেল হলো আপনার নিজের কাছে নিজের করা একটি অঙ্গীকার যে আপনি গবেষণায় ভুল সিদ্ধান্ত নেওয়ার কতটুকু ঝুঁকি নিতে রাজি, তার একটা সীমা আগে থেকেই ঠিক করে দেওয়া।
ধরুন, আপনি পরীক্ষা করছেন যে আপনার আবিষ্কার করা নতুন ওষুধটা খাওয়ালে এক ঘন্টার মধ্যে রোগীদের জ্বর ৩ ডিগ্রি কমে কি না। এখন পরীক্ষা শুরুর আগেই আপনি ঠিক করলেন, আমি এই গবেষণায় সর্বোচ্চ ৫% ভুল সিদ্ধান্ত নেওয়ার ঝুঁকি নেব। অর্থাৎ Significance Level হলো ০.০৫।
এই ৫% মানে কিন্তু এই নয় যে ৫ জনের জ্বর কমবে না। এর মানে হলো একটু অন্যরকম। এর মানে হলো যদি বাস্তবে ওষুধের কোনো প্রভাব নাও থাকে, তবুও আপনি ভুল করে সর্বোচ্চ ৫% ক্ষেত্রে বলতে পারেন যে ওষুধ কাজ করেছে। অর্থাৎ আপনি আগে থেকেই মেনে নিচ্ছেন যে গবেষণায় একটা ছোট ভুল হওয়ার সম্ভাবনা থাকে, আর আপনি সেই ভুলের ঝুঁকি ৫% পর্যন্ত নিতে রাজি।
এবার আসি p-value এর কথায়।
আপনি ধরুন ৩০ জন রোগীকে ওষুধ খাওয়ালেন এবং দেখলেন তাদের জ্বর গড়ে ৩ ডিগ্রি কমেছে। এখন ডেটা অ্যানালাইসিস করার পর সফটওয়্যার আপনাকে একটি p-value দেখাবে।
এই p-value আসলে আপনাকে সরাসরি বলে না যে ওষুধ কাজ করেছে কি না। এটা একটু ঘুরে কথা বলে। p-value বলে, ধরে নিন আসলে ওষুধের কোনো প্রভাবই নেই। সেই অবস্থায় শুধুমাত্র chance বা দৈবক্রমে আপনার ডেটার মতো বা তার চেয়েও বেশি extreme ফলাফল পাওয়ার সম্ভাবনা কত।
ধরুন আপনার রেজাল্ট আসলো ০.০২। এর মানে হলো যদি বাস্তবে ওষুধের কোনো প্রভাব না থাকে, তবুও শুধু chance এর কারণে এমন ফলাফল পাওয়ার সম্ভাবনা প্রায় ২%। যেহেতু এই সম্ভাবনাটা আপনার নির্ধারিত ভুলের সীমা (৫%) এর চেয়ে কম, তাই আপনি বলতে পারেন যে ডেটা ওষুধ কাজ করার পক্ষে ভালো evidence দিচ্ছে। তখন ফলাফলটাকে বলা হয় statistically significant।
কিন্তু যদি মান আসতো ০.০৭, তাহলে এর মানে হবে, ওষুধের কোনো প্রভাব না থাকলেও প্রায় ৭% ক্ষেত্রে এমন ফলাফল পাওয়া সম্ভব। যেহেতু এই সম্ভাবনা আপনার নির্ধারিত সীমা (৫%) এর চেয়ে বেশি, তাই তখন ডেটা দিয়ে শক্তভাবে বলা যায় না যে ওষুধ কাজ করেছে। তখন আমরা বলি ফলাফল statistically significant না। তবে এটাও মনে রাখা দরকার significant না মানেই যে কোনো effect নেই, এমনটা বলা ঠিক না। বরং বলা ভালো যে ডেটা দিয়ে শক্তভাবে প্রমাণ করা যায়নি।
এবার আসি রিগ্রেশনে p-value কী বোঝায়।
আপনি যখন regression model ব্যবহার করবেন, তখন দেখবেন প্রতিটি ভ্যারিয়েবলের পাশে একটি করে p-value দেওয়া থাকে। এখানে p-value মূলত বলে ওই ভ্যারিয়েবলটির সাথে dependent variable এর যে সম্পর্কটা দেখা যাচ্ছে, সেটা ডেটাতে chance-এর কারণে হওয়ার সম্ভাবনা কত।
যদি p-value ০.০৫ এর কম হয়, তাহলে সাধারণভাবে বলা হয় যে ওই ভ্যারিয়েবলটির সাথে outcome-এর একটি statistically significant relationship আছে। অর্থাৎ ডেটা ইঙ্গিত দিচ্ছে যে এই ভ্যারিয়েবলটি outcome-এর সাথে সম্পর্কিত।
আর যদি p-value ০.০৫ এর বেশি হয়, তাহলে বলা হয় যে ডেটা দিয়ে ওই সম্পর্কটাকে statistically significant হিসেবে দেখানো যায়নি। তবে এটাও সবসময় মনে রাখতে হবে p-value বড় হলেই যে ভ্যারিয়েবলটি একেবারেই অপ্রয়োজনীয়, এমনটা নিশ্চিতভাবে বলা যায় না। অনেক সময় sample ছোট হলে বা data noisy হলে আসল effect থাকলেও সেটা ধরা পড়ে না।
তবে সত্যি বলতে কী, বাস্তবে ডেটা অ্যানালাইসিসের সময় গবেষকেরা অনেক সময় একটা সহজ নিয়ম ব্যবহার করেন। p-value যদি ০.০৫ এর নিচে হয়, তাহলে ফলাফলকে significant ধরা হয়, আর বেশি হলে significant ধরা হয় না। কিন্তু বাস্তবে ভালো গবেষণায় p-value-কে একমাত্র সিদ্ধান্ত হিসেবে ধরা হয় না বরং context, effect size, এবং data-এর গুণগত মান সবকিছু একসাথে বিবেচনা করা হয়।
