Non-Parametric Tests Explained | নন-প্যারামেট্রিক টেস্ট ~ Zabir

গবেষণা করতে গিয়ে একটা সময় প্রায় সব গবেষকই একই অভিজ্ঞতার মুখোমুখি হন। অনেক কষ্ট করে ডেটা সংগ্রহ করার পড় এনালাইসিস শুরু করতে গেলে দেখা যায় ডেটা normal distribution ফলো করছে না।

এসব ক্ষেত্রে আমারা সাধারণত non-parametric test করে থাকি। তার আগে একটু বোঝা দরকার কেন ডেটা normal না হলেও বা ডেটায় outlier থাকলেও non-parametric test ব্যবহার করতে সাধারণত সমস্যা হয় না।

এর মূল কারণ হলো, non-parametric test বেশিরভাগ ক্ষেত্রেই ডেটার আসল সংখ্যাগুলোকে সরাসরি ব্যবহার করে না। বরং এগুলো ডেটাকে rank বা order এ রূপান্তর করে বিশ্লেষণ করে। অর্থাৎ কোন মানটা বড়, কোনটা ছোট এই ক্রমটাই এখানে বেশি গুরুত্বপূর্ণ হয়ে যায়।

ধরুন একটি ক্লাসে পাঁচজন শিক্ষার্থীর নম্বর হলো ৪৫, ৫০, ৫২, ৫৫ এবং ৯৫। এখানে ৯৫ একটি outlier হতে পারে। যদি আমরা সরাসরি এই সংখ্যাগুলো দিয়ে analysis করি, তাহলে ৯৫ নম্বরটি গড়কে অনেকটা প্রভাবিত করতে পারে। কিন্তু যদি ডেটাকে rank এ রূপান্তর করা হয়, তখন এগুলো হবে ১, ২, ৩, ৪, ৫। তখন ৯৫ আর অতটা অস্বাভাবিক প্রভাব ফেলতে পারে না, কারণ এখানে শুধু তার অবস্থানটাই বিবেচনা করা হচ্ছে।

এই কারণেই non-parametric test সাধারণত distribution এর উপর খুব বেশি নির্ভর করে না। ডেটা normal হলো কি হলো না, variance সমান হলো কি হলো না এই শর্তগুলো এখানে ততটা কঠোরভাবে প্রয়োজন হয় না।

একই কারণে outlier থাকলেও এই ধরনের টেস্ট তুলনামূলকভাবে বেশি স্থিতিশীল ফল দেয়। কারণ extreme value থাকলেও সেটি শুধু একটি উচ্চ বা নিম্ন র‍্যাংক হিসেবে গণনা হয়, পুরো বিশ্লেষণকে প্রভাবিত করে না।

এবার আসি কয়েক ধরনের non-parametric test এ।

প্রথমে ধরা যাক Mann-Whitney U test। যখন দুটি আলাদা গ্রুপের মধ্যে পার্থক্য দেখতে চাই তখন আমরা এই টেস্ট করে থাকি। ধরুন একটি ক্লাসে দুইটি সেকশন আছে। সেকশন A এবং সেকশন B। আপনি জানতে চান পরীক্ষার নম্বরের দিক থেকে এই দুই সেকশনের মধ্যে কোনো পার্থক্য আছে কি না। যদি নম্বরগুলো normal distribution অনুসরণ না করে, তাহলে Mann-Whitney test ব্যবহার করা যেতে পারে।

দ্বিতীয়টি হলো Wilcoxon Signed-Rank test। এটা ব্যবহার করা হয় একই গ্রুপের আগে-পরে পরিবর্তন দেখতে। যেমন আপনি হয়ত জানতে চান ২০ জন রোগীকে একটি ওষুধ দেওয়ার আগে এবং পরে তাদের রক্তচাপ পরিবর্তন হয়েছে কি না। এই ক্ষেত্রে আমরা Wilcoxon Signed-Rank test ব্যবহার করি।

তৃতীয়টি হলো Kruskal-Wallis test। এটাকে ANOVA এর non-parametric বিকল্প হিসাবে ধরা হয়। যখন তিন বা তার বেশি গ্রুপ তুলনা করতে হয় এবং ডেটা normal না, তখন এই টেস্ট ব্যবহার করা হয়। উদাহরণ হিসেবে ধরা যায় তিনটি ভিন্ন ক্লাসের শিক্ষার্থীদের পরীক্ষার নম্বর তুলনা করা।

চতুর্থটি হলো Friedman test। এই টেস্ট repeated ANOVA এর বিকল্প। অর্থাৎ একই মানুষের উপর একাধিক সময়ে measurement নেওয়া হলে এবং ডেটা normal না হলে এই টেস্ট ব্যবহার করা যায়। যেমন একই রোগীদের তিনটি ভিন্ন সময়ে চিকিৎসার ফলাফল দেখা (মাস ১, মাস ২, মাস ৩)।

পঞ্চমটি হলো Spearman’s rank correlation। এটা ব্যবহার করা হয় দুটি ভেরিয়েবলের মধ্যে সম্পর্ক আছে কি না তা দেখতে, বিশেষ করে যখন ডেটা normal না বা ডেটা rank আকারে থাকে। এই টেস্টে ডেটাকে আগে rank বা ক্রমে সাজানো হয়, তারপর সেই র‍্যাংকের ভিত্তিতে সম্পর্ক নির্ণয় করা হয়।

এটা মূলত Pearson correlation এর non-parametric বিকল্প। Pearson correlation সাধারণত তখন ব্যবহার করা হয় যখন ডেটা normal distribution অনুসরণ করে। কিন্তু ডেটা normal না হলে Spearman correlation বেশি উপযুক্ত হয়। যেমন একজন শিক্ষার্থী দিনে কত ঘণ্টা পড়াশোনা করে এবং পরীক্ষার ফলাফলের মধ্যে কোনো সম্পর্ক আছে কি না।

আরেকটি গুরুত্বপূর্ণ টেস্ট হলো Kendall’s Tau। এটাও দুটি ভেরিয়েবলের মধ্যে সম্পর্ক পরিমাপ করতে ব্যবহার করা হয়, বিশেষ করে যখন ডেটা ranked এবং অনেক tie value থাকে। Tie value বলতে বোঝায় যখন একাধিক পর্যবেক্ষণের র‍্যাংক একই হয়। যেমন দুইজন শিক্ষার্থী পরীক্ষায় একই নম্বর পেয়ে একই অবস্থানে থাকে। এই ধরনের পরিস্থিতিতে Kendall’s Tau অনেক সময় Spearman correlation এর তুলনায় বেশি স্থিতিশীল ফলদিতে পারে।

Thursday, March 12, 2026