Monday, April 13, 2026

Registration: Free Basic Statistics using Jamovi Session

 


এপ্রিলের ২৭ তারিখ থেকে শুরু হচ্ছে আমাদের Basic Statistics using Jamovi

এর একটি সম্পূর্ণ ফ্রি কোর্স। 

এই কোর্সটি বিশেষভাবে ডিজাইন করা হয়েছে বিগিনার এবং non-statistics background এর শিক্ষার্থীদের জন্য, যাতে খুব সহজভাবে basic data analysis শেখা যায়।

যারা অলরেডি বেসিক পরিসংখ্যান বা ডেটা এনালাইসিস জানেন,

এই কোর্স কোন ভাবেই তাদের জন্য নয়

📅 শুরুর তারিখ: ২৭/০৪/২০২৬
🗓 ক্লাস: প্রতি সোমবার ও বুধবার
সময়: বাংলাদেশ সময় রাত ৯টা
💻 প্ল্যাটফর্ম: Zoom

📚 কোর্স কনটেন্ট:

  1. Basics of Statistics

  2. Data Import

  3. Data Cleaning

  4. Descriptive Statistics

  5. Regression Analysis (Multiple Linear, Logistic, Probit)

  6. ANOVA

  7. Non-Parametric Statistics

⚠️ গুরুত্বপূর্ণ বিষয়:

  • কোনো certificate প্রদান করা হবে না

  • কোর্সটি সম্পূর্ণভাবে Jamovi software ব্যবহার করে পরিচালিত হবে

  • Registration করলেই selection নিশ্চিত নয়

  • Registration form-এর শেষ ২টি প্রশ্ন সঠিকভাবে উত্তর দিতে হবে

  • আপনার motivation যথেষ্ট না হলে selection নাও হতে পারে

  • আমরা selection process-এ যথেষ্ট strict

  • কোর্স কোয়ালিটি মেইনটেইন করতে আমরা সর্বোচ্চ ১০০ জনকে নিতে পারবো।

📅 Registration এর শেষ তারিখ: ২২ এপ্রিল ২০২৬ 

🔗 Registration Link: https://forms.gle/Rbj9ZwrhpwBemu3m6

📩 কোর্সের বিস্তারিত তথ্য ইমেইলের মাধ্যমে জানানো হবে।

তাই ২২ এপ্রিলের পর অবশ্যই আপনার email check করবেন।

Share:

Sunday, April 12, 2026

Free Statistics Course: Learn Data Analysis with Jamovi

 


এপ্রিলের ২৭ তারিখ থেকে শুরু হচ্ছে আমাদের Basic Statistics using Jamovi

এর একটি সম্পূর্ণ ফ্রি কোর্স। 

এই কোর্সটি বিশেষভাবে ডিজাইন করা হয়েছে বিগিনার এবং non-statistics background এর শিক্ষার্থীদের জন্য, যাতে খুব সহজভাবে basic data analysis শেখা যায়।

যারা অলরেডি বেসিক পরিসংখ্যান ও ডেটা এনালাইসিস জানেন,

এই কোর্স কোন ভাবেই তাদের জন্য নয়

📅 শুরুর তারিখ: ২৭/০৪/২০২৬
🗓 ক্লাস: প্রতি সোমবার ও বুধবার
সময়: বাংলাদেশ সময় রাত ৯টা
💻 প্ল্যাটফর্ম: Zoom

📚 কোর্স কনটেন্ট:

  1. Basics of Statistics

  2. Data Import

  3. Data Cleaning

  4. Descriptive Statistics

  5. Regression Analysis (Multiple Linear, Logistic, Probit)

  6. ANOVA

  7. Non-Parametric Statistics

⚠️ গুরুত্বপূর্ণ বিষয়:

  • কোনো certificate প্রদান করা হবে না

  • কোর্সটি সম্পূর্ণভাবে Jamovi software ব্যবহার করে পরিচালিত হবে

  • Registration করলেই selection নিশ্চিত নয়

  • Registration form-এর শেষ ২টি প্রশ্ন সঠিকভাবে উত্তর দিতে হবে

  • আপনার motivation যথেষ্ট না হলে selection নাও হতে পারে

  • আমরা selection process-এ যথেষ্ট strict

  • কোর্স কোয়ালিটি মেইনটেইন করতে আমরা সর্বোচ্চ ১০০ জনকে নিতে পারবো।

📅 Registration এর শেষ তারিখ: ২২ এপ্রিল ২০২৬ 

🔗 Registration Link: https://forms.gle/Rbj9ZwrhpwBemu3m6

📩 কোর্সের বিস্তারিত তথ্য ইমেইলের মাধ্যমে জানানো হবে।

তাই ২২ এপ্রিলের পর অবশ্যই আপনার email check করবেন।

Share:

The Behavior of Data: Choosing the Right Statistical Model

May be an image of text that says "ডেটার পরিবর্তনে সাথে কিভাবে পরিসংখ্যানের পদ্ধতি বদলায়।" 


পরিসংখ্যান আমার কাছে সবসময় অদ্ভুত লাগে।
এটা শুধু সংখ্যা নিয়ে কাজ করে না। সংখ্যার ভেতরে লুকিয়ে থাকা প্যাটার্ন বোঝার চেষ্টা করে। মানুষের আচরণ যেমন সময়, পরিস্থিতি আর পরিবেশের সাথে বদলায় তেমনি ডেটার আচরণও বদলায়। আর সেই আচরণ না বুঝলে যতই নিখুঁত বিশ্লেষণ হোক, ফলাফল নিয়ে প্রশ্ন থেকে যায়।

একটা উদাহরণ দিয়ে শুরু করি।
ধরুন আপনি দেখতে চান, একজন শিক্ষার্থীর দৈনিক পড়াশোনার সময় তার CGPA-কে কীভাবে প্রভাবিত করে। দুটোই continuous variable যা সংখ্যায় মাপা যায়, মাঝখানে অসংখ্য মান থাকতে পারে। পড়াশোনার সময় বাড়লে CGPA মোটামুটি সরলভাবে বাড়ে। এই সম্পর্ক কল্পনা করলে এখানে Simple Linear Regression সবচেয়েকার্যকর। এটি একটি সরল রেখার মাধ্যমে বলে পড়াশোনার সময় এক ইউনিট বাড়লে CGPA গড়ে কতটা বদলায়।

কিন্তু বাস্তবতা এত সরল না।
CGPA শুধু পড়াশোনার সময়ের উপর নির্ভর করে না। ক্লাস এটেনডেন্স, ঘুমের পরিমাণ, মানসিক চাপ এরকম অনেক কিছুই ভূমিকা রাখে। একাধিক predictor যুক্ত হলে Simple Linear Regression আর ঠিকঠাক কাজ করবে না। তখন দরকার হয় Multiple Linear Regression যা একই সাথে একাধিক variable-এর প্রভাব বিবেচনা করতে পারে। 

এবার ধরুন CGPA-কে সংখ্যায় না দেখে দুই ভাগ করলেন। ভালো আর খারাপ বা ফার্স্ট ক্লাস ও সেকেন্ড ক্লাস। Dependent variable এখন binary। এই ছোট্ট পরিবর্তনটাই বিশ্লেষণের ধরন পুরো বদলে দেয়। Linear Regression দিয়ে probability পরিমাপ করা যায় না বা করলেও অযৌক্তিক মান আসে (০-এর কম বা ১-এর বেশি)। তাই এখানে ব্যবহার করতে হয় Binary Logistic Regression, যা probability-কে সবসময় ০ থেকে ১-এর মধ্যে রাখে।

কিন্তু গল্পে আবার মোড় আসে।
CGPA-কে যদি A+, A, B, C এভাবে grade letter-এ ভাগ করেন, তখন category একাধিক। এখন দেখতে হবে এই category-গুলোর মধ্যে কোনো ক্রম আছে কি না। A+ অবশ্যই A-এর চেয়ে ভালো। অর্থাৎ এখানে ক্রম আছে। তখন আমাদের ব্যবহার করতে হবে Ordinal Logistic Regression। কিন্তু যদি category-গুলোর মধ্যে কোনো ক্রম না থাকে যেমন Science, Arts বা Commerce background আবার আমাদের জন্য Multinomial Logistic Regression বেশি উপযুক্ত।

এখানেই শেষ নয়।
CGPA-এর সর্বোচ্চ সীমা ৪.০০। অনেক শিক্ষার্থী এই সীমায় গিয়ে আটকে যায়। হয়তো অনেকের প্রকৃত performance হয়তো আরও ভালো হতে পারত, কিন্তু scale-এ মাপার সুযোগ নেই। এই অবস্থাকে বলে censored data। এখানে সাধারণ regression ব্যবহার করলে ফলাফল biased হয়। তখন ব্যবহার করা হয় Tobit Model।

আরেক ধরনের প্রশ্ন দেখি আমরা। পড়াশোনার সময় একজন শিক্ষার্থীকে কয়টি scholarship এনে দেয়। এখানে ফলাফল একটি count ডেটা। যেমন ১টি, ২টি, ৩টি। কেউ ১.৫টি scholarship পেতে পারে না, মানও কখনো negative হয় না। এই ধরনের data সাধারণত normal distribution অনুসরণ করে না। তাই ব্যবহার করা হয় Poisson Regression।

তবে বাস্তব data অনেক সময় তাত্ত্বিক নিয়ম মেনে চলে না। বেশিরভাগ শিক্ষার্থী হয়তো কোনো award পায়নি, কিন্তু কয়েকজন অনেকগুলো পেয়েছে। ফলে data-র variance তার mean-এর চেয়ে অনেক বড় হয়ে যায়। এটাকে বলে overdispersion। তখন Poisson আর যথেষ্ট নয়, দরকার হয় Negative Binomial Regression।

এবার ভিন্ন একটা situation কল্পনা করি। আপনি একই ১০০ জন শিক্ষার্থীর আটটি semester-এর data নিলেন। এখনে দুটো মাত্রা যোগ হলো। ব্যক্তি এবং সময়। একই ব্যক্তির data বারবার আসায় observation-গুলো আর সম্পূর্ণ স্বাধীন থাকে না। এই ধরনের data-কে বলে Panel Data। তখন ব্যবহার করা হয় Fixed Effects বা Random Effects Model যা দুইটা ডাইমেনশনের (ব্যক্তিগত বৈশিষ্ট্য আর সময়ের) প্রভাবকে আলাদা করে বোঝার চেষ্টা করে।

সবশেষে একটা সম্পূর্ণ ভিন্ন প্রশ্ন।
পড়াশোনা শুরুর কতদিন পর একজন শিক্ষার্থী dropout হয়? এখানে শুধু ঘটনা ঘটেছে কি না সেটা গুরুত্বপূর্ণ নয় বরং গুরুত্বপূর্ণ হলো ঘটনাটা ঘটতে কত সময় লাগল। এই time to event data এনালাইসিসের জন্য ব্যবহার করা হয় Survival Analysis।

এই পুরো গল্পটা আসলে একটা গুরুত্বপূর্ণ মেসেজ দেয়। সেটা হলো পরিসংখ্যানের model গুলো কোনো জাদুকরী ফর্মুলা নয়। প্রতিটি model তৈরি হয়েছে একটি নির্দিষ্ট ধরনের data এবং একটি নির্দিষ্ট প্রশ্নের জন্য। তাই একজন ভালো গবেষক শুধু software নিয়ে কাজ করে না। তাকে বুঝতে হয় data-র প্রকৃতি, কাঠামো আর সীমাবদ্ধতা।

Share:

Wednesday, April 8, 2026

পুরোনো পাতার গন্ধঃ The Earthy Scent of Fallen Leaves



বাইরে বাতাসে পুরোনো পাতার গন্ধ। প্রতিদিন স্মৃতি কমে যাচ্ছে। আকাশের ফ্যাকাশে রঙে এখন আর আমার বিষণ্ণ লাগে না। আমি একটা সীমাহীন শূন্যতায় দাঁড়িয়ে আছি। একটা মহাপ্রাচীরের সামনে মাথা নিচু করে দাঁড়িয়ে। পৃথিবীর সমস্ত শক্তি দিয়েও এই প্রাচীর পেরোনোর শক্তি বা সামর্থ্য আমার নেই।

দুনিয়া দ্রুতই বদলে যাচ্ছে। বদলে যাচ্ছে চিরচেনা সব হাওয়া। শুধু থেকে যাচ্ছে মৃত্যুপুরীর পোড়া গন্ধ। স্যাঁতসেঁতে কাদামাটিতে পোকামাকড় বাসা বেঁধেছে। বাধা বেঁধেছে আমাদের ভঙ্গুর মনে। পুরোনো রাস্তায় অন্ধকার। আকাশের সাদা মেঘে বিষ।

আমি মাঝে মাঝে ভাবি এই বদলে যাওয়া কি সত্যিই বাইরে, নাকি আমার ভেতরেই কোথাও সবকিছু ভেঙে পড়ছে? আগে যেসব শব্দ আমাকে ছুঁয়ে যেত, এখন সেগুলো কেমন নিষ্প্রাণ লাগে। মানুষের মুখগুলোও যেন ধীরে ধীরে একরকম হয়ে যাচ্ছে। অপরিচিত, নির্লিপ্ত।

কখনো হঠাৎ মনে হয়, আমি যেন কোনো এক ভুল সময়ে আটকে গেছি। চারপাশে সবকিছু এগিয়ে যাচ্ছে, আর আমি একই জায়গায় দাঁড়িয়ে আছি, সময়ের বাইরে। এই শূন্যতার ভেতরে কোনো শব্দ নেই, কোনো প্রতিধ্বনি নেই। শুধু এক ধরনের ভারী নীরবতা, যা আমাকে ধীরে ধীরে গিলে খাচ্ছে।

তবু কোথাও খুব গভীরে একটা ক্ষীণ অনুভূতি রয়ে গেছে। হয়তো এই প্রাচীরের ওপারেও কিছু আছে। হয়তো সব শেষ হয়ে যায়নি। কিন্তু সেই ‘হয়তো’ শব্দটাও এখন আর আগের মতো শক্তিশালী না। সেটাও কেমন ভেঙে পড়ছে।

Share:

Sunday, March 29, 2026

p-value in simple words

 p-value বুঝতে হলে আপনাকে প্রথমেই বুঝতে হবে সিগনিফিকেন্স লেভেল কী। সহজ কথায়, সিগনিফিকেন্স লেভেল হলো আপনার নিজের কাছে নিজের করা একটি অঙ্গীকার যে আপনি গবেষণায় ভুল সিদ্ধান্ত নেওয়ার কতটুকু ঝুঁকি নিতে রাজি, তার একটা সীমা আগে থেকেই ঠিক করে দেওয়া।

ধরুন, আপনি পরীক্ষা করছেন যে আপনার আবিষ্কার করা নতুন ওষুধটা খাওয়ালে এক ঘন্টার মধ্যে রোগীদের জ্বর ৩ ডিগ্রি কমে কি না। এখন পরীক্ষা শুরুর আগেই আপনি ঠিক করলেন, আমি এই গবেষণায় সর্বোচ্চ ৫% ভুল সিদ্ধান্ত নেওয়ার ঝুঁকি নেব। অর্থাৎ Significance Level হলো ০.০৫।
এই ৫% মানে কিন্তু এই নয় যে ৫ জনের জ্বর কমবে না। এর মানে হলো একটু অন্যরকম। এর মানে হলো যদি বাস্তবে ওষুধের কোনো প্রভাব নাও থাকে, তবুও আপনি ভুল করে সর্বোচ্চ ৫% ক্ষেত্রে বলতে পারেন যে ওষুধ কাজ করেছে। অর্থাৎ আপনি আগে থেকেই মেনে নিচ্ছেন যে গবেষণায় একটা ছোট ভুল হওয়ার সম্ভাবনা থাকে, আর আপনি সেই ভুলের ঝুঁকি ৫% পর্যন্ত নিতে রাজি।



এবার আসি p-value এর কথায়।
আপনি ধরুন ৩০ জন রোগীকে ওষুধ খাওয়ালেন এবং দেখলেন তাদের জ্বর গড়ে ৩ ডিগ্রি কমেছে। এখন ডেটা অ্যানালাইসিস করার পর সফটওয়্যার আপনাকে একটি p-value দেখাবে।
এই p-value আসলে আপনাকে সরাসরি বলে না যে ওষুধ কাজ করেছে কি না। এটা একটু ঘুরে কথা বলে। p-value বলে, ধরে নিন আসলে ওষুধের কোনো প্রভাবই নেই। সেই অবস্থায় শুধুমাত্র chance বা দৈবক্রমে আপনার ডেটার মতো বা তার চেয়েও বেশি extreme ফলাফল পাওয়ার সম্ভাবনা কত।
ধরুন আপনার রেজাল্ট আসলো ০.০২। এর মানে হলো যদি বাস্তবে ওষুধের কোনো প্রভাব না থাকে, তবুও শুধু chance এর কারণে এমন ফলাফল পাওয়ার সম্ভাবনা প্রায় ২%। যেহেতু এই সম্ভাবনাটা আপনার নির্ধারিত ভুলের সীমা (৫%) এর চেয়ে কম, তাই আপনি বলতে পারেন যে ডেটা ওষুধ কাজ করার পক্ষে ভালো evidence দিচ্ছে। তখন ফলাফলটাকে বলা হয় statistically significant।
কিন্তু যদি মান আসতো ০.০৭, তাহলে এর মানে হবে, ওষুধের কোনো প্রভাব না থাকলেও প্রায় ৭% ক্ষেত্রে এমন ফলাফল পাওয়া সম্ভব। যেহেতু এই সম্ভাবনা আপনার নির্ধারিত সীমা (৫%) এর চেয়ে বেশি, তাই তখন ডেটা দিয়ে শক্তভাবে বলা যায় না যে ওষুধ কাজ করেছে। তখন আমরা বলি ফলাফল statistically significant না। তবে এটাও মনে রাখা দরকার significant না মানেই যে কোনো effect নেই, এমনটা বলা ঠিক না। বরং বলা ভালো যে ডেটা দিয়ে শক্তভাবে প্রমাণ করা যায়নি।
এবার আসি রিগ্রেশনে p-value কী বোঝায়।
আপনি যখন regression model ব্যবহার করবেন, তখন দেখবেন প্রতিটি ভ্যারিয়েবলের পাশে একটি করে p-value দেওয়া থাকে। এখানে p-value মূলত বলে ওই ভ্যারিয়েবলটির সাথে dependent variable এর যে সম্পর্কটা দেখা যাচ্ছে, সেটা ডেটাতে chance-এর কারণে হওয়ার সম্ভাবনা কত।
যদি p-value ০.০৫ এর কম হয়, তাহলে সাধারণভাবে বলা হয় যে ওই ভ্যারিয়েবলটির সাথে outcome-এর একটি statistically significant relationship আছে। অর্থাৎ ডেটা ইঙ্গিত দিচ্ছে যে এই ভ্যারিয়েবলটি outcome-এর সাথে সম্পর্কিত।
আর যদি p-value ০.০৫ এর বেশি হয়, তাহলে বলা হয় যে ডেটা দিয়ে ওই সম্পর্কটাকে statistically significant হিসেবে দেখানো যায়নি। তবে এটাও সবসময় মনে রাখতে হবে p-value বড় হলেই যে ভ্যারিয়েবলটি একেবারেই অপ্রয়োজনীয়, এমনটা নিশ্চিতভাবে বলা যায় না। অনেক সময় sample ছোট হলে বা data noisy হলে আসল effect থাকলেও সেটা ধরা পড়ে না।
তবে সত্যি বলতে কী, বাস্তবে ডেটা অ্যানালাইসিসের সময় গবেষকেরা অনেক সময় একটা সহজ নিয়ম ব্যবহার করেন। p-value যদি ০.০৫ এর নিচে হয়, তাহলে ফলাফলকে significant ধরা হয়, আর বেশি হলে significant ধরা হয় না। কিন্তু বাস্তবে ভালো গবেষণায় p-value-কে একমাত্র সিদ্ধান্ত হিসেবে ধরা হয় না বরং context, effect size, এবং data-এর গুণগত মান সবকিছু একসাথে বিবেচনা করা হয়।
Share: