ডিসক্রিট ভেরিয়েবলের ডিস্ট্রিবিউশন

ডিসক্রিট ভেরিয়েবলের ডিস্ট্রিবিউশন কেমন হতে পারে? তার আগে একটু ব্যাকগ্রাউন্ড নিয়ে কথা বলি।

বই পড়া একটা নেশা। ডাটা এনালাইটিক্স বলি অথবা পরিসংখ্যান বলি - সবকিছুই মার্জ হয়ে আছে একদম বেসিক লেভেলে। সামনের দুটো চ্যাপ্টার আমি নিয়েছি বিশ্বখ্যাত বই ‘ইন্ট্রোডাকশন টু স্ট্যাটিসটিকস’ থেকে। পরিসংখ্যানের মত খটমটে জিনিসটাকে তারা চমৎকার ভাবে বুঝিয়ে লিখেছেন। পড়া যায় অনলাইনে। বইটা একটা অবশ্যপাঠ্য। ধারণাগুলো তাদের কাছ থেকে নেওয়া। এতে আপনার সুবিধা হবে পরবর্তীতে এই বইটা নিয়ে কাজ করতে গিয়ে।

মনে আছে এমএন্ডএম (m&m) ক্যান্ডির কথা? আমার বাচ্চারা খুব পছন্দ করে। সেই এমএন্ডএম এর একটা ব্যাগ কিনেছিলেন আমাদের লেখক। একটা প্যাকেটের ভিতর ৬ রংয়ের ক্যান্ডি পেয়েছিলেন উনি। পুরো একটা ব্যাগ খুলে একটা গোনা দিতেই দেখা গেল যে, সেখানে মোট ৫৫টা ক্যান্ডি রয়েছে। তার মধ্যে ১৭টা হচ্ছে বাদামী রঙের, আঠারোটা লাল, ৭টা হলুদ এবং চারটা সবুজ এবং কমলা রঙের এবং শেষে দুইটা নীল রঙের। এইসব ডাটাকে একটা টেবিলে ফেলি।

টেবিল

এই টেবিলটাকে আমরা ফ্রিকোয়েন্সি টেবিল বলতে পারি যেখানে এমএন্ডএম ক্যান্ডিগুলোর রং এর ফ্রিকোয়েন্সি নিয়ে আলাপ করা হয়েছে। মজার কথা হচ্ছে এ ধরনের ডিসট্রিবিউশনকে ফ্রিকুয়েন্সি ডিস্ট্রিবিউশন বলা হয়। এই টেবিলটাকে আমরা যদি গ্রাফে ফেলি তাহলে নিচের মত হতে পারে।

গ্রাফ

আমরা সাধারণত যখন এ ধরনের ছোট ছোট ক্যান্ডির প্যাকেট কিনি, সেখানে কোম্পানিগুলো কালার ধরে ধরে সমসংখ্যক ক্যান্ডি ফেলে না কারণ এতে তাদের অপারেশন খরচ বেড়ে যাবে। বরং তারা সবগুলো রংকে একসাথে মিশিয়ে একবারই প্যাকেজিং করে যাতে খরচ কমে যায়। সে কারণে আমরা যখন ক্যান্ডিগুলোর ফ্রিকুয়েন্সি ডিস্ট্রিবিউশন দেখছি আগের ছবিতে, সেটা পরের ছবিতে পাল্টে যাচ্ছে। কি কারনে পরের ছবিতে আমরা যদি যেকোনো একটা রং ধরে তার প্রবাবিলিটি ডিসট্রিবিউশন বের করতে চাই, সেখানে আমরা একমাত্র একটা রংকে পিক করব দৈবচয়নের ভিত্তিতে - তাহলে বাদামী (ধরে নিচ্ছি) রঙের ক্যান্ডি পাবার অনুপাত হচ্ছে ০.৩০। সে কারণে আমরা নতুন একটা ডিসট্রিবিউশন গ্রাফ ফেলছি সেই অনুপাত এর উপর ভিত্তি করে।

গ্রাফ

আগের ছবিতে আমরা দেখেছি ওই ব্যাগে ৫৫টা ক্যান্ডির ডিস্ট্রিবিউশন। পরের ছবিতে আমরা পুরোপুরি এমএন্ডএম কোম্পানির তৈরি ৬ ধরনের রংয়ের প্রপোরশন টেবিল অর্থাৎ অনুপাত বের করার চেষ্টা করেছি। এই একই জিনিস প্রযোজ্য হবে যখন এমএন্ডএম কোম্পানি দৈবচয়নের ভিত্তিতে আলাদা আলাদা ব্যাগ তৈরি করবে। কোন কোন ব্যাগের মধ্যে এই গ্রাফ এর মত রংয়ের ডিসট্রিবিউশন হবে। আবার কোন কোন ব্যাগে সেটা আগের ডিসট্রিবিউশন থেকে কিছুটা ব্যতিক্রম হবে। তবে যেটাই হোক না কেন সব গুলোর যোগফল ১ হবে।