কনটেন্টে যান

মর্তের মানুষের ডেটা অ্যানালাইটিক্স

পাল্টে গিয়েছে পৃথিবী

The world’s most valuable resource is no longer oil, but data.

-- The Economist, 2017

ডেটা ইজ দ্য নিউ অয়েল

কয়েক দশক আগে পৃথিবীর সব বিলিয়ন ডলার কোম্পানি ছিল এনার্জি/পাওয়ার কোম্পানিগুলো। ব্রিটিশ পেট্রোলিয়াম, জেনারেল ইলেকট্রিক, শেল, – কারণ, তখন তেল চালাতো বিশ্ব। এখন বিশ্ব চালায় ডেটা। যার কাছে বেশি ডেটা, সেই চালাচ্ছে পৃথিবী। ডেটা থেকে প্রজ্ঞা নিয়ে দুনিয়া দাপাচ্ছে গুগল, ফেসবুক, আমাজন, আলিবাবা, নেটফ্লিক্সের মতো ডেটা ড্রিভেন কোম্পানি। এই কোভিডের সময়েও। ডেটার কমতি নেই, যখন অন্য বিজনেসগুলো বিপদে পড়ছেন।

ফিরে আসি, বাংলাদেশে। অনেক কোম্পানি’র ম্যানেজমেন্ট কথা বলেন আমার সাথে। বিশেষ করে, ডেটা অ্যানালাইসিস নিয়ে। এর অর্থ হচ্ছে, তৈরি হচ্ছে আমাদের বাজারও। একটু সময় লাগছে, এই যা। সবাই ডেটা থেকে জ্ঞান নিতে চাইছেন।

ড্রাফট বই: $০.৫ ভার্সন

একটা ড্রাফট বই পড়ার গাইডলাইন

  • শুরুতে সব ধারণাগুলোকে জড়ো করি একটা জায়গায়, এটা সেই স্ক্র্যাচপ্যাড
  • বানান, ব্যাকরণের চিন্তা পরে
  • স্ট্রাকচার নিয়ে চিন্তা করবো পরে, স্টোরিলাইন উইল গ্রো ওভার টাইম
  • সব বইয়ের মতো এই বইটাও ক্রিয়েটিভ কমন্স লাইসেন্সে উন্মুক্ত করা
  • আপনাদের সদয় মতামত দিতে পারেন এখানে

এ যুগের স্কিলসেট, ডেটা ড্রিভেন সমাজের জন্য

পেশাগত কারণে প্রচুর প্রশিক্ষণের মুখোমুখি হতে হয়েছে আমাকে। প্রযুক্তিগত উৎকর্ষের একটা অংশে অনলাইন প্ল্যাটফর্মগুলো নিয়ে প্রচুর রিসার্চ করতে হয়েছে গত এক দশক ধরে। এবারের ঘটনা একদম মাথা খারাপ করার মতো।

সামনে বেশিরভাগ কাজ ডেটার। গুগল বলছে ডেটা নির্ভর চার বছরের ডিগ্রীর জায়গায় ৬-১২ মাসের নতুন সার্টিফিকেশন তৈরি করে দেবে নতুন জনবল - একুশ শতকের জন্য। গুগল ট্রেন্ড বলছে - মার্কেটে একটা বিশাল গ্যাপ তৈরি হয়েছে এই মহামারির কারণে। ডেটা বোঝা এবং ডেটা থেকে সিদ্ধান্ত নিতে পারা জনবল নিয়ে।

গত ২ মাস ধরে কোর্সগুলোকে ফুল স্কেলে অডিটিং করে যা বোঝা গেল, বিশাল ইনভেস্টমেন্ট করেছে গুগল এবং আইবিএম এর মতো কোম্পানিগুলো - এই গ্যাপ পূরণে। আমি তাদের কোর্সওয়ার্ক ম্যাটেরিয়াল দেখে সত্যিকারভাবে অভিভূত। এই কোর্সগুলো করতে বিশেষ কোন প্রাতিষ্ঠানিক পড়াশোনার প্রয়োজন নেই।

এর পাশাপাশি, ওই কোর্সওয়ার্কগুলো এবং আমার অভিজ্ঞতা মিলিয়ে নন-প্রোগ্রামারদের জন্য বাংলায় আমার ডেটা অ্যানালিস্ট মেন্টরশীপ প্রোগ্রাম তৈরি হচ্ছে জুলাই ২০২১ এর মধ্যে। একটা সত্যিকারের ডেটা-অ্যানালাইটিক্স কোর্স চালাতে সময় লাগবে ৬-৮ মাস, প্রতি সপ্তাহে ১৫-২০ ঘন্টা সময় দিলে। আমার অভিজ্ঞতা তাই বলে। নন-প্রোগ্রামারদের কথা ভেবে।

একটা সত্যিকারের হাইব্রিড প্ল্যাটফর্ম (বই+ভিডিও+কোড)

অনেকগুলো প্রযুক্তিগত বই লিখে এই প্রথম একটি পূর্ণ হাইব্রিড বই তৈরি করছি। যেকোনো বিষয়ের জন্য তথ্যগত জ্ঞানের পাশাপাশি ভিডিও টিউটোরিয়াল অনেক সাহায্য করে। ভিডিও টিউটোরিয়াল এর পাশাপাশি বেজলাইন তথ্যগত টেক্সট ছাড়া যেকোনো বিষয়ে ‘মাস্টারিং’ করা অসম্ভব হয়ে দাঁড়ায়। আর এ কারনেই এই বইটার প্রথম অংশ তাত্ত্বিক এবং এর পেছনের দর্শনকে প্রায়োরিটি দেওয়া হয়েছে। ডাটা অ্যানালিটিক্স এর উপরে সঠিক এবং প্রয়োজনীয় জ্ঞানের জন্য প্রাথমিক তাত্ত্বিক এবং এর পেছনের ‘আন্ডারলায়িং’ দার্শনিক ধারণাগুলোর সাথে শতাধিক ভিডিও যোগ করা হচ্ছে। দুটোই প্রয়োজনীয়, এই স্কিলসেট অর্জনের জন্য।

ভিডিওগুলোর লিংক পাবেন এখানে। পাশাপাশি, গিটহাব লিংক পাচ্ছেন এখানে

বিজনেস সমস্যা বোঝা, ঠিক প্রশ্নটা করে সেটার সমাধান

১০ বছর আগেও যেই ঘটনা দেখেছি, সেদিক থেকে - বর্তমানে সরকারি/বেসরকারি প্রতিষ্ঠানগুলোতে এত বেশি ডেটা আসছে এবং অল্প সময়ের মধ্যে, আমি নিজেও সেটা বিশ্বাস করতে পারছি না। এটা ঠিক যে, আগের ডেটাগুলো অনেক ছোট ছিল - যেটাকে সহজে ম্যানেজ করা যেত তবে, এই বিগ ডেটার যুগে, সেটা মাথা খারাপ করে দিচ্ছে। যেমন, সামান্য একটা প্রোডাক্ট বিক্রি করার এতো চ্যানেল তৈরি হয়েছে যা মানুষের পক্ষে প্রতিটা চ্যানেল ট্র্যাক করা অসম্ভব হয়ে পড়েছে। সেটাকে ছাড়তে হচ্ছে যন্ত্রের ওপরে। আর সেই যন্ত্র জেনারেট করে চলছে হাজারো ডাটা। কি যন্ত্রণা!

আমরা দেখছি যে, ডেটা শুধুমাত্র ভালো ভবিষ্যৎ প্রেডিকশন করছে না, বরং একটা ফ্লাইওভারের লেন কোন দিক দিয়ে নামালে সামনের ১০ বছরে - পুরো শহরের হাজার লক্ষ ঘন্টা বেঁচে যাবে সেটাও হিসেব করে দিতে পারছে এখনই। ফ্লাইওভার বানানোর আগে। আপনার কোম্পানির নতুন রিটেইল লোকেশন কোথায় হলে সবচেয়ে বেশি বিক্রি হবে, সেখানেও সাহায্য করছে ডেটা অ্যানালিটিকস। এর ব্যাকগ্রাউন্ডে, ডাটাকে প্রশ্ন করতে পারছি বলেই সেগুলো জানতে পারছি। কারণ, ডাটার ভেতরে লুকিয়ে আছে সব উত্তর।

ভালো প্রশ্ন

If I had an hour to solve a problem and my life depended on the solution, I would use the first 55 minutes determining the proper question to ask, for once I know the proper question, I could solve the problem in less than five minutes.

-- Albert Einstein (1879-1955)

এর অর্থ হচ্ছে আপনি ডাটাকে ঠিকমতো প্রশ্ন করতে পারছেন বলে সেটার উত্তর পাচ্ছেন। আমাদের সমস্যার একটা বড় অংশের সমাধান পাই না ঠিক প্রশ্ন করতে না পারার কারণে। আবার ঠিকমতো প্রশ্ন করতে পারলে আপনার একটা প্রোডাক্টের রিটার্নের হার আপনাকে বলে দেবে কোম্পানির ডিস্ট্রিবিউশন চ্যানেলে কোথায় সমস্যা হচ্ছে। এদিক-সেদিক কথা বলে ম্যানেজমেন্টকে ‘বুঝ’ দেওয়ার সুযোগ নেই আর। আগের ডেটা বিশেষ করে, একটা ফ্লপ অ্যাডভার্টাইজমেন্ট ক্যাম্পেইন, অর্থনৈতিক মন্দার ইফেক্ট, কোম্পানির জনবলের খারাপ পারফর্মেন্সের ভেতরের ডেটা আমাদের সাহায্য করছে কিভাবে সামনের ‘লাইন অফ ওয়ার্ক’ ঠিকমতো বুঝে ‘এডজাস্ট’ করে কোম্পানির প্রবৃদ্ধি বাড়ানো যায়।

আমাদের দেশে অনেকগুলো ডাটা ড্রিভেন সরকারি এবং বেসরকারি অ্যাপ্লিকেশন দেখছি, তবে এই মুহূর্তে বাংলাদেশের জনগণের জন্য ভ্যাক্সিনেশন অ্যাপ্লিকেশন, সুরক্ষা অ্যাপ - পুরোটাই ডাটা ড্রিভেন। কবে, কোথায়, কখন, পার্টিকুলার কোন ভ্যাকসিনেশন, কার মাধ্যমে, পরবর্তী ভ্যাকসিন এর জন্য কবে ডাকা হতে পারে, ইত্যাদি ইত্যাদি ডিটেইলিং থেকে শুরু করে, অনেক কিছুর পেছনে আছে এর ডাটা অ্যানালাইসিস। কখন ৪০ বছরের সীমা থাকবে উপরে এবং কখন সেটা নামাতে হবে - কাদেরকে কোন মুহুর্তে অগ্রাধিকার দিতে হবে, কাদেরকে কোন ভ্যাক্সিন দিতে হবে এবং এর সাথে ভ্যাক্সিনের সরবরাহকে কিভাবে মেলানো হবে - এর সবকিছুই যুক্ত হচ্ছে এর পেছনের ডেটা মডেলে। ধীরে ধীরে এর সঙ্গে যুক্ত হচ্ছে অন্যান্য সরকারি অ্যাপ্লিকেশন। যেমন - এ মুহুর্তে যুক্ত হয়েছেন প্রবাসী কল্যাণ ও বৈদেশিক কর্মসংস্থান মন্ত্রণালয়, এবং আস্তে আস্তে আরও অনেক সংস্থা যুক্ত হচ্ছেন এর সাথে। এর পেছনে চমৎকারভাবে কাজ করছে একটা ডাটা অ্যানালাইসিস টীম।

সামনে আমরা দেখবো, কিভাবে একটা ডেটাসেট থেকে কিছু নির্দিষ্ট ভেরিয়েবলগুলোকে আলাদা করলে কোম্পানির প্রবৃদ্ধি কি কি জিনিসে আটকে যাচ্ছে, সেটাকে ধরে সমস্যা ‘আইসোলেট’ করে ফেলব। এই কাজ করবো যাতে আমাদের ফলাফল ঋণাত্বক না হয়। আমরা এটাও দেখার চেষ্টা করব, কিভাবে ইন্ডাস্ট্রি এবং বিভিন্ন মার্কেটপ্লেসে এই ছোটখাটো ভেরিয়েবল আমাদের সিদ্ধান্তগুলোকে ঠিকমতো বাস্তবায়নে বাধা দিচ্ছে। কেন আমরা সনাতন "ইন্সটিন্কট"কে অগ্রাধিকার দিচ্ছি ডেটা থেকেও? ডেটা হচ্ছে ফ্যাক্ট, সত্যিকারের তথ্য।

(...)

ডেটা এবং ২১ শতকের দক্ষতা সিরিজ

সব বই

আগের সব প্রিন্ট বই পাবেন এখানে