কনটেন্টে যান

মর্তের মানুষের ডেটা অ্যানালাইটিক্স

পাল্টে গিয়েছে পৃথিবী

The world’s most valuable resource is no longer oil, but data.

-- The Economist, 2017

ডেটা ইজ দ্য নিউ অয়েল

কয়েক দশক আগে পৃথিবীর সব বিলিয়ন ডলার কোম্পানি ছিল এনার্জি/পাওয়ার কোম্পানিগুলো। ব্রিটিশ পেট্রোলিয়াম, জেনারেল ইলেকট্রিক, শেল, – কারণ, তখন তেল চালাতো বিশ্ব। এখন বিশ্ব চালায় ডেটা। যার কাছে বেশি ডেটা, সেই চালাচ্ছে পৃথিবী। ডেটা থেকে প্রজ্ঞা নিয়ে দুনিয়া দাপাচ্ছে গুগল, ফেসবুক, আমাজন, আলিবাবা, নেটফ্লিক্সের মতো ডেটা ড্রিভেন কোম্পানি। এই কোভিডের সময়েও। ডেটার কমতি নেই, যখন অন্য বিজনেসগুলো বিপদে পড়ছেন।

ফিরে আসি, বাংলাদেশে। অনেক কোম্পানি’র ম্যানেজমেন্ট কথা বলেন আমার সাথে। বিশেষ করে, ডেটা অ্যানালাইসিস নিয়ে। এর অর্থ হচ্ছে, তৈরি হচ্ছে আমাদের বাজারও। একটু সময় লাগছে, এই যা। সবাই ডেটা থেকে জ্ঞান নিতে চাইছেন।

ড্রাফট বই: $০.৫ ভার্সন

একটা ড্রাফট বই পড়ার গাইডলাইন

  • শুরুতে সব ধারণাগুলোকে জড়ো করি একটা জায়গায়, এটা সেই স্ক্র্যাচপ্যাড
  • বানান, ব্যাকরণের চিন্তা পরে
  • স্ট্রাকচার নিয়ে চিন্তা করবো পরে, স্টোরিলাইন উইল গ্রো ওভার টাইম
  • সব বইয়ের মতো এই বইটাও ক্রিয়েটিভ কমন্স লাইসেন্সে উন্মুক্ত করা
  • আপনাদের সদয় মতামত দিতে পারেন এখানে

এ যুগের স্কিলসেট, ডেটা ড্রিভেন সমাজের জন্য

পেশাগত কারণে প্রচুর প্রশিক্ষণের মুখোমুখি হতে হয়েছে আমাকে। প্রযুক্তিগত উৎকর্ষের একটা অংশে অনলাইন প্ল্যাটফর্মগুলো নিয়ে প্রচুর রিসার্চ করতে হয়েছে গত এক দশক ধরে। এবারের ঘটনা একদম মাথা খারাপ করার মতো।

সামনে বেশিরভাগ কাজ ডেটার। গুগল বলছে ডেটা নির্ভর চার বছরের ডিগ্রীর জায়গায় ৬-১২ মাসের নতুন সার্টিফিকেশন তৈরি করে দেবে নতুন জনবল - একুশ শতকের জন্য। গুগল ট্রেন্ড বলছে - মার্কেটে একটা বিশাল গ্যাপ তৈরি হয়েছে এই মহামারির কারণে। ডেটা বোঝা এবং ডেটা থেকে সিদ্ধান্ত নিতে পারা জনবল নিয়ে।

গত ২ মাস ধরে কোর্সগুলোকে ফুল স্কেলে অডিটিং করে যা বোঝা গেল, বিশাল ইনভেস্টমেন্ট করেছে গুগল এবং আইবিএম এর মতো কোম্পানিগুলো - এই গ্যাপ পূরণে। আমি তাদের কোর্সওয়ার্ক ম্যাটেরিয়াল দেখে সত্যিকারভাবে অভিভূত। এই কোর্সগুলো করতে বিশেষ কোন প্রাতিষ্ঠানিক পড়াশোনার প্রয়োজন নেই।

এর পাশাপাশি, ওই কোর্সওয়ার্কগুলো এবং আমার অভিজ্ঞতা মিলিয়ে নন-প্রোগ্রামারদের জন্য বাংলায় আমার ডেটা অ্যানালিস্ট মেন্টরশীপ প্রোগ্রাম তৈরি হচ্ছে জুলাই ২০২১ এর মধ্যে। একটা সত্যিকারের ডেটা-অ্যানালাইটিক্স কোর্স চালাতে সময় লাগবে ৬-৮ মাস, প্রতি সপ্তাহে ১৫-২০ ঘন্টা সময় দিলে। আমার অভিজ্ঞতা তাই বলে। নন-প্রোগ্রামারদের কথা ভেবে।

বিজনেস সমস্যা বোঝা, এবং সেটার সমাধান

১০ বছর আগেও যেই ঘটনা দেখেছি, সেদিক থেকে - বর্তমানে প্রতিষ্ঠানগুলোতে এত বেশি ডেটা আসছে এবং দ্রুত গতিতে, আমি নিজেও সেটা বিশ্বাস করতে পারছি না। এটা ঠিক যে, আগের ডেটাগুলো অনেক ছোট ছিল যেটাকে সহজে ম্যানেজ করা যেত তবে, এই বিগ ডেটার যুগে, - ধরা যাক একটা প্রোডাক্ট বিক্রি করার এতো চ্যানেল তৈরি হয়েছে যা মানুষের পক্ষে ট্র্যাক করা অসম্ভব হয়ে পড়েছে।

আমরা দেখছি যে, ডেটা শুধুমাত্র ভালো ভবিষ্যৎ প্রেডিকশন করছে না, বরং একটা ফ্লাইওভারের লেন কোন দিক দিয়ে নামালে সামনের ১০ বছরে - পুরো শহরের হাজার লক্ষ ঘন্টা বেঁচে যাবে সেটাও হিসেব করে দিতে পারছে এখনই। ফ্লাইওভার বানানোর আগে। আপনার কোম্পানির নতুন রিটেইল লোকেশন কোথায় হলে সবচেয়ে বেশি বিক্রি হবে, সেখানেও সাহায্য করছে ডেটা অ্যানালিটিকস।

আপনার একটা প্রোডাক্টের রিটার্নের হার আপনাকে বলে দেবে কোম্পানির ডিস্ট্রিবিউশন চ্যানেলে কোথায় সমস্যা হচ্ছে। এদিক-সেদিক কথা বলে ম্যানেজমেন্টকে ‘বুঝ’ দেওয়ার সুযোগ নেই আর। আগের ডেটা বিশেষ করে, একটা ফ্লপ অ্যাডভার্টাইজমেন্ট ক্যাম্পেইন, অর্থনৈতিক মন্দার ইফেক্ট, কোম্পানির জনবলের খারাপ পারফর্মেন্সের ভেতরের ডেটা আমাদের সাহায্য করছে কিভাবে সামনের ‘লাইন অফ ওয়ার্ক’ ঠিকমতো বুঝে ‘এডজাস্ট’ করে কোম্পানির প্রবৃদ্ধি বাড়ানো যায়।

আমাদের দেশে অনেকগুলো ডাটা ড্রিভেন সরকারি এবং বেসরকারি অ্যাপ্লিকেশন দেখছি, তবে এই মুহূর্তে বাংলাদেশের জনগণের জন্য ভ্যাক্সিনেশন অ্যাপ্লিকেশন, সুরক্ষা অ্যাপ - পুরোটাই ডাটা ড্রিভেন। কবে, কোথায়, কখন, পার্টিকুলার কোন ভ্যাকসিনেশন, কার মাধ্যমে, পরবর্তী ভ্যাকসিন এর জন্য কবে ডাকা হতে পারে, ইত্যাদি ইত্যাদি ডিটেইলিং থেকে শুরু করে, অনেক কিছুর পেছনে আছে এর ডাটা অ্যানালাইসিস। কখন ৪০ বছরের সীমা থাকবে উপরে এবং কখন সেটা নামাতে হবে - কাদেরকে কোন মুহুর্তে অগ্রাধিকার দিতে হবে, কাদেরকে কোন ভ্যাক্সিন দিতে হবে এবং এর সাথে ভ্যাক্সিনের সরবরাহকে কিভাবে মেলানো হবে - এর সবকিছুই যুক্ত হচ্ছে এর পেছনের ডেটা মডেলে। ধীরে ধীরে এর সঙ্গে যুক্ত হচ্ছে অন্যান্য সরকারি অ্যাপ্লিকেশন। যেমন - এ মুহুর্তে যুক্ত হয়েছেন প্রবাসী কল্যাণ ও বৈদেশিক কর্মসংস্থান মন্ত্রণালয়, এবং আস্তে আস্তে আরও অনেক সংস্থা যুক্ত হচ্ছেন এর সাথে। এর পেছনে চমৎকারভাবে কাজ করছে একটা ডাটা অ্যানালাইসিস টীম।

সামনে আমরা দেখবো, কিভাবে একটা ডেটাসেট থেকে কিছু নির্দিষ্ট ভেরিয়েবলগুলোকে আলাদা করলে কোম্পানির প্রবৃদ্ধি কি কি জিনিসে আটকে যাচ্ছে, সেটাকে ধরে সমস্যা ‘আইসোলেট’ করে ফেলব। এই কাজ করবো যাতে আমাদের ফলাফল ঋণাত্বক না হয়। আমরা এটাও দেখার চেষ্টা করব, কিভাবে ইন্ডাস্ট্রি এবং বিভিন্ন মার্কেটপ্লেসে এই ছোটখাটো ভেরিয়েবল আমাদের সিদ্ধান্তগুলোকে ঠিকমতো বাস্তবায়নে বাধা দিচ্ছে। কেন আমরা সনাতন "ইন্সটিন্কট"কে অগ্রাধিকার দিচ্ছি ডেটা থেকেও? ডেটা হচ্ছে ফ্যাক্ট, সত্যিকারের তথ্য।

(...)

একদম ঠিক প্রশ্নটা করতে পারা

ভালো প্রশ্ন

If I had an hour to solve a problem and my life depended on the solution, I would use the first 55 minutes determining the proper question to ask, for once I know the proper question, I could solve the problem in less than five minutes.

-- Albert Einstein (1879-1955)

ডেটা এবং ২১ শতকের দক্ষতা সিরিজ

সব বই

আগের সব প্রিন্ট বই