কনটেন্টে যান

কেন 'প্রজেক্ট টাইটানিক' দিয়ে ডেটা অ্যানালাইটিক্স?

কেন “প্রজেক্ট টাইটানিক” একটা বিজনেস "প্রক্সি" ডেটা?

....

কেন আমাদের প্রশ্ন করতে জানতে হবে?

যেকোন ‘বিজনেস কোশ্চেন’ এর উত্তর বের করতে। (আচ্ছা, ‘বিজনেস কোশ্চেন’ এর সুন্দর বাংলা কী হতে পারে?)

অবাক হচ্ছেন ? আমরা নিজেদের জন্য, সরকার অথবা কোন কোম্পানির হয়ে যখন কাজ করি, তখন আমাদেরকে প্রতিনিয়তঃ বিভিন্ন ‘বিজনেস কোশ্চেন’ অর্থাৎ বিভিন্ন সমস্যার উত্তর খুঁজে বের করতে হয়। কী বিষয় নিয়ে পড়াশোনা করলে জীবন অর্থবহ হবে, কোন ক্যারিয়ার আমার জন্য ভালো হবে, কাকে ধরলে একটা বিজনেসের লাইন পাওয়া যাবে - সারা জীবন ধরে এ ধরনের ‘বিজনেস কোশ্চেন’ এর উত্তর খুঁজে বেড়াই, নিজের অভিজ্ঞতার কাছে। তবে সেই উত্তর সঠিক হবার সম্ভাবনা থাকে যখন তার উত্তর আসে সরাসরি ডেটা থেকে।

এই কোভিডের সময় সরকারগুলোর একটা বড় ‘বিজনেস কোশ্চেন’ ছিল প্রকৃত দুস্থদের খুঁজে বের করা, যাতে তাদের “স্টিমুলাস” প্যাকেজগুলোর সঠিক ব্যবহার করা যায়। কাদের আসলেই সহায়তা দরকার সেটা বের করতে দরকার ডেটা। আমাদের দেশেও এই কাজটা হয়েছে ধাপে ধাপে - সামাজিক নিরাপত্তা বেষ্টনীর সুবিধা বন্টন ব্যবস্থাপনায় বিভিন্ন ভাতা বন্টন করতে গিয়ে। এতো এক্সারসাইজ, তার ফাইনাল আউটকাম একটাই, প্রকৃত দুস্থদের খুঁজে বের করা, যাতে রাষ্ট্রীয় কোষাগারের টাকার উপযুক্ত ব্যবহার হয়।

একটু পেছনে ফিরে যাই। পৃথিবীতে প্রযুক্তির উৎকর্ষ নিয়ে যে ইন্ডাস্ট্রিতে সবচেয়ে বেশি কাজ হয়েছে, সেটা হচ্ছে ‘অ্যাড’ ইন্ডাস্ট্রি। অর্থাৎ সেই প্রকৃত ব্যক্তিকে খুঁজে বের করা, যিনি আপনার/আমার প্রোডাক্টটা কিনবেন। মনে আছে সেই এসএমএসগুলোর কথা? আমি পুরুষ/মহিলা, সেটার বাছবিচার না করে ডায়মন্ড-ওয়ার্ল্ড, অথবা হাজারো মহিলা প্রোডাক্ট এর এসএমএস দিয়ে ভর্তি হয়ে যেত মোবাইল। এখন সেখানে, এই অ্যাডগুলো এতটাই টার্গেটেড, সেখানে ডেটা বলতে পারে কারা কারা একটা ‘স্পেসিফিক’ প্রোডাক্ট কিনবেন।

আপনি যদি একটা অ্যাড ক্যাম্পেইন চালান, সেখানে ১০০ জন মানুষকে টার্গেট করলে, যদি ৯০ জনকে বিক্রি করতে পারেন, তাহলে আপনার ‘অ্যানালাইসিস’ সার্থক। ই-কমার্স কোম্পানিগুলো বহু আগে থেকে আপনি ভবিষ্যতে তাদের কাছ থেকে কি কি কিনতে পারেন সেই প্রোডাক্টগুলোকে মজুদ করছে আপনার বাসার কাছের ওয়্যারহাউসে। যেদিন কেনার জন্য ক্লিক করবেন, তার আগের রাতেই ডেলিভারি গাড়ির প্যালেটে উঠে গেছে সেই প্রোডাক্ট! বিশ্বাস হচ্ছে না, আমার কথা? গুগল করে দেখতে পারেন, “অ্যান্টিসিপেটরি শিপিং”, যার পেটেন্ট পেয়েছে অ্যামাজন ২০১২ সালে।

আগে ডিজিটাল স্পেসে আগে এ ধরনের অ্যাড ক্যাম্পেইন হত প্রতি ‘ক্লিক’ অথবা ইম্প্রেশন এর উপর ভিত্তি করে। এখন ব্যাপারটা এমন হয়ে যাচ্ছে যে, আমার একটা নির্দিস্ট টাকার প্রোডাক্ট বিক্রি করে দেবেন, সেটার জন্য কিছু স্পেসিফিক কিওয়ার্ড ‘ডেটা এনালাইসিস’ থেকে আসবে। অর্থাৎ এর ভেতরে একটা ‘বিডিং’ বা ‘অকশন’ হবে যাতে প্ল্যাটফর্ম প্রোভাইডারের সাথে সামান্য কিছু ‘রেভেনিউ শেয়ারিং মডেলে’ আপনি সেই স্পেসিফিক ক্রেতার কাছে পৌছাতে পারেন।

ধরুন, যারা অ্যাড ক্যাম্পেইন অর্থাৎ প্ল্যাটফর্ম চালাচ্ছেন, তারা বলতে পারেন এক লক্ষ টাকার ৪% উনাদেরকে দিলে উনারা ওই ১ লক্ষ টাকার প্রোডাক্ট সেল করে দিতে পারবেন। এখন উনাদেরকে ডাটা অ্যানালাইসিস করে খুঁজে বের করতে হবে সেই ক্রেতাদের, যারা নিশ্চিতভাবে প্রোডাক্টটা কিনবেন। সেটাই আমাদের বিজনেস কোশ্চেনের উত্তর। এর পেছনে কাজ করবে ডেটা অ্যানালিটিক্স, মেশিন লার্নিং ইত্যাদি। শুরুতে এটা একটা ‘কমপ্লেক্স মেট্রিক’ মনে হলেও এর ভেতরের গল্প আরো মজাদার, সামনে কথা বলা যাবে এগুলো নিয়ে।

এই ব্যাপারগুলো ‘অ্যাড ক্যাম্পেইন’ দিয়ে শুরু হলেও এই প্রযুক্তি ছড়িয়ে পড়েছে সব জায়গায়। একটা ব্যাংক লোন অ্যাপপ্রুভ করার আগে জানতে চাইতে পারেন সেই লোনটা ‘রিকভার’ করা যাবে কিনা? যিনি লোন দেবেন, তিনি চাইবেন সেই লোনটাকে ‘রিকভার’ করে আরেকজনকে দেবার জন্য, এতে তার পোর্টফোলিও বাড়বে। ইনভেস্টরদের কাছে ব্যাংকের পারফরম্যান্স ভালোভাবে দেখানো যাবে।

প্রতিটা বড় বড় ছুটি, যেমন - দুই ঈদে যেখানে একটা বিশাল জনসংখ্যা অনেকটাই ‘অরক্ষিত’ অবস্থায় রাস্তায় থাকেন তাদের বাড়িতে পৌঁছানোর জন্য। এই রাস্তায় থাকা সময়টুকুতে দুর্ঘটনা এবং বিভিন্ন অনাকাঙ্ক্ষিত ঘটনা থেকে বাঁচার জন্য ডাটা অ্যানালাইটিকসের সাহায্য নেয়া যেতে পারে আগেভাগেই। কোথায় কোথায় দুর্ঘটনা এবং অপ্রীতিকর ঘটনাগুলো ঘটে, কি কারণে ঘটে, কি করলে সেই দুর্ঘটনাগুলোকে এড়ানো সম্ভব, সেগুলোর ‘অসাধারণ’ প্রেডিকশন নিয়ে আসা যায় আগের ডাটা অ্যানালাইসিস থেকে। কোন রাস্তায় দুর্ঘটনা হওয়ার সম্ভাবনা বেশি, কোথায় কোথায় ১ মাইলের বেশি লম্বা জ্যাম হতে পারে, কোন রুটে লঞ্চের চাপ বেশি হতে পারে, কিভাবে টিকিট বিক্রি শুরু করলে এই চাপ এড়ানো সম্ভব, সবকিছুর পেছনে রয়েছে সেই ব্যাপারগুলোকে (‘বিজনেস কোশ্চেন’) ঠিকমতো সনাক্ত করতে পারা।

আর ঠিক এই কারণে, পুরো ডেটা সাইন্স পৃথিবী খুঁজে বের করেছে ১০০ কিলোবাইটের ‘অসাধারণ’ প্রজ্ঞা সহ একটা ডেটাসেট, টাইটানিকের সত্যিকারের ঘটনা নিয়ে। এটার ‘বিজনেস কোশ্চেন’ একটাই, যা মিলে যায় পৃথিবীর অন্যান্য ‘বিজনেস কোশ্চেন’ এর সাথে। এখানে আমরা সনাক্ত করছি টাইটানিক জাহাজডুবি থেকে কে কে বেঁচে যেতে পারেন? (উত্তর না দেখেই)। কোন কোন পারিপার্শ্বিক জিনিসগুলো (বয়স, লিঙ্গ, নাম, কোথা থেকে উঠেছেন, কোন ক্লাসের যাত্রী, টিকেট নম্বর, ইত্যাদি ইত্যাদি ফিচার থেকে) তার বেঁচে যাওয়াকে প্রভাবিত করছে?

সরকার জানতে চাইতে পারেন কোন ব্যক্তি/প্রতিষ্ঠানগুলো আগেভাগে ট্যাক্স রিটার্ন জমা দেন, সেই ব্যক্তিগুলোকে ঠিকমতো সনাক্ত করে প্রনোদনা দিলে সরকারের আয়কর ভালোভাবে আদায় করা সম্ভব। এর পাশাপাশি, কোন ব্যক্তি অথবা প্রতিষ্ঠান এই আয়কর নিয়ে সবসময় সমস্যা করেন তাদেরকে আগেভাগে শনাক্ত করে সম্ভাব্য জালিয়াতি থেকে আসা যায়। ডেটা অ্যানালিটিক্স দিয়ে এই ধরনের ট্রেন্ড বোঝা সহজ হয়ে গেছে ইদানিং।

পুলিশ জানতে চাইতেই পারেন, কোন এলাকাগুলোতে সন্ত্রাসী কর্মকান্ড, অর্থাৎ খুন, রাহাজানি, চাঁদাবাজি, বেআইনি কার্যকলাপ বাড়ছে, যাতে আগে থেকেই সেই এলাকাগুলোতে টহল জোরদার করে পরিস্থিতি নিয়ন্ত্রণে আনা যায় ঘটনা ঘটার আগেই। এর পেছনে কাজ করবে আগের ক্রাইম প্রেডিকশন ডেটা, ডেটা অ্যানালিটিক্স এবং ডেটা থেকে প্যাটার্ন বের করার ধারণা। আরো জানতে পড়ুন, আমার সর্বশেষ বই কৃত্রিম বুদ্ধিমত্তায় মানবিক রাষ্ট্র।

কী বুঝলাম? এই একই কাজটা আমরা করতে পারছি আমাদের টাইটানিক ডেটাসেট থেকে। এই ডেটাসেটের মাত্র ১২টা ফিল্ড থেকে আমাদেরকে বের করতে হবে এই টাইটানিক জাহাজডুবিতে শেষে কারা বেঁচে গিয়েছিলেন। এটাও একটা ‘প্রক্সি’ ধারণা, যার মাধ্যমে এর আগে আলাপ করা অ্যাড ক্যাম্পেইন, রাজস্ব আদায়, ব্যাংকের লোন রিকভারি, ইলেকশন ক্যাম্পেইন, কার্যকরী ভ্যাকসিন তৈরি, হাসপাতালে ভর্তির সম্ভাবনা ইত্যাদি বের করা সম্ভব। সেকারণে এই মেন্টরশীপ। এই ডেটা অ্যানালাইটিক্স দিয়ে কিভাবে নিজের দেশকে আরো ভালবাসা যায় সেটা পাবেন কৃত্রিম বুদ্ধিমত্তায় মানবিক রাষ্ট্র বইটাতে। কিনতে হবে না, পুরোটাই আছে অনলাইনে।