‘বেসিক মেশিন লার্নিং’ ট্রেনিং প্রোগ্রাম
Recipes tell you nothing. Learning techniques is the key.
— Tom Colicchio
অনার কোড (ডানপাশে টেনে দেখুন)
১. মেশিন লার্নিং এ কোন *দ্যা সল্যুশন* নেই। সবাই ঠিক।
২. আমরা চেষ্টা করবো শিখতে, এই শেখাতে ভুল বলে কিছু নেই।
৩. সবারই *ইনপুট* মূল্যবান, ইনপুট দেবেন প্রতি স্টেজে।
৪. আমাদের চেষ্টা থাকবে মডেলের *অ্যাক্যুরেসি* বাড়াতে।
কেন শিখবেন কৃত্রিম বুদ্ধিমত্তা?
১. যে একটা প্রযুক্তি অনেকটাই আমাদের অজান্তে সবাইকে ঘিরে ফেলছে সেটা হচ্ছে ‘কৃত্রিম বুদ্ধিমত্তা’। এক কথায় বললে বলা যেতে পারে ‘প্রযুক্তি’কে শেখানো হচ্ছে একদম মানুষের মতো করে সিদ্ধান্ত নিতে। মানুষের দরকারে। যেমন, হেলথকেয়ার সিস্টেমে রোগীদের ঠিকমতো স্বাস্থ্যসেবা দেবার জন্য, মানুষের ভুল কমানোর জন্য। পাশাপাশি কোন স্পেসিফিক ট্রিটমেন্টটা তাদের কাজে লাগছে - সেই ঔষুধ রোগীর উপর ব্যবহার না করে সিমুলেশনে ‘ড্রাগ ডিসকাভারি’তে ব্যবহার হচ্ছে এই কৃত্রিম বুদ্ধিমত্তা। আজকে ‘কোভিড-১৯’ এর ড্রাগ ডিসকাভারির পেছনে এই প্রযুক্তির সাপোর্ট অজানা নয়। সেটা না হলে এর সময় লাগতো আরো অনেক বেশি। মহামারী নিয়ন্ত্রণে অনেক দেশই ব্যবহার করছে এই প্রযুক্তি।
২. উন্নত দেশের সরকারগুলো কৃত্রিম বুদ্ধিমত্তাকে ব্যবহার করে আরবান প্ল্যানিং, মাস ট্রানজিট সিস্টেম, নদীর গতিপথ পরিবর্তন, বন্যার আর্লি ডিটেকশন, সরকারি রিসোর্সের সঠিক ডিস্ট্রিবিউশন এবং ব্যবহার, সামনের বছরগুলোতে পেনশনারদের কতো টাকা দিতে হতে পারে (উদাহরণস্বরূপ), ক্রাইম প্রেডিকশন, শহর জুড়ে ট্রাফিক ম্যানেজমেন্ট - এরকম হাজারো জিনিসে ব্যবহার হচ্ছে কৃত্রিম বুদ্ধিমত্তা। ওয়ার গেমিং এ এর ব্যবহারের পাশাপাশি সামরিক বাহিনীতে এই প্রযুক্তির ব্যবহারের একটা ধারণা এসেছে মার্কিন যুক্তরাস্ট্রে, ২০১৪ সালে ‘তৃতীয় অফসেট স্ট্রাটেজি’ হিসেবে। ২০১৮ সালে পেন্টাগন ২ বিলিয়ন ডলার খরচ করার একটা প্ল্যান দিয়েছে কৃত্রিম বুদ্ধিমত্তার ব্যবহার নিয়ে।
৩. ব্যাপারটা এমন - আমরা হয়তোবা ধরতে পারছিনা কিভাবে ঘটছে - তবে আমাদের আশেপাশের সবকিছুই পাল্টে যাচ্ছে এই ‘কৃত্রিম বুদ্ধিমত্তা’য়ের প্রভাবে। আমরা চাই বা না চাই - জিনিসটা ঢুকে গেছে সবকিছুর ভেতরে। সন্তর্পণে। যেভাবে আমরা দেখেছি - হেলথকেয়ার থেকে শুরু করে সরকারি কাজ, ট্রান্সপোর্টেশন ইন্ডাস্ট্রি - শিক্ষা - যারা যা করতে চাইছেন তার সবকিছু সহজ করে দিচ্ছে এই জিনিস। এটা ঠিক যে, অনেক বড় একটা ক্ষমতা আসছে মানুষের হাতে - সেটা বুঝতে পারছে খুব কম মানুষই। কৃত্তিম বুদ্ধিমত্তার শুরুতে যেখানে মেশিনকে শেখাতে হয় - সেখানেই দরকার মেশিন লার্নিং। অন্য কথায় বললে - কৃত্তিম বুদ্ধিমত্তার যে অংশে যন্ত্রকে বুদ্ধিমত্তা দেবার প্রসেসই মেশিন লার্নিং।
৪. পৃথিবীতে ‘এআই’ ফর সোশ্যাল গুড নিয়ে একটা বিশাল মুভমেন্ট চলছে ডেটাকে মানুষের কাজে ব্যবহারে। আমাদের হাতে প্রচুর ডেটা আছে, তবে সেই ডেটা থেকে প্রজ্ঞা নিতে পারছি না এমুহুর্তে। ডেটা থেকে প্রজ্ঞা নেবার প্রসেসগুলো দেখানো হবে এই প্রশিক্ষণে। ‘মেশিন লার্নিং’ ব্যাপারটা জেনে রাখা ভালো কারণ এর ব্যবহার চলে আসছে প্রতিটা সেক্টরে। কৃত্রিম বুদ্ধিমত্তা একটা বর্তমান এবং ভবিষ্যত স্কিলসেট।
কিভাবে শিখবো? একটা সত্যিকারের সমস্যা সমাধান
মেশিন লার্নিং এর পেছনের দর্শন জানলে শেখা খুব সহজ হয়। আপনি তখন জানবেন কোন অবস্থান থেকে কোথায় যেতে হবে। এবং এখন কোথায় আছেন। যেহেতু আমার মেশিন লার্নিং বন্ধুরা আছেন পৃথিবী জুড়ে, তারা বলেন একটা কথা। যদি শিখতে চাও - মেশিন লার্নিং, তাহলে শুরু করো ‘প্রজেক্ট টাইটানিক’ দিয়ে। দিস ইস দ্য গেটওয়ে টু মেশিন লার্নিং। পিরিয়ড। আপনি যদি সমস্যাটা ঠিকমতো বুঝতে পারেন তাহলে সমাধান হাতের কাছেই।
লার্নিং আউটকাম: টাইটানিক চ্যালেঞ্জ
সাল ১৯১২। সত্যি ঘটনা। ধন্যবাদ দিতে হয় জেমস ক্যামেরনকে। উনি আমাকে বাঁচিয়েছেন নতুন করে গল্পটা ফাঁদতে। এই ‘আন-সিঙ্কেবল’ মানে ‘ডুববার নয়’ আরএমএস টাইটানিক’ ডুবে যায় আটলান্টিক পাড়ি দেবার সময়। একদম প্রথম যাত্রায়। আইসবার্গে ধাক্কা লেগে। তখন রাত ১১:৪০। ধারণা করতে পারি - ২২২৪ জন যাত্রী আর ক্রু’র মধ্যে প্রায় সবাই ঘুমাতে গিয়েছিলেন নিজ নিজ কেবিন অথবা বাঙ্কারে। পরের ঘটনা সবার জানা।
১৫০২ জন মারা যান ওই যাত্রায়।
এই সত্যি ঘটনাকে ঘিরে তৈরি করা হয়েছে এই কালজয়ী সমস্যা। এখানে আমাদেরকে দেয়া হয়েছে দুটো ডেটাসেট। একটাতে দেয়া হয়েছে ৮৯১জন মানুষের সম্পর্কে ১২টা ফিল্ড। সেখানে একটা ফিল্ড আছে যার মধ্যে বলা আছে উনি বেঁচে গিয়েছিলেন না মারা গিয়েছিলেন ওই যাত্রায়। খেয়াল করুন ব্যাপারটা। সত্যিকারের ডেটাসেট। ইন্টারনেটে আছে সবার নাম। দেয়া আছে তাদের ভাগ্য। বানানোর কিছু নেই এখানে।
এখন আসুন সমস্যাতে। আরেকটা ডেটাসেট দেয়া হয়েছে যার মধ্যে মানুষগুলোও নতুন। ওই ৮৯১ জনের বাইরের মানুষ উনারা। উনাদের ভাগ্য বের করবো আমরা। ৪১৮ জন প্যাসেন্জারের। সারিও ৪১৮টা। ওখানে সব ফিল্ড আছে ওই একটা ফিল্ড ছাড়া। যেটাতে বলা আছে উনি বেচেঁ অথবা মারা গিয়েছিলেন। আমরা জানি না তাদের ভাগ্যে কি ঘটেছিল।
সমস্যা: প্রেডিক্ট করতে হবে কারা বেঁচে গিয়েছিলেন?
তো, টাইটানিক চ্যালেঞ্জটা কী?
ওই ৪১৮জন মানুষের ডাটাসেট থেকে প্রেডিক্ট করে বের করতে হবে কারা বেঁচে অথবা মারা গিয়েছিলেন। আমি যখন প্রথম প্রথম এটা নিয়ে কাজ শুরু করি - তখন অবাকই হয়েছিলাম। এটা কিভাবে সম্ভব? আমি কিভাবে জানবো? মানুষের মৃত্যু প্রেডিক্ট করা আমাদের কম্ম নয়। আর মেশিন লার্নিংই বা কিভাবে পারবে?
এক নজরে (ট্রেনিং প্রোগ্রাম), টেবিলের ভেতরে লিংক
ইন্সট্রাকটর লেড ক্লাস ২ ঘন্টা, প্রজেক্ট নিয়ে কাজ ১ ঘন্টা = ৩ ঘন্টা ১ দিনে।
১ম সপ্তাহ (মেশিন লার্নিং, প্রজেক্ট টাইটানিক)
২য় সপ্তাহ (“আর” প্রোগ্রামিং এনভায়রনমেন্ট)
৩য় সপ্তাহ (প্রেডিকশন, ডাটা ভিজ্যুয়ালাইজেশন)
৪র্থ সপ্তাহ (ডিসিশন ট্রি, ফিচার ইঞ্জিনিয়ারিং)
অনলাইন এক্সেস, গিটহাব এবং আর-ষ্টুডিও ক্লাউড
১. গিটহাব এর একটি অ্যাকাউন্ট প্রয়োজন।
২. আর-ষ্টুডিও ক্লাউড এর একটি অ্যাকাউন্ট খুলে ফেলুন ক্লাসের আগেই।
সহায়ক বই/ডকুমেন্টেশন (অনলাইন)
হাতেকলমে মেশিন লার্নিং (প্রথম অথবা দ্বিতীয় সংস্করণ) বইয়ের সব লিংক
মোবাইল ফ্রেন্ডলি লিংক (বই)
১. অনলাইন লিংক, সম্পুর্ন বই অনলাইনে
৫. ইবুক, আমাজন
সহায়ক বই/ডকুমেন্টেশন এর টেবিল অফ কনটেন্ট
সহায়ক ভিডিও (যদি ক্লাস বাদ পড়ে)
ইউটিউব প্লেলিস্ট: মেশিন লার্নিং (দ্বিতীয় সংস্করণ) বইয়ের ভিডিও সিরিজ
ট্রেনিং নিয়ে প্রতিদিনের ইনপুট দেয়া যাবে ০১৭১৩০৯৫৭৬৭ নম্বরে। ধন্যবাদ।