পেছনের ড্রাইভিং ফ্যাক্টরগুলো কী কী?
বিশ্বাস
A year spent in artificial intelligence is enough to make one believe in God.
– Alan Perlis
কৃত্রিম বুদ্ধিমত্তার পেছনে এত এক্সাইটমেন্ট, আকাশচুম্বী উচ্চাশা, বিলিয়ন ডলার ইনভেস্টমেন্ট, এগুলোর পেছনে কি কি ফ্যাক্টর কাজ করছে? এটা বলে নেয়া ভালো যে এই একই ধরনের ‘হাইপ’ তৈরি হয়েছিল ১৯৫০ এবং ১৯৭০-৯০ সালের দিকে। একটা ‘হাইপে’র পরে যখন ব্যাপারটা ঠিক মত কাজ করে না - অর্থাৎ এই খাতে ইনভেস্টমেন্টগুলো যখন তার সুফল পায় না; সেটাকে এই কৃত্রিম বুদ্ধিমত্তার আমলে বলা হয় ‘আর্টিফিশিয়াল ইন্টেলিজেন্স উইন্টার’, অর্থাৎ প্রচুর ‘হাইপ’ তৈরি হয়েছিল তবে সেটা ঠিকমতো কাজ করেনি। এবারের ব্যাপারটা ভিন্ন। কেন?
প্রথমত: প্রচুর ডেটা
আমাদের হাতে এখন এতো ডেটা সেটা একযুগ আগেও চিন্তা করতে পারিনি আমরা। আমাদের প্রতিটা ডিভাইস প্রতি সেকেন্ডে এত লগ জেনারেট করছে, এখন এগুলোই এখন আমাদের জন্য ট্রেনিং ডেটা। আজকে নতুন প্রযুক্তির ‘গুগল ট্রেন্ডিং’ জানার জন্য আইটেম হিসেবে ‘কৃত্রিম বুদ্ধিমত্তা’ এবং ‘মেশিন লার্নিং’ থাকলেও গত ১০ বছরে জয়জয়কার আইটেম ছিল “বিগ ডেটা”। এর অর্থ হচ্ছে আমরা গত দশক ধরে প্রচুর ডেটা জমিয়েছি ভবিষ্যতের জন্য। কিছুটা বুঝে অথবা না বুঝে হোক, এই বিগডেটা কাজে লাগছে এখন। এর পাশাপাশি এই মুহুর্তে আরো প্রচুর ডেটা যোগ হচ্ছে প্রতিনিয়ত। এখন তো ক্লাউডের জয়জয়কার।
কৃত্রিম বুদ্ধিমত্তা নিয়ে কাজ করতে গিয়ে দেখলাম যখন আমাদের হাতে প্রচুর ডেটা আসে তখন সেটাকে কিছুটা ‘সেল্ফ লেবেলড’ ডেটা বলে মেশিন লার্নিং মডেলকে ট্রেইন করতে পারি। ব্যাপারটা এমন যে এতো এতো ডেটা, মেশিন লার্নিং মডেল বিভিন্ন ধরনের ডেটাকে ক্লাস্টারিং করে - কোন ডেটা কিসের জন্য প্রযোজ্য সেটাও বলে দিতে পারছি এখন। মেশিন লার্নিং মডেল আগেও ১৯৫০-৬০ সালের দিকে ছিল তবে সেগুলো ঠিকমতো কাজ করতে পারেনি ডেটার অভাবে।
এখন একটা সাধারন অ্যালগরিদম অসাধারণ পারফরম্যান্স দেখাতে পারছে শুধুমাত্র প্রচুর ডেটার কারণে। আমার নিজের অভিজ্ঞতায় মানে নিজের চোখে দেখছি ভালো প্রসেসর অথবা এর সাথে অ্যাসোসিয়েটেড অ্যালগরিদম যতটা পারফরম্যান্স দেখাতে পারছে তার থেকে অনেক বেশি অবিশ্বাস্য আউটকাম দেখাচ্ছে যখন যোগ করছি প্রচুর ডেটা।
ডেটা স্টোরেজের সহজলভ্যতা
ডেটার পাশাপাশি প্রচুর ডেটা স্টোর করার ডিভাইসগুলোর দাম কমেছে লাফিয়ে লাফিয়ে। পানির দামে সবাই কিনতে পারছে স্টোরেজ, তৈরি হচ্ছে বিশাল বিশাল ষ্টোরেজ এরিয়া নেটওয়ার্ক। আমার বাসায় কয়েকটা ‘নেটওয়ার্ক অ্যাটাচড স্টোরেজ’ বলে দেয় এর সহজলভ্যতা। মানে বাসায় আমরা তৈরি করতে পারছি নিজস্ব ক্লাউড। RAM এর সহজলভ্যতাও আরেকটা দিক। পোর্টেবল স্টোরেজের দাম এবং এর ক্যাপাসিটি যেভাবে আনুপাতিকভাবে কমছে এবং বাড়ছে, সেটা কিন্তু প্রমাণ করে এই ট্রেন্ডকে। এর পাশাপাশি ক্লাউড স্টোরেজের সহজলভ্যতা মানুষকে তার সব ডেটা ‘লোকাল’ না রেখে ক্লাউডে রাখার সিদ্ধান্ত প্রমাণ করে স্টোরেজের প্রসার।
প্রসেসিং স্পিড এবং ডেটাকে প্রসেস করার জন্য ‘স্পেশালাইজড’ প্রসেসর
গত কয়েক দশকে ‘মুরস ল’ ভেঙ্গে সনাতন আর্কিটেকচার এতটাই পাল্টে গেছে সেখানে প্রসেসিং স্পীড এখন পৌঁছে গেছে অন্য লেভেলে। প্রসেসিং স্পীড বাড়ার পাশাপাশি বিভিন্ন কোর মানে একটা প্রসেসর এর মধ্যে অনেকগুলো আলাদা আলাদা কোরকে নিয়ে গেছে নতুন উচ্চতায়। আগে মেইনফ্রেম কম্পিউটার যেভাবে কাজ করতো তার থেকে ভালো কাজ করতে পারছে অনেকগুলো সস্তা পার্সোনাল কম্পিউটার মিলে একেকটা ক্লাস্টার।
তবে আসল এডভান্সমেন্ট এসেছে বিশেষ করে ‘ডিপ লার্নিং’ এর ক্ষেত্রে যেখানে আমরা হাইজ্যাক করেছি গেমিং ইন্ডাস্ট্রি। ডিপ লার্নিং এর জন্য যে ধরনের অংক দরকার বিশেষ করে ‘ম্যাট্রিক্স মাল্টিপ্লিকেশন’ এ গ্রাফিক্যাল প্রসেসর এর পারফর্মেন্স আমাদের মাথা খারাপ করে দিয়েছে। ভিডিও গেমসের জন্য শুরুতে এই গ্রাফিক্যাল প্রসেসর বা ‘জিপিইউ’ যেভাবে ব্যবহার হতো সেখানে এই প্রসেসরগুলো ডিপ লার্নিং এর ম্যাট্রিক্স মাল্টিপ্লিকেশনে অসাধারণ সাফল্য দেখিয়েছে।
কীভাবে সম্ভব?
Interest in AI boomed again in the 21st century as advances in fields such as deep learning, underpinned by faster computers and more data, convinced investors and researchers that it was practical—and profitable—to put AI to work.
-- Driving impact at scale from automation and AI, McKinsey & Company
অ্যালগরিদম এর কিছু বাড়তি ফিচার
আমরা মেশিন লার্নিং শিখতে প্রথমে যে জিনিসটা নিয়ে উচ্ছ্বাস প্রকাশ করি সেটা হচ্ছে ‘অ্যালগরিদম’। সত্যি বলতে আমরা কৃত্রিম বুদ্ধিমত্তার জন্য যে অ্যালগরিদমগুলো ব্যবহার করি তার খুব একটা পরিবর্তন আসেনি গত কয়েক দশকে। পৃথিবীতে বেসিক মানে আসল মেশিন লার্নিং /ডিপ লার্নিং অ্যালগরিদম এখনো হাতে গোনা যায়। তবে এর মধ্যে আমরা সেগুলোর সাথে বেশ কিছু চমৎকার ফিচার যোগ করেছি যা সেই অ্যালগরিদমগুলোকে আলাদা মাইলেজ দিয়েছে। সেটার উদাহরণ হিসেবে ‘ব্যাকপ্রপাগেশন’ নিয়ে আলাপ করলে বোঝা যায় এই ব্যাপারটা কতটুকু এগিয়ে দিয়েছে আমাদের ডিপ লার্নিং এর শেখাতে। ‘এরর কারেকশনে’র জন্য এই ফিডব্যাক মেকানিজম কৃত্রিম বুদ্ধিমত্তাকে এগিয়ে দিয়েছে অনেকখানি।
ফাইনালি আরেকটা বড় ব্যাপার কাজ করেছে, যেটাকে আমরা বলছি ‘ক্লাউড কমপিউটিং প্লাটফর্ম’।
ক্লাউড কমপিউটিং প্লাটফর্ম
আজকে ক্লাউড কমপিউটিং প্ল্যাটফর্ম এর ব্যবহার এতই বেড়েছে যে যেকোন মুহুর্তে যে কোন ব্যবহারকারী তার পছন্দমতো প্লাটফর্ম (লিনাক্স, উইন্ডোজ, ইউনিক্স) ব্যবহার করে কয়েক মিনিটের মধ্যে একটা ক্লাউড কমপিউটিং এনভারমেন্ট তৈরি করতে পারে নিজের জন্য। একেবারে সব লাইব্রেরি ইনস্টলেশন সহ। এই সুবিধা ছিল না গত ১০ বছর আগেও। ফলে প্রচুর ডাটা এবং স্টোরেজের পাশাপাশি এ ধরনের ক্লাউড কম্পিউটিং প্লাটফর্ম এতো সুবিধা দিয়েছে - ফলে একজন রিসার্চার তার বাসায় বসে শুধুমাত্র একটা ইন্টারনেট সংযোগ নিয়ে মুহূর্তের মধ্যে তৈরি করতে পারছেন নিজস্ব এনভায়রনমেন্ট। এই একই কাজের জন্য তাকে আগে যেতে হতো বিশাল ল্যাবে।
ক্লাউড কমপ্লিটিং প্লাটফর্ম বলতে অ্যামাজন, মাইক্রোসফট এবং আলিবাবা যেভাবে খুব সহজেই নিজস্ব ক্লাউড কমপিউটিং প্লাটফর্ম তৈরি করতে দিচ্ছে সবাইকে, সেখানে কৃত্রিম বুদ্ধিমত্তার ব্যবহার বেড়েছে হাজার গুণ। এতো সহজে ক্লাউডে মেশিন কনফিগার না করা গেলে কৃত্রিম বুদ্ধিমত্তার প্রসার হতো না। আগে জিপিইউ সহ মেশিন তৈরি করবো - না মেশিন লার্নিং মডেলের পেছনে সময় দেবো? একেকটা এনভায়রনমেন্ট তৈরি করতে এতো সময় নিলে কৃত্রিম বুদ্ধিমত্তার পেছনে সময় দেবো কখন? সময় একটা বড় ফ্যাক্টর যেকোন কাজে।
এর পাশাপাশি ক্লাউড কমপিউটিং প্লাটফর্মগুলোর সাথে হোস্টিং সাইটগুলোর সুপার ফাস্ট কানেক্টিভিটি থাকাতে আগে যেই ডাটাসেটগুলো নিজস্ব মেশিনে নামাতেই সময় লাগতো ঘন্টার পর ঘন্টা, সেখানে গিটহাব থেকে আমার ক্লাউড কম্পিউটিং মেশিনে ডাউনলোড করতে লাগে কয়েক সেকেন্ডের কম সময়। ডাটাসেট হোস্টিং এবং ক্লাউড কম্পিউটিং প্ল্যাটফর্ম এই দুটোই ‘সুপার ফাস্ট নেটওয়ার্ক দিয়ে কানেক্টেড থাকায়, আমাদের ‘সুপার স্লো’ ইন্টারনেট এবং পিসিতে বসে এখন কাজ হচ্ছে শুধু মাত্র কয়েক কিলোবাইটের কমান্ড পাঠিয়ে দেওয়া। ‘হোয়াট আ টাইম টু বি এলাইভ!’
আমার নিজের ল্যাপটপে যেই মেশিন লার্নিং মডেলকে ‘ট্রেইন’ করতে সময় নিতাম ৬ থেকে ৭ ঘন্টা, এর সঙ্গে ডাটাসেট ডাউনলোড করতে কয়েকদিন, সেই একই মডেল গিটহাব থেকে মিনিটে নামিয়ে মেশিন লার্নিং মডেল বানাতে লাগে ৩০ সেকেন্ডের কম। সবচেয়ে বড় কথা হচ্ছে - এখানে খরচ অপেক্ষাকৃতভাবে অনেক কম। আর তাই, মানুষ ক্লাউড কম্পিউটিং প্লাটফর্ম ব্যবহার করবে না কেন? আর কেনোই বা কৃত্রিম বুদ্ধিমত্তার ব্যবহার বাড়বে না?