ডাটা কিভাবে কথা বলে?
তথ্য নিয়ে প্রশাসন চালানো
What is new about the use of data technologies in government? After all, to govern has always meant to gather and process data, with the technology available at the time.
-- Predictive Analytics and AI in Governance: Data-driven government
ডাটা কিভাবে কথা বলে? ডাটা প্রসেসের শুরুটা কোথায়?
যেহেতু সামনে প্রশাসনের ডাটা ব্যবহার নিয়ে কথা বলছি, সেখানে ডাটা জোগাড় করা এবং সেটাকে প্রসেস করার ব্যাপার আজকের গল্প নয়। মনে আছে ‘মেসোপোটেমিয়া’ বলে একটা গ্রিক শহরের কথা? সেই আদ্যিকালের শহরের কর এবং শুল্কের খাতা দেখে আমরা এখন জানতে পারছি ডাটা প্রসেসের কথা। মানে ওই যুগে। সরকারগুলো ১৯ শতকের শুরুতে মেকানিক্যাল ক্যালকুলেটর দিয়ে শুরু করলে ১৯৬০ এবং ১৯৭০ দশকে শুরু হয় ডাটা প্রসেসিং মেইনফ্রেম কম্পিউটারে। আমাদের দেশে সেটা শুরু হয় ১৯৮০-৯০এর দশকে।
বর্তমানে ডাটা কালেকশন এবং প্রসেসিং যেকোনো সরকারের বাজেট প্রস্তাবের প্রথম ধাপ। তবে এটা ঠিক যে, সরকারে যত ডাটা আছে সেগুলোকে এক জায়গায় জড়ো করলে অনেক প্রজ্ঞা পাওয়া যাবে। ডাটা সায়েন্স নিয়ে কাজ করতে গিয়ে ডাটার ঘনত্ব অর্থাৎ ডাটার নিবিড়তা, ডাটাগুলো কত কম্প্যাক্ট থাকছে অর্থাৎ গ্রানুলারিটি, কতটুকু জুম (কতোটুকু ভেতরে যাওয়া যাবে) করা যাবে ডাটাকে, ডাটাগুলো কিভাবে একে অপরের সাথে সম্পর্কিত বা লিঙ্ক করা আছে, ডাটা এনালাইসিস করলে তার মধ্যে প্যাটার্নের সংযোগগুলো ডাটাকে বুঝতে ভাল ধারণা দেয় আমাকে।
ডাটাকে প্লট, এক নজরে ধারণা
ডাটাকে দেখা
Decision making increasingly relies on data, which comes at us with such overwhelming velocity, and in such volume, that we can’t comprehend it without some layer of abstraction, such as a visual one.
-- Visualizations That Really Work, Scott Berinato, HBR
ডাটা সাইন্সের শুরুর কাজ হচ্ছে ডাটাকে কয়েকটা ডাইমেনশনে প্লট করতে পারা। এই প্লটে বোঝা যায় ডাটার সম্পর্ক। কোথায় যাচ্ছে বিকাশের টাকার ট্রেইল, কোথায় ক্যাশ আউট হচ্ছে বেশি, ঈদের সময় কোন রাস্তাগুলোর বিকল্প রাস্তা কোনগুলো হতে পারে, সন্ধার পর কোথায় ছিনতাই হয় বেশি, কোন এলাকার মানুষগুলো পানির কষ্টে আছে, রাস্তার কোন বাঁকগুলোতে দুর্ঘটনা হচ্ছে এবং সামনে হবে বেশি অথবা কাদের মানসিক অবস্থা বর্ডারলাইনে সেটা দেখাতে পারে এই সামান্য প্লটিং। একবার একটা বাইরের ইউনিভার্সিটির সাথে বাংলাদেশের মোবাইল অপারেটরের ডাটাতে দেখেছিলাম কিভাবে সাগরের কাছে সব হারিয়ে মানুষগুলো দেশের ভেতরে কোথায় হারিয়ে যায় জীবিকার খোঁজে।
ডাটার এ ধরনের নতুন বৈশিষ্ট্যগুলোকে ব্যবহার করে প্রশাসন এক ধরনের ‘অ্যান্টিসিপেটরি গভার্নমেন্ট’ অর্থাৎ আগাম ধারনার প্রশাসন তৈরি করতে পারে। মানুষ কালকে অর্থাৎ সামনের মাসগুলোতে যেই সমস্যাগুলোতে পড়তে পারেন সেটা যদি আগেভাগে সমাধান করা যায় তাহলে কেমন হয়? সেই প্রশাসনকে মানুষ ভালো না বেসে যাবে কোথায়? ডাটাকে ঠিকভাবে অ্যানালাইসিস অর্থাৎ নিরীক্ষণ করলে সামনে কি ঘটতে পারে সেটা নিয়ে কাজ করছে অনেক দেশের প্রশাসন। চলুন কথা বলি ডাটার কয়েকটা বৈশিস্ট্য নিয়ে যা পাল্টে দিচ্ছে আজকের সরকারি প্রশাসন এবং বেসরকারি ব্যবসাগুলোকে।
ডাটার নিবিড়তা মানে ডাটাগুলো কতো ‘ডেন্সড’
পৃথিবীতে প্রতি সেকেন্ডে যেভাবে ডাটা বাড়ছে সেখানে ডাটার মধ্যে ঘনত্ব অথবা ডাটাগুলোর মধ্যে নিবিড়তা অর্থাৎ একটার সাথে আরেকটা ডাটার ঘনত্ব কমছে প্রতিদিন। আগে যতটুক জায়গায় ১ টেরাবাইট ডাটা রাখা যেত সেখানে এখন নখের আগার অনেক কম জায়গায় এই ডাটা রাখা যায়। আপনার মোবাইলে যেই প্রসেসর আছে সেই প্রসেসরের অনেক কম ক্ষমতাসম্পন্ন প্রসেসর দিয়ে মানুষ চাঁদে গিয়েছে। চালিয়েছে গাইডেন্স কম্পিউটার, মহাকাশে যেতে।
এখন বাসার অনেক ডিভাইস এত বেশি ‘লগ জেনারেট’ করে যে প্রতিটা ডিভাইস থেকে প্রাপ্ত তথ্য দিয়ে আপনার কাজের আউটপুট আরো পুঙ্খানুপুঙ্খভাবে পাওয়া যায়। প্রাইভেসির কথা বাদ দিয়ে যদি একটা উদাহরণ টানি, আপনার অ্যাপ্লিকেশন কিভাবে জানবে আপনি কোথায় আছেন? ধরুন, আপনি উবার ডেকেছেন, কিভাবে আপনাকে এবং গাড়িকে এক জায়গায় আনবে? অথবা, আপনি বিপদে পড়ে ৯৯৯ কল করেছেন, তবে কথা বলতে পারেননি, পুলিশ কিভাবে আপনাকে ‘লোকেট’ করে উদ্ধার করবে?
ছোটবেলায় দেখেছি একটা বাসার ঠিকানা হচ্ছে একজন মানুষকে ঠিকমতো ‘লোকেট’ করার প্রযুক্তি। টেলিফোন আসার আগের কথা বলছি। এরপর এর সাথে যোগ হলো তার ‘ল্যান্ডলাইন’ এখনকার ‘বিটিসিএল’, অর্থাৎ টেলিফোন লাইনের বিলিং অ্যাড্রেসে যে ঠিকানা দেয়া আছে সেখানে মানুষটাকে পাওয়ার কথা। এরপরে এলো বাসায় ইন্টারনেট কানেকশন। সেখানেও বিলিং অ্যাড্রেস হিসেবে এলো তার বাসার ঠিকানা। এখন ডিস এন্টেনা এবং ইন্টারনেট আসছে একসাথে। সেখানেও আছে একটা বাসার ঠিকানা। ডাটার অ্যাট্রিবিউট বাড়ছে - একই বিষয়ে।
মিটারের খেলা
There continues to be improvement, and you’ll see indoor accuracy of better than 10 meters, but round-trip time (RTT) is the technology that will take us to the one-meter level.
-- How to achieve 1-meter accuracy in Android, Frank van Diggelen, Roy Want and Wei Wang, Android Location, Google
প্রযুক্তির উৎকর্ষতায় চলে এল মোবাইল ফোন। সেখানে একটা মোবাইল ফোন যেই বেজ স্টেশন টাওয়ারে কানেক্টেড, সেখান থেকে ওই মানুষটার লোকেশন পাওয়া যেত। কারন, প্রতিটা বেজ স্টেশনের সাথে ‘সিগন্যাল সিনক্রোনাইজ’ করার জন্য ‘জিপিএস’ টাইমিং ব্যবহার করা হয়। সেখান থেকে ওই টাওয়ারের স্পেসিফিক লোকেশন। এরপরে এলো ‘ট্রায়াঙ্গুলেশন’, অর্থাৎ নেটওয়ার্কে আরো কিছু সেন্সর ব্যবহার করে মোবাইল ফোনটা কোথায় আছে সেটা বের করার একটা প্রযুক্তি। সেই মোবাইল ফোনের সাথে যুক্ত করে দেওয়া হতো একটা ‘অ্যাসিস্টেড জিপিএস’, বিপদের সময় মানুষ ফোন করলে কলের সাথে চলে যেত তার স্পেসিফিক ‘লোকেশন’ জরুরী সাহায্য কেন্দ্রের কাছে। একটা লুকায়িত ‘এসএমএস’ দিয়ে। মানুষটা ফোনে কথা না বলতে পারলেও সাহায্য চলে যেতো ওই জায়গায়।
এরপরে এলো স্মার্ট ফোন, এবং সঙ্গে বিল্টইন ‘জিপিএস রিসিভার’ যেটা সরাসরি যোগাযোগ করতে পারে স্যাটেলাইটের সাথে - নিজের লোকেশন জানতে। আমার এই উদাহরণটা আনার উদ্দেশ্য হলো এই মুহূর্তে এই একটা লোকেশন ডাটা পেতে যত ধরনের প্রযুক্তি বের হয়েছে সেটাই প্রচুর ডাটার ঘনত্ব তৈরি করছে। আগে ডাটা ছিল কম, সেখান থেকে সে ধরনের এনালাইসিস আসতো না মানুষের কাছে। প্রযুক্তির উন্নয়নের ফলে এখন আপনার মোবাইল ফোন ঠিক জানে আপনার উবার অথবা পাঠাও ‘রাইডটা’ কত দূরে আছে। অথবা যখন আপনি গুগল ম্যাপ ব্যবহার করে এক জায়গা থেকে আরেক জায়গায় যাবার সময় রাস্তা ভুল করে ফেললেও প্রতিমুহূর্তে আগের ডাটা থেকে নতুন করে ‘রি-রাউটিং’ প্রযুক্তি ব্যবহার করে আবার নতুন রাস্তায় নিয়ে আসে। এর কারণ একটাই। প্রচুর ডাটা ‘জেনারেট’ করছে হাজারো মোবাইল ফোন আপনার আশেপাশে। আর সে কারণেই আপনি বুঝতে পারেন কোন রাস্তায় ‘বাম্পার টু বাম্পার’ গাড়ির জ্যাম, মানে পুরো রাস্তা ধরেই লাল সিগন্যাল। এই তথ্য পাচ্ছেন আপনার ফোনে, রিয়েল টাইমে। এর পাশাপাশি, এখন সোশ্যাল মিডিয়ার পোস্টেও দেয়া যাচ্ছে জিও-লোকেশন ট্যাগ। বন্ধুরা জানতে পারছেন কোথায় আপনি এখন?
আমি যেহেতু কমিউনিকেশনের লোক, সে কারণে বলতে পারি, আগে যে ফ্রিকোয়েন্সি ব্যান্ড দিয়ে মাত্র কয়েকটা ডিভাইস চলত, সেখানে একই ফ্রিকোয়েন্সিতে চলে হাজারো ডিভাইস। যতো ডিভাইস, ততো বেশি কানেকশন, ততো বেশি লগ জেনারেশন, ততোবেশি ডাটার ডেনসিটি। এছাড়াও উপরের দিকে গিগাহার্টজ ব্যান্ডের ফ্রিকোয়েন্সিতে কাজ করত না সেরকম ডিভাইস। এখন উপরের দিকের ব্যান্ডগুলোতেও চলে আসছে প্রচুর ডিভাইস যা ব্যবহার হচ্ছে ‘মেশ’ ধরনের কানেকশনে। অর্থাৎ একটা ডিভাইস যোগাযোগ করছে তার আশেপাশে অনেক ডিভাইসের সাথে। যেভাবে আপনার ইলেকট্রিক মিটার যোগাযোগ করছে তার সেন্ট্রাল সিস্টেমের সাথে। অথবা নদীর পানি মাপতে ব্যবহার হচ্ছে ছোট ছোট অল্প দামের ‘ইন্টারনেট অফ থিংস’ ডিভাইসগুলো।
এখন ইন্টারনেট যেভাবে তার প্রতিটা ইলেকট্রনিক যোগাযোগের ডাটা পাইপ দিচ্ছে ভার্চুয়াল প্রাইভেট নেটওয়ার্ক দিয়ে, তার পাশাপাশি প্রতিটা অ্যাপ্লিকেশন এবং তার প্রসেসের ভেতরে আলাদা আলাদা ‘ট্রানজাকশন’ এবং প্রসেস করা ডাটা - সরকার এবং ব্যবসায়িক প্রতিষ্ঠানগুলোকে অসাধারণভাবে কাজে সাহায্য করছে। এর পাশাপাশি প্রচুর ‘সেন্সর নেটওয়ার্ক’ তৈরি করছে অনেক ‘লগ’ যার দিয়ে রিয়েল টাইম মনিটরিং অর্থাৎ নিরীক্ষণ সম্ভব। এটা সম্ভব হচ্ছে এ কারণেই, এখন ডাটা সোর্স অনেক বেশি। সেকারণে ডাটা ‘জেনারেট’ হচ্ছে প্রতিটা ডিভাইস হিসেবে আরও বেশি। ফলে এই বাড়তি ডাটা সরকার এবং ব্যবসায়িক প্রতিষ্ঠানগুলোকে সাহায্য করছে ভালো ‘এনালাইটিক্স’ এবং প্রজ্ঞা দিতে। একটা দুটো ডাটা সোর্স ভুল তথ্য দিলেও সবগুলো ডাটা সোর্সকে একসাথে মিলিয়ে অ্যানালাইসিস করলে নির্ভুল আউটকাম আসে।
ডাটার রেজ্যুলেশন অর্থাৎ ‘গ্র্যানুলারিটি’
শুরুর দিকে ডিজিটাল ক্যামেরার আউটপুট ছিল ‘ভিজিএ’। মাত্র ৬৪০ পিক্সেল। এখন সাধারন মোবাইল ফোনের যে ক্যামেরাগুলো আসছে সেগুলোই অনেক বেশি রেজ্যুলুশনের। এর অর্থ হচ্ছে আগের ছবি দিয়ে ‘এডিটিং’ করতে হলে ‘হেড রুম’ ছিল অনেক কম। এখনকার ছবিগুলোতে রেজ্যুলেশন অত্যাধিক বেশি থাকাতে এর জুমিং এত বেশি করা যায় যে সেই ছবি থেকে ছোট একটা আইটেমকে আলাদা করে একটা বড় ছবি বানানো যায়। ব্যাপারটা এরকম যে, আপনার তথ্য সরকারের কাছে বিভিন্ন ডাটাসেটে থাকাতে একজন ব্যক্তিকে বিভিন্ন অ্যাঙ্গেল অর্থাৎ দৃষ্টিকোণ থেকে অ্যানালাইসিস করা যায়।
একজন ব্যক্তিকে শনাক্ত করতে জাতীয় পরিচয়পত্র ডাটাবেসের যতগুলো ফিল্ড আছে, সেটাকে আরও ভালো ‘রেজ্যুলেশন’ দেয় ‘জন্ম-নিবন্ধন’ এবং ‘পাসপোর্ট’ ডাটাসেট। অর্থাৎ কিছু তথ্য একই থাকলে এর সঙ্গে বিভিন্ন দৃষ্টিকোণ থেকে আরও অনেক তথ্য অন্যান্য বিষয় সম্পর্কিত ধারণা দেয়। এখন আপনি হজ্বে যান অথবা বিভিন্ন কাজে বিদেশ ভ্রমণে যান, একই তথ্য বিভিন্ন দৃষ্টিকোণ থেকে প্রসেস সহজ হয় বাড়তি ইনপুট ছাড়াই। পাশাপাশি বিভিন্ন সংস্থার চাহিদা ভিন্ন রকম। একজনের সাথে আরেকজনের চাহিদা মিলবে না। শিক্ষাবোর্ড যে ডাটা চাইবে ভূমি মন্ত্রণালয় সে ডাটা চাইবে না, অথচ কাজ হচ্ছে একই ব্যক্তির উপরে। ডাটার ভালো রেজুলেশন থাকলে সরকার যে কোন সার্ভিস গ্রহীতার কাছে নতুন কোনো তথ্য না নিয়েই সার্ভিস দেয়া যায়। কারণ, সার্ভিস গ্রহীতা বলতেই পারেন সব ডাটা আছে প্রশাসনের কাছে। সেকারণে, ডাটাসেটগুলোকে একে অপরের সাথে যোগাযোগ করতে পারতে হবে। সেই কাজটা হচ্ছে এখন।
ডাটার মধ্যে লিংকিং
মনে আছে আগের উদাহরণের কথা? দেশের একজন সাধারণ নাগরিকের ‘ট্যাক্স আইডেন্টিফিকেশন নম্বর’ অর্থাৎ ‘টিন’ আইডি যখন পাসপোর্ট ডাটার সাথে যুক্ত হবে, এর সাথে ‘ইমিগ্রেশন’ ডাটাবেসের তথ্যকে অ্যানালাইসিস করলে তার প্রতিবছরের কর প্রদানের হিসেবের মধ্যে একটা যোগসূত্র তৈরি করা যাবে। এর পাশাপাশি ভূমি রেকর্ড ও জরিপ অধিদপ্তর এবং রাজউকের ডাটাবেসের সাথে কিছু তথ্য মিলিয়ে নিলে সেই ব্যাপারটাকে আরো সুন্দরভাবে উপস্থাপন করা যাবে। একারণে একজন নাগরিকের কর প্রদানের তথ্যকে ঠিকমতো যাচাই করার জন্য বেশ কিছু দেশে কৃত্রিম বুদ্ধিমত্তা ব্যবহার করা হচ্ছে। ব্যাপারটাকে আহামরি মনে হবার কিছু করার নেই কারণ ডাটার মধ্যে লিঙ্কিং এর ক্ষমতার শুরুটা এখানে।
এর পাশাপাশি বাংলাদেশ সড়ক পরিবহন কর্তৃপক্ষের ডাটাবেসে বাড়তি গাড়ির মালিকানার ব্যাপারে ব্যাপারগুলোকে আরও স্পষ্ট করে নিয়ে আসা যায়। এর অর্থ হচ্ছে যত ডাটাসেটগুলো একে অপরের সাথে লিংক করা যাবে, ততো ডাটাগুলোর ভেতরে যোগসুত্র খুঁজে পাওয়া যাবে। এই গাড়ির ডাটাবেসের সাথে ইন্স্যুরেন্স, ড্রাইভিং লাইসেন্স এবং বিভিন্ন রাস্তা বা সেতু পার হবার সময় ‘টোল’ ডাটাবেসে নতুন ধরনের ধারণা পাওয়া যাবে। এটা তখনই সম্ভব যখন একটা অবজেক্টকে (মানুষ, গাড়ি, অর্থাৎ যার একটা আইডি আছে) বিভিন্ন ডাটাসেটে একটা ইউনিক সনাক্তকরণ নম্বর দিয়ে মেলানো যাবে। এক্ষেত্রে জাতীয় পরিচয়পত্রের নম্বর সব ডাটাসেটের মধ্যে সন্নিবেশিত (বাধ্যতামূলক একটা ফিল্ড হিসেবে) থাকলে ডাটার লিংকিং করা অনেক সহজ হয়। মনে আছে, ডাটাবেসের ভেতরে যখন আমরা বিভিন্ন টেবিলকে একটার সাথে আরেকটাকে লিংক করার জন্য় ‘প্রাইমারি কী’ পদ্ধতি ব্যবহার করতাম?
লিঙ্কিং এবং মিসিং ডাটা
For every big data set (with one billion columns and rows) fueling an AI or advanced analytics initiative, a typical large organization may have a thousand small data sets that go unused.
-- Small Data Can Play a Big Role in AI, HBR
বিভিন্ন সোশ্যাল মিডিয়াতে আমরা যতোই প্রোফাইল খুলি না কেন এর পেছনে একটা ইউনিক সনাক্তকরণ পদ্ধতি থাকে যা সবগুলো প্রোফাইলকে একীভূত করতে পারে। সেটা আপনার ইমেইল, ব্যবহারকারীর হ্যান্ডেল অথবা ফোন নম্বর যা সবগুলো প্রোফাইলে থাকার কথা। যতো দিন যাবে ততোই এই ডাটার মধ্যে লিংকিং বাড়তে থাকবে ফলে যেকোনো মানুষের ‘পার্সোনালাইজড’ সার্ভিস পেতে সুবিধা হবে। এখনই আমরা অনলাইন ডিজিটাল সার্ভিসগুলোতে একটা একীভূত ‘অথোরাইজেশন’ সিস্টেম ব্যবহার করছি যার ফলে সবকিছুকে লিংকিং করা যাচ্ছে সহজে। আপনার ফেসবুক বা গুগল আইডি থাকলেই অনেক কিছু ব্যবহার করা যাচ্ছে এক ক্লিকে।
ডাটার মধ্যে প্যাটার্ন, মেশিন লার্নিং
ডাটার ভেতরে ঘনত্ব, রেজ্যুলেশন এবং লিংকিং থেকে যে ধরনের ধারণা আসে তার একটা বড় অংশ হচ্ছে মেশিন লার্নিং। আমরা যখন সাধারন পরিসংখ্যান পড়তাম, সেখানে ‘ইনফারেন্স’ বলে একটা ব্যাপার ছিল। অর্থাৎ ডাটা থেকে ‘ইনফার’ মানে অনুমান করা। একটা স্যাম্পল থেকে ডাটাকে বড় একটা পপুলেশনে প্রজেকশন করা যেত। কম ডাটা থাকলে যা হয় আর কি। তবে এখন যেহেতু ডাটার অনেক সোর্স, সে কারণে ডাটাগুলোকে অনেক দৃষ্টিকোণ থেকে অ্যানালাইসিস করা যায়। এর সাথে যুক্ত হয়েছে কম্পিউটিং প্রসেসিং ক্ষমতা, এবং কিছু ‘স্পেশালাইজড’ প্রসেসর যেগুলো ইমেজ ডাটাকে হ্যান্ডেল করতে পারে ভালো। বেশি ডাটাসেট হলে এর মধ্যে ভুলের সংখ্যা কমে যায়। আগে ডাটার ভেতরে মানুষের পুরনো অভিজ্ঞতা থেকে ‘কো-রিলেশন’ অথবা আগের ধারণা থেকে একটা সিদ্ধান্ত নেওয়া - এই ব্যাপারগুলো থেকে বের হয়ে আসছে দেশগুলোর প্রসাশন।
সরকারি ডাটাসেট
সার্ভিসগুলোকে জনগণের কাছে পাঠানোর কাজকে ত্বরান্বিত করার জন্য প্রশাসন এবং বিশেষায়িত সংস্থাগুলো নিজ নিজ ডাটাসেট তৈরি করেছে গত কয়েক দশক ধরে। আমি যেহেতু নিজেই বেশ কয়েকটা প্রজেক্টের সাথে ছিলাম সেকারণে বলতে পারি - যে ধরনের ফর্ম/ডকুমেন্টগুলো আগে ছিল কাগজে, সেগুলোকে আস্তে আস্তে ডিজিটাল ফরম্যাটে পরিবর্তন করার কাজ চলছে অনেক সংস্থাতে। পৃথিবীজুড়ে অন্যান্য দেশের প্রশাসনের সাথে সাথে তাল মিলিয়ে বাংলাদেশের বিভিন্ন সংস্থা যেমন জাতীয় পরিচয় পত্র, জাতীয় রাজস্ব বোর্ড, কর কমিশনারের কার্যালয়, শিক্ষানবিশ/স্মার্ট কার্ড ড্রাইভিং লাইসেন্স, ড্রাইভিং লাইসেন্স নবায়ন, গাড়ি এবং চালকদের আলাদা ডাটাবেস, জন্ম নিবন্ধন, পাসপোর্ট এবং ইমিগ্রেশন, শ্রম ও কর্মসংস্থান মন্ত্রণালয়ের ডাটাবেস, শ্রম ও কর্মসংস্থান মন্ত্রণালয়াধীন কলকারখানা ও প্রতিষ্ঠানের প্রয়োজনীয় ডাটাবেস, মাধ্যমিক ও উচ্চ শিক্ষা বিভাগের শিক্ষার্থীদের ডাটাবেজ, আইন এবং নিরাপত্তা প্রদানকারী সংস্থাগুলোর অপরাধ এবং অপরাধীদের ডাটাবেজ, হেলথ কার্ড, ভূমি সংক্রান্ত ডাটাবেজ, আইন সংক্রান্ত ডাটাবেস সহ বহু ডাটাবেস তৈরি হয়ে গেছে এরমধ্যে।
ওপেন ডাটা
During recent years, the amount of data released on platforms by public administrations around the world have exploded. Open government data platforms are aimed at enhancing transparency and participation.
-- Open data work: understanding open data usage from a practice lens, SAGE Journals
যেহেতু সরকারি কাজের প্রবাহ অর্থাৎ প্রসেসগুলো আস্তে আস্তে ‘ডিজিটালাইজড’ হচ্ছে বলে বিভিন্ন সংস্থার মধ্যে ডাটাবেসগুলোর যোগাযোগ শুরু হয়েছে ইতিমধ্যে। সরকারি সংস্থাগুলোর মাঝে ‘অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেস’ অর্থাৎ এপিআইয়ের মাধ্যমে বিভিন্ন সংস্থাগুলো তথ্য আদান প্রদান করা শুরু হয়েছে নাগরিক সেবা প্রদান করতে। অল্প হলেও এগিয়েছে ভালোই। এই কাজের একটা বড় ভাগ দেখেছি আমার নিজের চোখে। সেদিক থেকে এগিয়ে আছে আইন প্রয়োগকারী সংস্থাগুলো। এর পাশাপাশি সরকারি ডাটাবেসগুলোর সাথে যুক্ত হচ্ছে বেসরকারি এবং ব্যবসায়িক সংস্থাগুলো যাতে নাগরিক সার্ভিস দেয়া যায় খুব সহজেই। এ ব্যাপারে জাতীয় পরিচয়পত্র ডাটাবেসের সাথে যুক্ত আছে অসংখ্য বেসরকারি সার্ভিস প্রোভাইডার যারা প্রতিনিয়ত জনগণকে সেবা দিয়ে আসছেন। যেমন ‘সিম রেজিস্ট্রেশন’ অথবা ব্যাংকের এবং মোবাইল ফিন্যান্সিয়াল সার্ভিসের একাউন্ট (কেওয়াইসি, নো ইওর কাস্টমার) তৈরি করতে জাতীয় পরিচয়পত্র দিয়ে ভেরিফিকেশন অর্থাৎ নিরীক্ষণ চালু আছে রিয়েল টাইমের ভিত্তিতে। সরকারি বেসরকারি শিক্ষা প্রতিষ্ঠানগুলো কাজ করছে শিক্ষা বিভাগের ডাটাবেসের সংযোগ নিয়ে। পরীক্ষার আগে রেজিস্ট্রেশন থেকে শুরু করে পরীক্ষার ফলাফল প্রকাশ করা পর্যন্ত সরকারি এই ডাটাবেসের এর সার্ভিসগুলো ব্যবহার করছে প্রচুর সরকারি এবং বেসরকারি শিক্ষা প্রতিষ্ঠানগুলো। তবে সেগুলো এখনও ওয়েবভিত্তিক। এপিআই লেভেলে আসেনি এখনও।
অনলাইনের সরকার
Named ‘the most advanced digital society in the world’ by Wired, Estonia has built an efficient, secure and transparent ecosystem where 99% of governmental services are online.
-- We have built a digital society and we can show you how, e-estonia
১৯৯০ সালে এস্তোনিয়ার সরকার চালু করে সার্ভিস বাস অর্থাৎ নেটওয়ার্কের নেটওয়ার্ক; একটা নতুন ব্যবসা খুলতে যতগুলো ডাটাসেটকে দরকার, ততগুলো ডাটাসহ আরো প্রয়োজনীয় (জাতীয় পরিচয় পত্র, কর, ব্যবসায়িক নিবন্ধন ডাটাবেজ, হেলথ কার্ড ইত্যাদি) সব ডাটাসেট নিয়ে একটা লিংকড ডাটাবেস তৈরি করে। এই হাইওয়েতে উঠলেই হলো ডাটা সমস্যা নয়। এর নাম দিয়েছে তারা ‘এক্স রোড’। সব ধরনের ওপেন প্রটোকল দিয়ে তৈরি এই রাস্তায় উঠলে যেকোনো ধরনের ডাটাবেসে সংযোগ পাওয়া সেকেন্ডের ব্যাপার। এই ডিজিটাল “ডাটা-হাব” একটা ডিজিটাল এক্সচেঞ্জ এর মত যেখানে প্রতিটা প্রশাসনিক প্রসেস তাদের নিজের পছন্দমত ডাটা এক্সচেঞ্জ করে নিতে পারে।
এ ধরণের কয়েকটি ধারণা বাংলাদেশে তৈরি হয়েছে যেখানে এটাকে ই-সার্ভিস বাস হিসেবে বলা হয়। বাংলাদেশ ন্যাশনাল ডিজিটাল আর্কিটেকচার এই একই পদ্ধতিতে কাজ করে। অর্থাৎ এই ওপেন অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেস দিয়ে একটা সংস্থা অথবা প্রশাসনিক দপ্তরগুলো সরাসরি যুক্ত হতে পারে কমন প্রটোকলে। বাংলাদেশ কম্পিউটার কাউন্সিল এবং বাংলাদেশ ইনভেস্টমেন্ট ডেভলপমেন্ট কর্তৃপক্ষের সহযোগিতায় এ ধরনের কয়েকটি ইউনিভার্সাল ই-সার্ভিস বাস তৈরি হচ্ছে। ধারণা করা হচ্ছে এতে বাংলাদেশেও একটা ব্যবসা খুলতে একটা ন্যূনতম সময় লাগবে। সরকারি ডাটাসেটগুলোর মধ্যে আমার কাছে ‘স্ট্যাটিসটিকস নেদারল্যান্ডস’কে অসাধারণ মনে হয়েছে। ডাটা কিভাবে একই সাথে সরকারি এবং বেসরকারি জায়গায় একসাথে ব্যবহার হয় সেটা দেখতে চাইলে তাদের কাজগুলো অবশ্যই প্রশংসনীয়।
বেসরকারি খাতের ডাটা সোর্স
বাংলাদেশে ব্যবসা করার আইনগত বাধ্যবাধকতার কারণে প্রশাসন দেশের বেসরকারি সার্ভিস প্রোভাইডারগুলোর ডাটাসেটকে যোগসুত্র ঘটিয়ে দেয় সরকারের সাথে। দেশের টেলিযোগাযোগ ব্যবস্থার একটা বড় অংশ যেহেতু বেসরকারি সার্ভিস সেক্টরে সেকারণে টেলিযোগাযোগ সার্ভিস প্রোভাইডাররা আইনগত সূত্রে ‘সাবস্ক্রাইবারদের ডাটাবেস’ যুক্ত করতে হয় নিরাপত্তা এবং আইন প্রয়োগকারী সংস্থাদের সাথে। সে কারণে মোবাইল ফোন, ইন্টারনেট সার্ভিস প্রোভাইডার, ব্যাংক, মোবাইল ফিনান্সিয়াল সার্ভিসসহ আরো অনেক কোম্পানিগুলো যুক্ত হয় এই ডাটাসেটের সার্ভিস বাসে।
এর পাশাপাশি বিভিন্ন দেশের প্রশাসন সোশ্যাল মিডিয়া নিরীক্ষণ করে থাকেন জনগণের মতামত পাওয়ার জন্য। এই সোশ্যাল মিডিয়া থেকে সামনে কি ঘটনা ঘটতে পারে এবং প্রতিটা ঘটনার সাথে জনগণের সম্পৃক্ততা ব্যাপারটা বোঝা যায় অন্যান্য ডাটা সোর্সগুলোর ডাটা এনালাইসিস থেকে। বর্তমানে মুক্ত ইন্টারনেট থেকে যে তথ্য পাওয়া যায়, সেধরনের ‘ওপেনসোর্স ইন্টেলিজেন্স’ এবং সোশ্যাল মিডিয়া থেকে ‘সেন্টিমেন্ট এনালাইসিস’ করে প্রশাসনগুলো তাদের সামনের কাজগুলো প্রেডিকশন করতে পারে। সত্যি কথা বলতে, সোশ্যাল মিডিয়া ডাটা মাইনিংয়ের ক্ষেত্রে বিশাল ভূমিকা পালন করে আসছে। বিভিন্ন দেশের রাষ্ট্রপ্রধানদের সোশ্যাল মিডিয়া ব্যবহার তাদেরকে জনগণের আরো কাছে নিয়ে আসছে।
সেন্সর নেটওয়ার্ক এবং ‘ইন্টারনেট অফ থিংস’ এর ডাটাসেট
ডাটা কালেকশন
As more Internet-connected devices are being deployed to automate and collect various data, the adoption of IoT efficiently boosts business life all over the world, which is further supported by breakthrough innovations. The latter are remarkable as they employ the IoT technologies to mitigate global warming, save water, increase yields in smart farming, provide a backbone for autonomous vehicles, and many more.
-- The Internet of Things and Sensor Networks, IEEE Xplore
মানুষ হিসেবে আমাদের সবার পকেটে একটা করে মোবাইল ফোন সেন্সরের মতো কাজ করলেও বর্তমানে দেশজুড়ে অনেক জায়গায় তৈরি হতে যাচ্ছে সেন্সর নেটওয়ার্ক। আমাদের বিদ্যুৎ মিটার থেকে শুরু করে রাস্তার সরকারি বাস, ট্রেন এবং ট্রাফিক সিস্টেম চালাতে সেন্সর নেটওয়াক ছাড়া গতি নেই। এই ধরনের সেন্সরগুলো যে ধরনের ডাটা জেনারেট করে সেটা প্রসেস করতে পারলে ভবিষ্যৎ নিয়ে অনেক ধারণা পাওয়া সহজ হবে। প্রতিটা অবজেক্ট আস্তে আস্তে যুক্ত হচ্ছে সেন্সর নেটওয়ার্কে যাতে একটা নির্দিষ্ট সময় পরে সেই সার্ভিসটার ব্যাপারে তথ্য পাওয়া যায় সেন্ট্রাল সিস্টেমে।
নদীর পানি বাড়ল না কমল, সামনের মাসে বন্যা হবে কিনা এই ধরনের তথ্যের জন্য আমাদেরকে নির্ভর করতে হচ্ছে সেন্সর নেটওয়ার্ক এর উপর। একটা শহরের তাপমাত্রা থেকে শুরু করে বাতাসের মান নিয়ে কাজ করতে গেলে দরকার এই সেন্সর নেটওয়ার্ক। শহরজুড়ে ট্রাফিক অপটিমাইজেশন এবং ইন্টেলিজেন্ট লাইটিং সিস্টেম নির্ভর করে আছে এই সেন্সর ভিত্তিক নেটওয়ার্কগুলোর উপরে। আমার হিসেবে ঢাকা শহরে ট্রাফিক অপটিমাইজেশনে এই নেটওয়ার্ক ব্যবহার করলে নিদেনপক্ষে ২০% আগে মানুষ তার গন্তব্যস্থলে পৌছাতে পারবে।