কনটেন্টে যান

ডেটা অ্যানালাইসিস/ভিজ্যুয়ালাইজেশনের কিছু উদাহরন

ডাটা এবং তথ্যের সঠিক গ্রাফিক্যাল রিপ্রেজেন্টেশনকে অনেক সময় আমরা ডাটা ভিজুয়ালাইজেশন বলতে পারি। আমাদের দেখা মতে, যেগুলোর ভিজুয়াল এলিমেন্ট যেমন চার্ট, গ্রাফ, ম্যাপ ইত্যাদি আমাদেরকে সাহায্য করে একটা স্পেসিফিক ডাটা থেকে। বিশেষ করে, ট্রেন্ড এনালাইসিস,প্যাটার্ন থেকে ডাটা কি বলতে চাইছে, কোন ধরনের ডাটা আউটলাইয়ার অর্থাৎ বাকিদের সাথে মিলছে না, অ্যানামলি ডিটেকশন - ইত্যাদি আমাদেরকে সাহায্য করে এই তথ্য থেকে ডাটা ড্রিভেন সিদ্ধান্ত নিতে।

আমরা এখানে কয়েকটা খুবই সহজ ভিজুয়ালাইজেশন নিয়ে কথা বলবো যা বুঝিয়ে দেবে ডাটা আমাদেরকে কি বলতে চাইছে। শুরুতে ফ্লোরেন্স নাইটিঙ্গেল।

ক্রিমিয়ার যুদ্ধ

১৮৫৩ সালে ক্রিমিয়ার যুদ্ধ শুরু হলেও শেষ হতে হতে ৫৬ সাল পর্যন্ত লেগেছিল। ইতিহাস ঘেঁটে বলা যায়, যে যুদ্ধে রেলওয়ে, টেলিগ্রাফ, ফটোগ্রাফি এবং হাই এক্সপ্লোসিভ শেল ব্যবহার হয়েছে - সেটাকে বর্তমান কালের যুদ্ধের মধ্যে ফেলা যেতে পারে। এই যুদ্ধের সবচেয়ে বড় সমস্যা ছিলো, প্রচুর সৈনিক মারা যাচ্ছিলেন প্রতিদিন যা পরিসংখ্যানগতভাবে যুক্তরাজ্যের রাজনীতিবিদ, সমরবিদদের বিপদে ফেলছিল। সবাই ভাবছিল, যুদ্ধেই বুঝি মারা যাচ্ছিল এত সৈন্য। তবে, সেটার ভেতরের খবর বের করতে পারেন ফ্লোরেন্স নাইটিঙ্গেল, তার ডাটার সাহায্য নিয়ে।

ফ্লোরেন্স নাইটিঙ্গেল তার ৩৮ জন সহকর্মী নিয়ে যুদ্ধক্ষেত্রে সৈন্যদলের সেবা-শুশ্রূষার পাশাপাশি ডাটা কালেক্ট করছিলেন - হাসপাতাল সিস্টেমের রিফর্ম নিয়ে নিয়ে কাজ করার জন্য। পরবর্তীতে, সেই দুর্দান্ত ‘পোলার এরিয়া ডায়াগ্রাম’ ব্যবহার করে নীতিনির্ধারণী পর্যায়ে জানানোর চেষ্টা করলেন - যে যুদ্ধ নয় বরং যুদ্ধপরবর্তী সময়গুলোতে ‘ফ্রস্ট-বাইট’ অর্থাৎ বরফ সংক্রান্ত রোগ, আমাশয়, কলেরা এবং টাইফাস জ্বরে মারা যাচ্ছিল বেশি। উনার পয়েন্ট ছিল - যদিও এটা যুদ্ধক্ষেত্র তবে মানুষ মারা যাচ্ছে সেই সব রোগে যে রোগগুলো পুরোপুরি প্রতিরোধযোগ্য। সৈন্যরা মারা যাচ্ছিল কারণ বিশেষ করে, কম্বলের সংখ্যা অপ্রতুল ছিল ওখানে। এর পাশাপাশি, হাসপাতালে হাইজেনিক সমস্যা বিশেষ করে ওই জায়গাতে থাকা প্রচুর ইদুর এবং মাছি এই প্রতিরোধযোগ্য রোগগুলোকে ছড়াচ্ছিল বেশি।

এ অবস্থায় হাসপাতাল এবং সামরিক বাহিনীর প্রশাসনের সাথে কথা বলার পাশাপাশি ফ্লোরেন্স নাইটিঙ্গেল ক্রিমিয়ার যুদ্ধে বসে সৈন্যদের দেখভাল এবং নিজস্ব পরিসংখ্যান এর জন্য ডাটা কালেকশন শুরু করলেন। তার সঙ্গে ৩২ জন নার্স এবং সামরিক বাহিনীর সাহায্যে বেশকিছু ডাটা কালেক্ট করে নিজেই চমকে গেলেন। যুদ্ধ শেষে ডাটা থেকে ‘ফাইন্ডিংস’ যখন পাবলিশ করতে গেলেন, তখন বড় ধরনের একটা প্রতিরোধের সম্মুখীন হয়েছিলেন। তখন তিনি তার এনালাইটিক্যাল মাইন্ডসেট থেকে তৈরি করলেন ‘পোলার এরিয়া ডায়াগ্রাম’ যা এক নজরে যে কাউকে বোঝানোর জন্য অসাধারণ ছিল।

চিত্র: প্রাণঘাতী রোগ না যুদ্ধ?

ছবিটা ভালভাবে দেখুন। প্রথম বছর অর্থাৎ ছবিটার সর্বডানের ডায়াগ্রামের সময়কাল ছিল ১৮৫৪-৫৫ পর্যন্ত। ওই বছরে ফ্লোরেন্স নাইটিঙ্গেল কাজ শুরু করেন ক্রিমিয়ায়। ডায়াগ্রামে প্রতিটা ত্রিভুজ অংশ হচ্ছে একেকটা মাস। ওই একেকটা ত্রিভুজের ভিতরে অংশগুলোকে বিভিন্ন রং দিয়ে ভাগ করে ফেলা হয়েছে কতজন সৈন্য মারা গেছেন ওই নির্দিস্ট মাসটাতে। এর মধ্যে সবচেয়ে বড় অংশ মানে নীল রঙের অংশটাতে সেই সব সৈন্য এর সংখ্যা মারা গেছে যারা প্রতিরোধযোগ্য রোগে আক্রান্ত হয়ে মারা গেছেন। যুদ্ধ নয় বরং ক্রিমিয়া অস্বাস্থ্যকর পরিবেশের কারণে সংক্রামক রোগের কারণে তারা মারা গেছেন। এদিকে অল্প মানে লাল অংশটা হচ্ছে যারা যুদ্ধক্ষেত্র থেকে প্রাপ্ত ক্ষতের কারণে মারা গেছেন। কালো অংশ হচ্ছে সেই সৈন্যদের সংখ্যা যারা অন্যান্য কারনে মারা গেছেন।

বামদিকের চার্টটা পরের বছরের। ফ্লোরেন্স নাইটিংগেল আগের বছরের ডাটা ব্যবহার করে যুদ্ধক্ষেত্রে মৃত্যুর সংখ্যা কমিয়ে নিয়ে এসেছিলেন অনেকখানি। দুটো চার্ট একই স্কেলে বলে বোঝা যাচ্ছে কত কম মৃত্যু হয়েছে বামের চার্ট থেকে। শুধুমাত্র ঠিকমতো ডাটা ব্যবহার করে উনি কমিয়ে নিয়ে এসেছিলেন প্রতিরোধযোগ্য রোগের মাধ্যমে মৃত্যুর হার। এই পোলার চার্ট ডায়াগ্রাম দেখে সবাই দুটো জিনিস বুঝতে পারবে। ১. আগের বছরের ডাটা ব্যবহার করে কমিয়ে নিয়ে আসা হয়েছিল অনেক মৃত্যু। ২. যুদ্ধক্ষেত্রের ক্ষত থেকেও অধিকাংশ ক্ষেত্রে প্রতিরোধযোগ্য রোগই মেরে ফেলছিল সৈন্যদের। এই পোলার চার্ট ডায়াগ্রাম শেষ পর্যন্ত ‘পাবলিশ’ হয়েছিল হয়েছিল “ইংল্যান্ড এন্ড হার সোলজারস” বইটাতে। শেষমেষ ওই বইটার ধারণা নীতিনির্ধারণী পর্যায়ের সবাইকে বাধ্য করেছিল পরবর্তী যুদ্ধের নীতিমালাগুলো সংস্করণে।


এক নজরে বাজেট

এরপরের ম্যাপের ব্যাপারে আমার নিজস্ব কিছু মতামত রয়েছে। নেশা অথবা পেশা হোক, ডাটার ভেতরে ‘কোরিলেশন’ বুঝতে সারাক্ষণ মাথা ব্যাকগ্রাউন্ডে ‘কম্পিউট’ করতে থাকে। আপনারও করে। মানুষের মাথার কাজ একটাই। একটার সাথে আরেকটার তুলনা করা। বিশ্বব্যাপী সরকারি ডেটাকে ঠিকমতো রিপ্রেজেন্ট করতে সংবাদপত্রগুলো বেশ ভালো কাজ করে। নিউইয়র্ক টাইমসের ২০১৩ সালের বাজেটের চার্ট দেখে চমকে গিয়েছিলাম। বেশ ইন্টারেক্টিভ ছিল সেটা। ক্লিক করলে এক্সপ্যান্ড করতো মাথা ধরে ধরে। বইয়ের কাগজে তো আর সেই ইন্টারঅ্যাকটিভিটি দেখানো যাবে না, তাই একটা সাধারণ ট্রি ম্যাপ।

চিত্র: ‘ট্রি ম্যাপ’: একটা বাজেটকে এক নজরে আনা

বিশ্বব্যাপী যে কোনো সরকারের বাজেট বোঝা বেশ কষ্টকর, তবে এ ধরনের একটা ‘ট্রি ম্যাপ’ আমাদেরকে বুঝিয়ে দেয় যে কোন একটা বাজেট এক নজরে আনা সম্ভব। এটা বানানো হয়েছিল - হোয়াইট হাউস থেকে, বারাক ওবামার সময়ে। আমার দেখামতে একটা অসাধারণ ডাটা ভিজুয়ালাইজেশন, বিশেষ করে বাজেটের মত কমপ্লেক্স জিনিস দিয়ে। তাও সেটা বোঝা যাচ্ছে একনজরে। এতেই বোঝা যায় যে, একটা কমপ্লেক্স জিনিসকে কত সহজে ভিজুয়ালাইজেশন এর মাধ্যমে ‘কমিউনিকেট’ করা যায়। পৃথিবীর সবচেয়ে কঠিন কাজ হচ্ছে আপনার মেসেজটাকে ঠিকমত ‘কমিউনিকেট’ করতে পারা।