সিবিএন ডেস্ক:

বিষয়টা সহজ করা যাক। ধরুন, নতুন একটি প্রতিষ্ঠান সিদ্ধান্ত নিলো বাজারে নিজেদের টুথপেস্ট নিয়ে আসবে। মালিক চাইবেন, গ্রাহকরা ওটা সাদরে গ্রহণ করুক। এর জন্য আগে বাজার গবেষণা করতে হবে। যাকে বলে মার্কেট রিসার্চ। ব্যবহারকারীদের ওপর চালাতে হবে গবেষণা। দেখা হবে, মানুষ কোন টুথপেস্ট বেশি ব্যবহার করে, কেন করে, কী কারণে কোন টুথপেস্টটা বছরের পর বছর কিনে যাচ্ছে ইত্যাদি। এসবই হলো ডাটা। আর এসব তথ্য জানা থাকলেই প্রতিষ্ঠান বুঝতে পারবে ঠিক কোন টুথপেস্টটা নিয়ে এলে গ্রাহক লুফে নেবে।

বলতে গেলে, গত পাঁচ বছরে ৯০ শতাংশ ব্যবসায়ী ডাটা বা তথ্যের ওপর গুরুত্ব দিয়ে তাদের ব্যবসায়ীক পরিকল্পনা নির্ধারণ করেছেন। সম্প্রতি লিংকড-ইনের তথ্য অনুযায়ী ডাটা সায়েন্সে পারদর্শীদের চাকরির বাজার দ্রুত বাড়ছে। পদগুলোর নাম কমবেশি একই রকম-ডাটা সায়েনটিস্ট, ডাটা সায়েন্স স্পেশালিস্ট, ডাটা ম্যানেজমেন্ট অ্যানালিস্ট ইত্যাতি। তথ্যমতে, ২০১৯ সাল থেকে চাকরির বাজারে এসব পদের চাহিদা বেড়েছে ৪৬ শতাংশ।

ডাটা সায়েন্স নিয়ে আরও কিছু

আবার ধরুন, আপনি একটি বই বিক্রির ওয়েবসাইটে প্রবেশ করলেন। সেখানে পছন্দের বইগুলোর নাম লিখে সার্চ দিলেন। কিছুক্ষণের মধ্যে দেখা গেলো আপনার ফেসবুকের হোমপেজে ওই ওয়েবসাইটের বিজ্ঞাপন আসা শুরু করেছে এবং যে বিষয়ের বইগুলো আপনি সার্চ করেছেন সে বিষয় সংশ্লিষ্ট বিজ্ঞাপনও দেখাচ্ছে। এ ঘটনাটা কীভাবে ঘটলো? এখানেও ডাটা সায়েন্টিস্টের বুজরুকি।

আপনার আগ্রহের বিষয়গুলোকে তথ্য (ডাটা) আকারে সংগ্রহ করা হয়। সেটা সফটওয়্যারে বিশ্লেষণ করে আপনার সম্ভাব্য পছন্দের পণ্যটাকে আপনার সামনে হাজির করা হয়। এতে ব্যবসায়ীর লাভটা হলো তিনি অল্প খরচ ও সময়ে তার পণ্যের সম্ভাব্য গ্রাহকের কাছে বিজ্ঞাপনটা পৌঁছাতে পারলেন। এ কাজেরই আরেক নাম ডাটা অ্যানালাইসিস।

ডাটা অ্যানালাইসিস ও ডাটা অ্যানালিটিক্স এক?

শুনতে এক হলেও কাজ ভিন্ন। ধরা যাক, কোনও কাপড়ের দোকান ক্রেতার তথ্য রাখা শুরু করলো। দোকানের ডাটা বিশ্লেষণ যিনি করবেন তার কাজ হলো, বিক্রির হিসাব থেকে ক্রেতার স্বভাব নির্ধারণ করা। যেমন, আপনি মাসে কয়বার সেখানে আসেন, সপ্তাহের ঠিক কোন দিন আসেন, কোন ধরনের পোশাক কেনেন, কত টাকার মধ্যে কেনেন, আপনার বয়স কত, ঘুরেফিরে আপনার পছন্দের রং কোনটা ইত্যাদি।

এখান থেকে ওই বিশ্লেষক অনেক ধরনের চার্ট বানিয়ে ফেলতে পারবেন। সেটা দেখেই পরে বোঝা যাবে আপনাকে ঠিক কী ধরনের অফার দিলে আপনি আরও বেশি দোকানটিতে আসবেন।

মূলত ডাটা অ্যানালাইসিস যারা করেন, তারা কাজ করেন অতীতের তথ্য নিয়ে। আর তা দিয়েই ভবিষ্যতের একটা সম্ভাব্য দৃশ্যপট তৈরি করে রাখেন। এতে ব্যবসার একটা পূর্ণাঙ্গ চিত্র উঠে আসে। দুর্বলতাগুলোও চিহ্নিত করা যায় সহজে।

এবার আসা যাক ডাটা অ্যানালিটিক্সে। এই পর্যায়ের কাজ হলো ভবিষ্যৎ নির্ধারণ। ধরা যাক, একটি দোকানে কোন কোন তারিখে বিক্রি কমে যায় সেটার কারণ বের করা হবে। এই তারিখে বিক্রি বাড়াতে কী করতে হবে সেটা নির্ধারণ করার সূত্রটি বের করবেন ডাটা অ্যানালিটিক্সে পারদর্শীরা।

ডাটা সায়েন্স শিখতে কী করতে হবে?

গণিতে জ্ঞান থাকা চাই। পাঠ্যবইয়ের জটিল সব সূত্র আর সমীকরণ শিখতে হবে বিষয়টা এমন নয়। প্রাথমিক গণিতের স্বচ্ছ ধারণা অবশ্যই থাকতে হবে।

দ্বিতীয়ত, স্ট্যাটিসটিক্স তথা পরিসংখ্যানে দক্ষ হওয়া জরুরি। সম্ভাবনা, নমুনায়ন, নানা ধরনের গড় ও বিভিন্ন বিন্যাস- এ সব সূত্র ও পদ্ধতিগুলো সম্পর্কে স্বচ্ছ জ্ঞানই আপনাকে অনেক ধাপ এগিয়ে নেবে।

মনে রাখতে হবে, এগুলো হলো প্রাথমিক প্রস্তুতি। একজন ভালো ডাটা সায়েনটিস্ট হতে চাইলে অবশ্যই পরিসংখ্যানের যাবতীয় সব বিষয়ে পারদর্শী হতে হবে। কারণ পরিসংখ্যানের কাজই হলো ডাটা নিয়ে।

তৃতীয়ত, পাইথন প্রোগ্রামিং ল্যাঙ্গুয়েজ শিখে নিতে হবে। কোডিংয়ের মাধ্যমে কীভাবে ডাটা অ্যানালাইসিস করতে হয় সেটা শেখা যায় পাইথনে। পাইথন ছাড়া ‘আর (R)’ ল্যাঙ্গুয়েজেও একই কাজ করা যায়। তবে আর্টিফিশিয়াল ইন্টেলিজেন্স ওরফে কৃত্রিম বুদ্ধিমত্তার সঙ্গে তাল মেলানোর জন্য পাইথন জানাটা বাড়তি যোগ্যতা।

কীভাবে শিখবেন?

ইউটিউবে অসংখ্য টিউটোরিয়াল পাবেন। অনেক প্রশিক্ষণ কেন্দ্রও আছে। অনলাইনে অনেক ফ্রি প্ল্যাটফর্ম আছে যেখানে ক্লাসের মতো করেই ডাটা সায়েন্স শেখা সম্ভব। মনে রাখতে হবে, ট্রেনিং হলো আপনাকে পদ্ধতিটি জানাবে। মূল শিক্ষাটা নিতে হবে নিজেকেই। নিজে নিজে সমস্যা তৈরি, সমাধানের বিকল্প পথ বের করা, এসব চর্চা করতে হবে নিয়মিত।

ডাটা অ্যানালাইসিস দিনে দিনে বসে ঘণ্টাখানেকের মধ্যে শেখার বস্তু নয়। ধৈর্য্য নিয়ে সিদ্ধান্ত নিতে হবে। ফোকাস ঠিক করে নিতে হবে আগে। ঠিক কী শিখতে চান, সেটা বের করতে হবে। এরপর সে অনুযায়ী পরিকল্পনা। প্রোগ্রামিংটা গণিতের পাশাপাশি শিখতে পারলে ভালো।

মনে রাখবেন, প্রোগ্রামিং ল্যাঙ্গুয়েজ কম্পিউটারের একটা ভাষা মাত্র- ডাক্তারি কিংবা রসায়নের মতো প্রচুর মুখস্ত রাখার বিষয় নয়। এই ভাষায় পারদর্শী হতে ধৈর্য্যটাই জরুরি। প্রতিষ্ঠিত ডাটা সায়েন্টিস্টরা বলেন, ডাটা সায়েন্সের জন্য দরকারি প্রোগ্রামিং ল্যাঙ্গুয়েজ শিখতে দিনে অন্তত এক ঘণ্টা চর্চা করা চাই।