কৃত্রিম বুদ্ধিমত্তা কীভাবে ‘দ্য গার্ডিয়ান’ পত্রিকায় প্রবন্ধ লিখলো

Artificial Intelligence বা AI হচ্ছে এই শতাব্দীর buzzword, যেমন গত শতাব্দীতে ছিল টেলিভিশন এবং শতাব্দীর শেষ দিকে এসে সেই জায়গা নিয়েছে কম্পিউটার। তো এখন আন্ডারগ্রাড শিক্ষার্থীর ভার্সিটির মামুলি প্রজেক্ট থেকে শুরু করে উন্নত চিকিৎসা প্রযুক্তি – সব ক্ষেত্রেই দেখবেন AI, মেশিন লার্নিং বা ডিপ লার্নিং এর উল্লেখ আছে। সেই সাথে সবার মনে একটা আশঙ্কা- কৃত্রিম বুদ্ধিমত্তা হয়তো মানুষের চেয়ে সুপিরিয়র হতে যাচ্ছে। ইলন মাস্কের মত ধনকুবের ব্যবয়াসী যেমন প্রায়ই বলেন, “কৃত্রিম বুদ্ধিমত্তা একদিন দুনিয়ায় একনায়কতন্ত্র কায়েম করবে”। সম্প্রতি দ্য গার্ডিয়ান একটা আর্টিকেল ছেপেছে, যেটার প্রায় পুরোটাই GPT-3 নামের Language Model দিয়ে জেনারেট করা। এখন এই লেখায় আমি একটি সহজ ব্যাখ্যা দিতে যাচ্ছি, কম্পিউটার এই কাজটা বুদ্ধিমানের মত করে কীভাবে। তারপর আলোচনা করবো, কৃত্রিম বুদ্ধিমত্তা কতটা সক্ষম হবে দুনিয়া দখলের। হয়তো সব কিছুর সোজাসাপ্টা ব্যাখ্যা দিতে আমি সক্ষম হবো না, কিন্তু লেখাটা আপনার চিন্তার খোরাক যোগাবে- এই আশা রাখছি।

বুদ্ধিমত্তার অনেক নির্দেশক আছে। মানুষের ক্ষেত্রে বুদ্ধিমত্তার অনন্য বৈশিষ্ট্য হচ্ছে ভাষার ব্যবহার। অর্থপূর্ণভাবে ভাষার ব্যবহারে আমরা আমাদের কথা কোথাও লিখে সংরক্ষণ করতে পারি, আবার বিমূর্ত (abstract) চিন্তাভাবনা অন্যদের কাছে প্রকাশও করতে পারি। ভাষা নিয়ে কম্পিউটার বিজ্ঞানে যে কাজ করা হয়, তার আদি নাম হচ্ছে Computational Linguistics, যেটা এখন অনেকটাই বাজারে চলছে Natural Language Processing বা NLP নামে।

NLP এর বহু প্রয়োগ আছে বাস্তব জীবনে। সাধারণত আমরা যেগুলো দেখি Google Assistant, Siri, Cortana এবং Alexa-তে। এই প্রযুক্তিগুলো আমাদের সাথে মানুষের মত কথোপকথন চালাতে সক্ষম। তো কীভাবে এই প্রযুক্তিগুলো মানুষের মত ভাষা রপ্ত করতে পারছে?

ভাষাগত দক্ষতা রপ্ত করার বিভিন্ন ধাপ আছে। উচ্চারণ শেখার পরের ধাপটা হলো একটি ভাষার বিভিন্ন শব্দ ব্যবহার করে একটা অর্থপূর্ণ বাক্য তৈরি করা। যেমন একটা বাক্য চিন্তা করা যাক, “সাকিব বিশ্বের সেরা অল-রাউন্ডার” – এই বাক্যটা বলতে আমাকে প্রতিটা শব্দ জায়গা মতো বসাতে হয়েছে। সেই সাথে এখানে একটা তথ্যও আছে। এই কাজটা একটা যন্ত্রকে দিয়ে বলানো রীতিমত চ্যালেঞ্জ। প্রথমত আপনাকে কম্পিউটারকে বোঝাতে হবে কোন শব্দের পর কোন শব্দ বসালে তা অর্থবহ হবে। তারপর প্রশ্ন-উত্তরের মাধ্যমে একটা অর্থবহ কথোপকথন চালানো তো আরও বড় চ্যালেঞ্জ।

কোন শব্দের পর কোন শব্দ বসানো উচিৎ এটা কম্পিউটারকে বোঝানোর জন্য বেশ কিছু মেথড গবেষকরা বের করেছে। আমরা কিন্তু খুব সহজেই এটা বুঝতে পারি। যেমন- ‘রাজা’ শব্দটির সাথে ‘রাণী’ শব্দটির একটা সম্পর্ক আছে, বা ‘মা’ শব্দের সাথে ‘বাবা’ শব্দের একটা সম্পর্ক আছে। আবার যদি আমি ক্রিকেট নিয়ে কথা বলি, তাহলে ‘ক্রিকেট’ শব্দটির সাথে ব্যাটসম্যান, বল, উইকেট, সাকিব, মুশফিক, ওয়ার্ল্ডকাপ ইত্যাদি শব্দের সম্পর্ক আছে। এগুলো আমরা সহজেই বুঝতেই পারি। কিন্তু অ্যালগরিদম দিয়ে কম্পিউটারকে বোঝাবো কী করে? এর একটা সহজ উপায় হচ্ছে শব্দগুলোকে ভেক্টরে রূপান্তর করা। আপনি যদি কলেজে পদার্থবিজ্ঞান বা গণিত পড়ে থাকেন তাহলে সহজেই বুঝবেন ভেক্টর কী জিনিস। ভেক্টর মূলত একটা দিক রাশি। অর্থাৎ একটা ভেক্টর শুধু একটা সংখ্যা মানই প্রকাশ করবে না, সেই সাথে একটা দিক বা ডিরেকশনও প্রকাশ করবে।

ধরি ‘বিড়াল’ শব্দটিকে ভেক্টরে প্রকাশ করলে এমন হয় [1, 5, 2]। আপনি এখন সহজেই ত্রিমাত্রিক (3D) কাঠামোতে এই ভেক্টরটি প্লট করতে পারবেন। তো এইক্ষেত্রে মাত্র তিনটা ডাইমেনশন থাকবে যাদের X, Y এবং Z অক্ষে ভাগ করা যায়। ত্রিমাত্রিক বলে হয়তো চিন্তা করা সহজ। কিন্তু যত বেশি ডাইমেনশন নেয়া যায়, দেখা যায় যে ফলাফল ততই ভাল আসে। আমি যখন বাংলা শব্দ নিয়ে কাজ করেছিলাম, তখন ডাটাসেটের প্রতিটি শব্দ ৩২ ডাইমেনশনে রূপান্তর করেছিলাম।

ভেক্টরে রূপান্তর করার সুবিধা হচ্ছে, আমরা সহজেই একটা ওয়ার্ড ভেক্টরের সাথে আরেকটা ওয়ার্ড ভেক্টরের দূরত্ব বা তাদের মধ্যে অন্তর্ভুক্ত কোণ বের করতে পারি। তাহলে তাদের মধ্যে সম্পর্ক কতটা তা ভালভাবে বোঝা যায়। যদি আপনি ভেক্টরগুলো গ্রাফে প্লট করেন, তাহলে দেখবেন যে একই ধরনের শব্দ কাছাকাছি অবস্থান নিচ্ছে। এতে করে কম্পিউটারকে শেখানোও সহজ হয়ে যায় কোন শব্দের পর কোন শব্দ বসানো যেতে পারে। এই ভেক্টরগুলো বের করার টেকনিকটাও বেশ মজার। প্রথমত নিজের ইচ্ছা মতো প্রতিটা শব্দের জন্য একটা ভেক্টর ধরে দেয়া হয়। তারপর একটা নিউরাল নেটওয়ার্কে প্রতিটা বাক্যের একেকটা শব্দকে ধরা হয়, আর তার আগে পিছের শব্দগুলোকে প্রেডিক্ট করতে দেয়া হয়। এভাবে একটা নিউরাল নেটওয়ার্ককে শেখানো হয় একটা শব্দের পর অন্য কী শব্দ আসতে পারে। এইভাবে নিউরাল নেটওয়ার্ক ট্রেইন করতে গিয়ে র‍্যান্ডমভাবে ধরে নেয়া ভেক্টরগুলো ঠিকঠাক কাজ চালিয়ে নেয়ার মতো ভেক্টরে রূপান্তর হয়।

শব্দগুলোকে ভেক্টরে রূপান্তর করলে তাদের মধ্যে সম্পর্ক সহজেই নির্ণয় করা যায়। দু’টি শব্দের ভেক্টরের অন্তর্ভুক্ত কোণের মান যত কম, শব্দ দু’টির মধ্যে সম্পর্ক তত বেশি।

 

এই কাজটার সাথে সম্ভাব্যতার (Probability) সম্পর্কও আছে। কম্পিউটার মূলত একটা শব্দের পর আরেকটা শব্দ প্রেডিক্ট বা অনুমান করছে আগে থেকে দেয়া ডাটা অনুসারে। গবেষকদের লক্ষ্য হচ্ছে এই অনুমানগত আউটপুট যতটা অর্থবহ করা যায়। এইখানে একটা গভীর সমস্যা আছে। এটাকে সীমাবদ্ধতা হিসেবেও দেখা যায়, আবার দার্শনিক সমস্যা হিসেবেও দেখা যায়। কম্পিউটার যে এরকম আউটপুট তৈরি করছে, তা কিন্তু অচেতনভাবে (unconsciously), অর্থাৎ কম্পিউটার নিজে ওই আউটপুট নিয়ে সচেতন নয়।

দার্শনিক জন সার্লে গত শতাব্দীতে এই সমস্যাটাকে সুন্দর একটি উদাহরণ দিয়ে উপস্থাপন করেছেন। উনি একটা আবদ্ধ রুমের কথা চিন্তা করেছেন। সেই রুমে একজন লোক বসা আছে, যার কাছে আপনি জানালা দিয়ে একটা ইংরেজি ডকুমেন্ট দিলে সে তা চাইনিজ ভাষায় অনুবাদ করে দিবে। কিন্তু টুইস্ট হচ্ছে, ওই রুমে থাকা লোকটা চাইনিজ ভাষা জানে না। তার কাছে একটা বই আছে যেখানে কিছু নিয়ম লেখা আছে। সেই নিয়মগুলো ঠিকভাবে অনুসরণ করলে একটা ইংরেজি ডকুমেন্টকে চাইনিজে রূপান্তর করা যাবে। কিন্তু যে লোকটা এই রুলগুলো ফলো করছে, তার কোনো ধারণাই নাই যে সেখানে আসলে কি হচ্ছে, আসলেই চাইনিজ ভাষায় রূপান্তর হচ্ছে কিনা। অর্থাৎ ঘরের ভিতর থাকা মানুষটা পুরো অচেতন (unconscious) এই প্রক্রিয়া সম্পর্কে। তারপরও ওই ঘরটা থেকে আমরা যথার্থ আউটপুট পাচ্ছি। ঘরটা একটা ব্লাকবক্স হিসেবে কাজ করছে এখানে। ঠিক আজকের দিনের কম্পিউটারের মত। যেখানে কম্পিউটারের নিজের কোন অনুভূতি নেই, সচেতনতা নেই তার কাজের ব্যাপারে, তারপরও আমাদের প্রশ্নের ঠিকাঠাক জবাব দিচ্ছে (GA, Siri, Contana এবং Alexa)। তখনকার সময়ে সার্লের এই প্রশ্নের জবাব অনেক কৃত্রিম বুদ্ধিমত্তার গবেষক দিতে চেষ্টা করেছে। তবে এটা এখনও একটা অমীমাংসিত সমস্যা। আর এই জন্য Artificial Intelligence বা কৃত্রিম বুদ্ধিমত্তার নাম নিয়েও অনেক গবেষকদের আপত্তি আছে। আজকে যেইসব প্রযুক্তি AI-এর নাম দিয়ে বিক্রি হচ্ছে, এগুলো মূলত AI না। সত্যিকারের AI পেতে এখনও অপেক্ষা করতে হবে আমাদের।

এখন প্রশ্ন হচ্ছে এরকম একটা অচেতন যন্ত্র বা সিস্টেম কি আসলেই আমাদের উপর প্রভুত্ব করতে পারবে?

এই পর্যায়ে আমাদেরকে একটু চোখ মেলে তাকাতে হবে বর্তমান জীবনযাপনের দিকে। আমরা কি ইতোমধ্যেই এরকম বুদ্ধিমান সিস্টেমের উপর নির্ভর করছি না? যেমন- গুগল ম্যাপে কম ট্রাফিকের রাস্তা খোঁজা থেকে শুরু করে ই-কমার্স সাইটে পছন্দ মত পণ্য খোঁজা, বা ফেসবুকে কোন ধরনের পোস্ট বেশি দেখবো, সেখান থেকে শুরু করে ইউটিউবের হোমপেজে পছন্দ মত সাজেশন আসা। বলতে গেলে এসবের পিছনে সেই তথাকথিত AI রয়েছে।

এখন একটা প্রযুক্তি কীভাবে ব্যবহার হবে সেটা কিন্তু দিন শেষে আমাদের উপরই নির্ভর করে। AI এর ব্যাপারটাও তেমন। আর AI তো শুধু কোনো ম্যাড সায়েন্টিস্টের গ্যারেজ প্রজেক্ট না। এইটার সাথে বিজনেস জড়িয়ে আছে। এই দিক থেকে স্টুয়ার্ট রাসেল খুব ভাল একটা উদাহরণ দিয়েছেন। মনে করুন, একসময় আমরা বাড়িতে গরু, ছাগল এবং বিড়ালের পাশাপাশি রোবটও পালা শুরু করলাম। কিন্তু এই রোবটগুলো অকর্মা বিড়ালগুলার মত নিশ্চয় খাবে আর পড়ে পড়ে ঘুমাবে না। এরা ঘরের কাজ করবে। ঘর পরিষ্কার করবে, রান্না করবে।

যদি এই রোবট আপনার সাথে আপনার বিড়ালের সম্পর্ক না বুঝতে পেরে আপনাকে সারপ্রাইজ দেয়ার জন্য ডিনারে বিড়াল রান্না করে সার্ভ করে? ব্যস! যত বিড়াল পোষা কাস্টমার আছে, ইন্ডাস্ট্রি তাদের নিমেষেই হারাবে। সমালোচনার ঝড় বয়ে যাবে। স্টকের দাম পড়ে যাবে। এই ধরণের ছোটখাটো কিন্তু আপাত সেন্সিটিভ প্রব্লেম সলভ না করে এরকম প্রোডাক্ট মার্কেটে চালাতে গেলে আসলে ব্যবসায় লালবাত্তি জ্বলতে টাইম লাগবে না। এরকম ছোটখাটো রিস্কের কথা চিন্তা করেই ইন্ডাস্ট্রি আগাচ্ছে, যেটা শুধু মানুষের জন্য ক্ষতিকর না, তাদের বিজনেসের জন্যও ক্ষতিকর। তাই AI-এর উপর কতোটা কন্ট্রোল দেয়া হবে, সেই ব্যাপারটা গবেষকদের চিন্তায় আছে।

“There’s also no better way to kill the field of AI than to have a major control failure, just as the nuclear industry killed itself through Chernobyl and Fukushima. AI will kill itself if we fail to address the control issue.”
— STUART J. RUSSELL

GPT-3 যে আউটপুট দিয়েছে দ্য গার্ডিয়ান পত্রিকায়, সেটা আসলেই অসাধারণ। বলতে গেলে বিজ্ঞানীরা একটা মাইলফলকে পৌঁছেছে একটা চমকপ্রদ প্রেডিক্টিভ আউটপুট জেনারেট করার ক্ষেত্রে। যদিও এই GPT-3 এর ব্যাপারটা নতুন কিছু না। অনেক বিশেষজ্ঞই বলছে যে, এর আগের ভার্সন থেকে খুব কমই তফাৎ আছে। তারপরও কিছুটা হলেও উন্নতি হয়েছে। কিন্তু কথা হচ্ছে – আউটপুটটা কি ক্রিয়েটিভ ছিলো? সেখানে কি এমন কোনো তথ্য ছিলো, যা আমাদের কাছে নতুন? বা এই আউটপুটের উপর ভিত্তি করে আমরা কি বাস্তবকি অর্থেই বলতে পারি, যন্ত্র সত্যিকার অর্থেই বুদ্ধিমান হয়ে উঠেছে?

এই  চিত্রে ছোট্ট লেখার প্রথম বাক্যটি ইনপুট দেয়া। বাকীটা GPT-2 দিয়ে জেনারেট করা। দ্য গার্ডিয়ানের মত বলতে গেলে রোবট লিখেছে। courtesy: huggingface

তবে একটা কথা নিশ্চিত যে, এই ধরণের মডেল প্রযুক্তিকে আরও উন্নত করছে। Google Mail-এ এরকম মডেল অনেক দিন ধরেই ব্যবহার হচ্ছে যা একটা মেইল লেখার সময় সামঞ্জস্যপূর্ণ ওয়ার্ড প্রেডিক্ট করে সাজেশন দেয়, কোডিং-এর ক্ষেত্রে পরবর্তি সিন্টেক্সের প্রেডিকশন দেয়। কিছু মডেল তো পুরো একটা ফাংশনই স্বয়ংক্রিয়ভাবে লিখে ফেলতে পারে। এই ধরনের মডেল আমাদের কাজকে সহজ করে দিচ্ছে। আমরাও এই ধরণের প্রযুক্তির হাতে নিজেদের কিছুটা সঁপে দিয়ে স্বাচ্ছন্দ্য বোধ করি। কারণ কিছু থেকে লাভবান হলে আমরা তা অবশ্যই গ্রহণ করবো। এখন কয়জন প্রস্তর যুগের ভোঁতা অস্ত্রশস্ত্র নিয়ে বনে জঙ্গলে কাটাতে চাইবে?

সমস্যাগুলোর এখনই আমরা যা দেখি AI এর ক্ষেত্রে, যেমনঃ রেসিজম এবং নারীবিদ্বেষ, এগুলোর জন্য অনেকটা আমরা consciousness বা সচেতনতার অধিকারী মানুষেরাই দোষী। অ্যামাজনের কর্মী নিয়োগ দেয়ার জন্য কৃত্রিম বুদ্ধিমত্তাসম্পন্ন সিস্টেমকে নারীদের প্রতি বৈষম্য করতে দেখা গেছে। খুবই স্বাভাবিক! কারণ এটাকে যেসব ডাটা দিয়ে ট্রেইন করা হয়েছিলো, তা ছিলো বায়াসড। সেই ডাটা নারীবিদ্বেষপূর্ণ কর্মস্থলের বাস্তবতাই তুলে ধরে। এমন ডাটার উপর ভিত্তি করে মেশিনকে কিছু প্রেডিক্ট করতে দিলে তো তা বায়াসড আউটপুট দিবেই। তবে এখন গবেষকরা এমন ডাটাসেটকে প্রসেস করে ডি-বায়াস করে নেয়ার কথা বলেন।

সব শেষে বলা যায়, কৃত্রিম বুদ্ধিমত্তাসম্পন্ন যেসব প্রযুক্তি বাজারে এখন পাওয়া যাচ্ছে, সেগুলো এখনও বেশ নির্বোধের পর্যায়ে পড়ে। আপনাকে বোকা বানিয়ে ওগুলো নিজেকে বুদ্ধিমান প্রমাণ করছে। অন্তত দার্শনিক মানদণ্ডে বাস্তবতা তাই। তবে আপনার জীবনে এখনই এইসব প্রযুক্তি অনেক প্রভাব ফেলছে, আর আপনি অনেক আগে থেকেই এইসব অত্যাধুনিক প্রযুক্তির উপর নির্ভরশীল হয়ে তাদেরকে আপনার জীবনের নিয়ন্ত্রণ একটু হলেও দিয়ে রেখেছেন। কিন্তু কীসের জন্য? মানসম্পন্ন সার্ভিস, স্বাচ্ছন্দ্য এবং সহজাত্য।

The Social Dilemma এবং ব্যক্তিগত অভিমত

এই লেখাটি যখন বিজ্ঞানযাত্রা ফেসবুক গ্রুপে পোস্ট করি, তার কিছুদিন আগেই নেটফ্লিক্সে The Social Dilemma নামে একটি ডকুমেন্টারি আসে। পোস্টের কমেন্ট বক্সের আলোচনায়ও এই ডকুমেন্টারির নাম এসেছিল। হয়তো ইতোমধ্যে আপনিও দেখে ফেলেছেন এই ডকুমেন্টারি। তাই প্রবন্ধে এই বিশেষ অংশটি রাখতেই হচ্ছে কিছু বিভ্রান্তি পরিষ্কার করার জন্য।

ডকুমেন্টারিতে মূলত সোশাল নেটওয়ার্ক আমাদের ব্যক্তিগত ডাটা ব্যবহার করে আমাদের জীবনের উপর কীরকম প্রভাব ফেলছে- তা তুলে ধরা হয়েছে। আমরা সবাই জানি, এখনকার সব সোশাল নেটওয়ার্ক সাইট কৃত্রিম বুদ্ধিমত্তার প্রয়োগে কুখ্যাত। সোশাল নেটওয়ার্কিং সাইটগুলো এমনভাবে আকর্ষণীয় ইউজার ইন্টারফেস এবং ইউজার এক্সপেরিয়েন্স ডিজাইন করছে যে তা আমাদের খুব সহজেই আসক্ত করে ফেলছে। আর আমরা যখন কোনো কিছুতে আসক্ত হয়ে পড়ি, তখন তা আমাদের জীবনে প্রভাব ফেলতে শুরু করে, আমরা নিজেদের উপর নিয়ন্ত্রণ হারিয়ে ফেলি। কিন্তু এখানে এমনভাবে সাধারণীকরণ করার কিছু নেই যে, AI আমাদের উপর প্রভুত্ব করছে। আগেই যেমনটা বলেছি, সত্যিকার অর্থেই আমরা কৃত্রিম বুদ্ধিমত্তা এখনও তৈরি করতে পারিনি। দিন শেষে কিছু জটিল এবং চমকপ্রদ অ্যালগরিদম ব্যবসায়ীদের ব্যাপকভাবে লাভ করার সুযোগ দিচ্ছে। একই অ্যালগরিদম রাজনৈতিক ব্যক্তিরা ব্যবহার করছে নিজেদের স্বার্থে। আমাদের বর্তমান সময়ের সব থেকে বড় সমস্যা হচ্ছে “ভুয়া খবর” এবং প্রোপাগান্ডা, যেগুলো রাজনৈতিক টুল হিসেবে বহুল ব্যবহৃত হচ্ছে। দিন শেষে দায় আমাদের সবার। আমাদের উচিৎ ভুয়া খবরের প্রতি দুর্বলতা থেকে নিজেদের মুক্ত রাখা। সেই সাথে বিশেষজ্ঞদের কাজ কিছুটা হলেও বুঝতে শেখা, যাতে এগুলোর যথার্থ প্রয়োগ সম্পর্কে আমরা সচেতন থাকতে পারি। একই প্রযুক্তি ক্যাট ফিল্টার দিয়ে আমাদেরকে ক্যামেরার সামনে বিড়াল বানাচ্ছে, আবার অন্যদিকে আমাদের রোগব্যাধি স্বয়ংক্রিয়ভাবে নির্ণয় করে চিকিৎসকদের সহায়তা করছে। কোনটা আপনার জীবনযাপন সত্যিকার অর্থেই উন্নত করছে তা ভেবে দেখা জরুরী।

_________________________________

বিভিন্ন শব্দকে যেভাবে ভেক্টরে রূপান্তর করা যায় এবং কিভাবে একটি শব্দের সাথে আরেকটি শব্দের সম্পর্ক কম্পিউটারকে বোঝানো যায় তার ব্যাখ্যা জানতে-

Understanding Vector Representation of Words with Keras

GPT-3 গবেষণা পত্র –

Language Models are Few-Shot Learners

Comments

আপনার আরো পছন্দ হতে পারে...

0 0 vote
Article Rating
Subscribe
জানান আমাকে যখন আসবে -
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x