🇧🇩 m365.show – Microsoft 365 কৃত্রিম বুদ্ধিমত্তা • ক্লাউড
🇧🇩 m365.show – Microsoft 365 কৃত্রিম বুদ্ধিমত্তা • ক্লাউড Podcast
Azure AI Foundry এর ফাঁদ - কেন বেশিরভাগই দ্রুত ব্যর্থ হয়
0:00
-11:58

Azure AI Foundry এর ফাঁদ - কেন বেশিরভাগই দ্রুত ব্যর্থ হয়

আপনি ক্লিক করেছেন কারণ পডকাস্ট বলেছে Azure AI Foundry একটি ফাঁদ, তাই না? ভালো – আপনি সঠিক জায়গায় আছেন। এখানে অগ্রিম প্রতিশ্রুতি দেওয়া হলো: গ্রাউন্ডিং (grounding) ছাড়া কপাইলটগুলি (copilots) ভেঙে পড়ে, কিন্তু রিট্রিভাল-অগমেন্টেড জেনারেশন (RAG) এর মতো টুলগুলি Azure AI Search – হাইব্রিড এবং সিমান্টিক উভয়ভাবে – এর সাথে গ্রাউন্ডেডনেস (groundedness), প্রাসঙ্গিকতা (relevance) এবং সঙ্গতি (coherence) এর জন্য মূল্যায়নকারী (evaluators) ব্যবহার করলে আপনার উত্তরগুলিতে বিভ্রম বা মিথ্যা তথ্য আসার ঝুঁকি কমে যায়। আমরা বিপণনের উপস্থাপনাগুলি এড়িয়ে যাব এবং মাঠের বাস্তব উদাহরণসহ বেঁচে থাকার হ্যান্ডবুক দেখাবো। M365.Show নিউজলেটারে সাবস্ক্রাইব করুন এবং MVP বিশেষজ্ঞদের সাথে লাইভস্ট্রিমগুলি অনুসরণ করুন – এইগুলি হল সেই জায়গা যেখানে সমস্যার ক্ষতচিহ্ন এবং তার সমাধানগুলি থাকে। আর যেহেতু প্রথম ফাটলগুলি সাধারণত মাল্টিমোডাল অ্যাপগুলিতে দেখা যায়, তাই আসুন আমরা সেখান থেকে শুরু করি।


২. কেন বাস্তব জগতে মাল্টিমোডাল অ্যাপগুলি ব্যর্থ হয়

যখন আপনি স্টেজে একটি মাল্টিমোডাল ডেমো দেখেন, তখন এটিকে ত্রুটিহীন মনে হয়। উপস্থাপক একটি টেক্সট প্রম্পট, একটি পরিষ্কার ছবি, এমনকি হয়তো একটি দ্রুত ভয়েস ইনপুট দেন এবং মডেলটি একটি নিখুঁত চার্ট বা একটি ধারালো চুক্তির সারাংশ সরবরাহ করে। পুরোটা জাদুর মতো মনে হয়। কিন্তু যেই মুহূর্তে আপনি একটি আসল কোম্পানির ভেতরে একই জিনিস চেষ্টা করেন, চকচকে ভাবটি দ্রুত দূর হয়ে যায়।

ডেমোগুলি চলে পরিষ্কার ইনপুট-এর উপর। কর্মক্ষেত্রগুলি চলে জাঙ্ক (আবর্জনা)-এর উপর। এটাই আসল বিভাজন: উৎপাদনে, কেউ আপনার মডেলকে সাবধানে সাজানো স্ক্রিনশট বা মানসম্পন্ন কমিটি দ্বারা ফর্ম্যাট করা CSV দেবে না। এইচআর (HR) এটিকে দাগযুক্ত সরকারি আইডি সরবরাহ করছে। প্রকিউরমেন্ট (Procurement) পিডিএফ ফাইল টেনে আনছে যা পঞ্চম প্রজন্মের ফ্যাক্স। ফিনান্সের কেউ ভাঙা অ্যান্ড্রয়েড ফোনের ক্যামেরা দিয়ে একটি বিলের ছবি তুলছে।

মাল্টিমোডাল মডেলগুলি টেক্সট, ছবি, ভয়েস এবং ভিডিও পরিচালনা করতে পারে, তবে বিশৃঙ্খল পরিস্থিতিতে কাজ করার জন্য তাদের ভালোভাবে ইনডেক্স করা ডেটা এবং রিট্রিভাল প্রয়োজন। অন্যথায়, আপনি মডেলকে কেবল আবর্জনার উপর ভিত্তি করে তাৎক্ষণিক উদ্ভাবন করতে বলছেন। এবং কোনো পরিমাণ জিপিইউ (GPU) খরচ “আবর্জনা প্রবেশ, আবর্জনা বহির্গমন” কথাটি ঠিক করতে পারে না।

এইখানেই রিট্রিভাল-অগমেন্টেড জেনারেশন, বা RAG আপনাকে রক্ষা করার কথা। মোদ্দা কথা: মডেল আপনার ব্যবসা সম্পর্কে জানে না, তাই আপনি এটিকে একটি জ্ঞানের উৎসের সাথে সংযুক্ত করেন। এটি ডেটার একটি অংশ পুনরুদ্ধার করে এবং তার চারপাশে উত্তরটি তৈরি করে। যখন মিলটি তীক্ষ্ণ হয়, আপনি সহায়ক, গ্রাউন্ডেড উত্তর পান। যখন মিলটি দুর্বল হয়, মডেলটি বন্য হয়ে যায়, আত্মবিশ্বাসী বাজে কথা উগরে দেয়। Azure AI Studio এবং Azure AI Foundry উভয়ই এই প্যাটার্নের উপর নির্ভর করে। তবে ফাঁদটি হলো RAG তার ডেটার মতোই ভালো

এখানে সেই গুরুত্বপূর্ণ বিষয়টি যা বেশিরভাগ দল মিস করে: আপনি কেবল একটি রিট্রিভাল পদ্ধতি প্লাগ ইন করে এটিকে “ভালো” বলতে পারবেন না। আপনি যদি ফলাফলগুলি দৃঢ়ভাবে ধরে রাখতে চান তবে আপনার কীওয়ার্ড এবং ভেক্টর সার্চের একটি হাইব্রিড অনুসন্ধান প্রয়োজন, যার উপরে একটি সিমান্টিক রি-র‍্যাঙ্কার (semantic re-ranker) যুক্ত করতে হবে। এটি Azure AI Search-এর মধ্যে অন্তর্নির্মিত। এটি সিস্টেমকে সিমান্টিক অর্থের সাথে আক্ষরিক কীওয়ার্ড হিটগুলিকে ভারসাম্য বজায় রাখতে দেয়। যখন আপনি এটিকে আপনার মাল্টিমোডাল সেটআপের সাথে সংযুক্ত করেন, তখন হঠাৎ মডেলটি বাঁকা স্ক্যান এবং ঝাপসা ছবি থেকে বাঁচতে পারে।

এখন, কেন এতগুলি স্থাপনা ব্যর্থ হয় সে সম্পর্কে কথা বলা যাক। সংস্থাগুলি প্রথম দিনেই পালিশ করা ফলাফল আশা করে কিন্তু মূল্যায়ন চক্রের জন্য বাজেট বরাদ্দ করে না। পটভূমিতে গ্রাউন্ডেডনেস, প্রাসঙ্গিকতা এবং সঙ্গতির জন্য পরীক্ষা ছাড়া, ব্যবহারকারীরা ইতিমধ্যেই হতাশ না হওয়া পর্যন্ত আপনি বিচ্যুতির বিষয়টি লক্ষ্য করেন না। এই কারণেই অনেক প্রথম দিকের নিয়োগ ব্যর্থ হয়: আউটপুটটি সঠিক মনে হয়, কিন্তু কেউ এটিকে উৎসের সত্যতার বিরুদ্ধে পরীক্ষা করে দেখেনি

ব্যর্থতা শেষ কথা হতে হবে না। Carvana হল একটি Foundry গ্রাহকের গল্প যা এই বিষয়টি প্রমাণ করে। তারা রিট্রিভাল টিউন করে, তাদের এজেন্টদের গ্রাউন্ড করে এবং অবজার্ভেবিলিটি (observability)-তে বিনিয়োগ করে স্ব-পরিষেবা AI-কে সত্যিই দরকারী করে তুলেছে।

সুতরাং, স্পষ্ট উপসংহারটি হলো: মাল্টিমোডাল AI ভেঙে পড়ে না কারণ AI “충분히 স্মার্ট নয় (충분히 스마트 নয়)” (충 যথেষ্ট স্মার্ট নয়)। এটি ভেঙে পড়ে কারণ ডেটা প্রস্তুত নয়, ইনডেক্স করা হয়নি বা পর্যবেক্ষণ করা হয়নি। রিট্রিভাল সিস্টেমে আবর্জনা খাওয়ান, মূল্যায়ন এড়িয়ে যান এবং দেখুন কীভাবে বিশ্বাস পুড়ে ছাই হয়। কিন্তু হাইব্রিড অনুসন্ধান, সিমান্টিক রি-র‍্যাঙ্কিং এবং অবিরাম চলমান মূল্যায়ন টুলস দিয়ে, আপনি এমন উত্তর দিয়ে বিল, চুক্তি এবং ছবি প্রক্রিয়া করতে পারেন যা কল্পনার পরিবর্তে বাস্তবে অবতরণ করে।

এবং একবার গ্রাউন্ডিং তৈরি হয়ে গেলে, অন্য একটি ঝুঁকি দেখা যায়। এইখানেই প্রশ্নটি ঘুরে যায়: এই সবকিছুর সমন্বয় সাধনকারী এজেন্টটি কি আপনার ব্যবসাকে সত্যিই সাহায্য করছে, নাকি এটি নীরবে আপনার আইটি বাজেটকে অর্থের আগুনে পুড়িয়ে ফেলার জন্য জ্বালানিতে পরিণত করছে?


৩. সহায়ক এজেন্ট নাকি ব্যয়বহুল ‘পেপারওয়েট’?

এজেন্ট (Agent) মডেল, ডেটা, ট্রিগার এবং কর্মের সমন্বয় সাধন করে – এটিকে আপনার স্বয়ংক্রিয় ওয়ার্কফ্লোর ট্র্যাফিক পুলিশ হিসাবে ভাবুন। এইখানেই বেশিরভাগ দল পিছলে যায়।

তাত্ত্বিকভাবে, এজেন্ট সোনালী মনে হয়। আপনি এটিকে নির্দেশনা দেন, আপনার ডেটা এবং অ্যাপ্লিকেশনগুলিতে নির্দেশ করেন এবং এর উচিত প্রক্রিয়াগুলি চালানো, উত্তরগুলি আনা এবং এমনকি ওয়ার্কফ্লো ট্রিগার করা। কিন্তু এটি নিখুঁত সহকর্মী নয়। এটি আপনার জন্য অপেক্ষা না করে জিনিসগুলি স্থির করে। এটি আক্ষরিকভাবে আপনার অস্পষ্ট নির্দেশাবলী অনুসরণ করে, এমনকি যখন ফলাফলগুলি অযৌক্তিক হয়। এই সময়েই “স্বয়ংক্রিয়তা” হয় আসল সময় বাঁচায়, নয়তো এমন গোলমালের মধ্যে পড়ে যা পরিষ্কার করতে আপনার দ্বিগুণ সময় লাগবে।

এখানে সেই পার্থক্য যা অনেকে মিস করে: কপাইলট (copilots) এবং এজেন্ট (agents) এক জিনিস নয়। কপাইলট মূলত একটি প্রম্পট বন্ধু। আপনি জিজ্ঞাসা করেন, এটি উত্তর দেয় এবং আপনি নিয়ন্ত্রণে থাকেন। এজেন্টরা, অন্যদিকে, আপনার জন্য অপেক্ষা না করে সিদ্ধান্ত নেয়

স্কোপ ছাড়া এজেন্টরা ভদ্রভাবে তাদের লেনে থাকে না। তারা অনুপ্রবেশ করে। তারা ঠিক করার জন্য সমস্যা উদ্ভাবন করে। তারা রেকর্ড নকল করে। তারা অন্তহীনভাবে ঘোরে

সত্যটি হল যে অনেক সংস্থা প্রাথমিক পর্যায়ে হোঁচট খায় কারণ তারা তাদের এজেন্টদের কখনোই কঠোরভাবে স্কোপ করেনি, কখনোই বৈধতা যাচাইয়ের ধাপ যোগ করেনি, এবং কখনোই টেলিমেট্রি (telemetry) ব্যবহার করেনি। সেই গার্ডরেলগুলি ছাড়া, আপনার চকচকে নতুন টুলটি কেবল প্রশাসনিক অধিকার সহ একটি বেপরোয়া ইন্টার্ন

এবং এখানে মাইক্রোসফ্ট আপনাকে অংশগুলি দিয়েছে। Copilot Studio হলো লো-কোড স্থান যেখানে নির্মাতারা এজেন্টের আচরণ ডিজাইন করে। তারপরে Azure AI Foundry’s Agent Service হলো এন্টারপ্রাইজ স্কেফোল্ডিং যা সেই এজেন্টদের অবজার্ভেবিলিটি সহ উৎপাদনে রাখে।

তাহলে, আপনি কীভাবে জানবেন যে আপনার এজেন্ট সহায়ক? এক: এটি কি মানুষের কাজের সময় কমায়, নাকি এটি আপনার কর্মীদের ডিবাগিংয়ের কাজে টেনে আনে? দুই: আপনি কি গ্রাউন্ডেডনেস, সাবলীলতা এবং সঙ্গতির মতো মেট্রিক্স ক্যাপচার করছেন? তিন: বিচ্যুতির আগে তা ধরার জন্য আপনার কি টেলিমেট্রি আছে?

বের হওয়ার পথ হল Azure AI Foundry-এর অন্তর্নির্মিত অবজার্ভেবিলিটি বৈশিষ্ট্য এবং মূল্যায়ন টুলগুলি ব্যবহার করা। এগুলি ঐচ্ছিক অ্যাড-অন নয়; এগুলি গ্রাউন্ডেডনেস, প্রাসঙ্গিকতা এবং সঙ্গতি পরিমাপের ডকুমেন্টেশন করা উপায়।


৪. স্বায়ত্তশাসিত এজেন্টের ফাঁদ

স্বায়ত্তশাসিত এজেন্টগুলি (Autonomous Agents) হলো সেই স্থান যেখানে হাইপ বিপজ্জনক হয়ে ওঠে। ফাঁদটি সহজ – তারা অনুমতির জন্য অপেক্ষা করে না। কপাইলটরা আপনার জন্য বিরতি দেয়। স্বায়ত্তশাসিত এজেন্টরা তা করে না। এবং যখন তারা একটি খারাপ সিদ্ধান্ত নেয়, তখন ক্ষতি অবিলম্বে হয় এবং আপনার ভাড়াটে (tenant) জুড়ে ছড়িয়ে পড়ে।

কপাইলটরা প্রতিক্রিয়াশীল, এজেন্টরা সক্রিয়। মাইক্রোসফ্ট এটাকে দক্ষতা হিসাবে তুলে ধরে। কিন্তু Copilot Studio-তে স্বায়ত্তশাসিত এজেন্টরা আজও প্রিভিউ (preview) পর্যায়ে রয়েছে। এবং এমনকি মাইক্রোসফ্টও বলে যে ব্যাপক স্থাপনার কথা ভাবার আগে আপনার লাইফসাইকেল গভর্নেন্স (lifecycle governance), নিরাপত্তা বেষ্টনী (guardrails), এবং Copilot কন্ট্রোল সিস্টেম থাকা দরকার।

তাহলে, বেঁচে থাকার চেকলিস্ট কী? যেকোনো দর্শনীয় স্বয়ংক্রিয়তার আগে তিনটি কাজ অবশ্যই করতে হবে: এক: পরিচয় এবং অ্যাক্সেসের স্কোপিং (scoping)। আপনার এজেন্টের ন্যূনতম অধিকার দিন। দুই: লগিং এবং রোলব্যাক (logging and rollback)। প্রতিটি ক্রিয়া একটি চিহ্ন রেখে যেতে হবে যা আপনি অডিট করতে পারেন। তিন: বিষয়বস্তু এবং আচরণ ফিল্টার। মাইক্রোসফ্ট এটিকে Azure AI Content Safety ব্যবহার করে নির্দেশ করে।

দায়িত্বশীল AI নৈতিকতা সম্পর্কেও। কল্পনা করুন একটি এইচআর এজেন্ট স্বয়ংক্রিয়ভাবে কর্মীদের “ঝুঁকিপূর্ণ” হিসাবে ফ্ল্যাগ করছে, বা একটি আর্থিক এজেন্ট এমন সরবরাহকারীদের অর্থপ্রদান আটকে দিচ্ছে যাদেরকে এটি ভুলভাবে প্রতারণা হিসাবে শ্রেণীবদ্ধ করেছে। এইগুলি হলো মানবিক প্রভাব সহ ব্যর্থতা যার আইনি এবং সম্মতিগত প্রভাব রয়েছে।

অবজার্ভেবিলিটি ঐচ্ছিক নয়। আপনার ড্যাশবোর্ড দরকার যা এজেন্টের প্রতিটি পদক্ষেপ দেখায় এবং মূল্যায়ন টুলস দরকার যা পরীক্ষা করে যে এর আউটপুট গ্রাউন্ডেড, প্রাসঙ্গিক এবং আপনার নীতির সাথে সঙ্গতিপূর্ণ কিনা। এবং আপনার “লুপের মধ্যে মানুষ” (human-in-the-loop) বিকল্পগুলি দরকার।

এখানে সঠিক উপমা হলো একজন টিনএজারকে গাড়ি চালাতে শেখার অনুমতি দেওয়া। আপনি চাবি হস্তান্তর করে সেরাটার জন্য আশা করেন না। আপনি যাত্রীর পাশে বসেন এবং তাকে সীমানা দেন। এটি হলো অনুশীলনে লাইফসাইকেল গভর্নেন্স


৫. Azure AI Foundry: আপনার কারখানা নাকি আপনার মাইনফিল্ড?

Azure AI Foundry হলো মাইক্রোসফটের নতুন প্রধান ব্যানার – AI সম্পর্কিত সবকিছুর জন্য তথাকথিত “কারখানা”। সমস্যা? অনেক দল ভেতরে প্রবেশ করে এবং এটিকে IKEA-এর মতো আচরণ করে। তারা নির্দেশনা ছাড়াই মডেল এবং সংযোগকারীগুলিকে একসাথে ফেলে দেয়। যা তারা শেষ পর্যন্ত পায় তা কোনো এন্টারপ্রাইজ AI সিস্টেম নয় – এটি একটি ডেমো-গ্রেডের খেলনা যা প্রথম ব্যবহারকারীর কাছেই ভেঙে পড়ে।

Foundry হলো একটি কারখানার ফ্লোর, এটি আপনার হ্যাকাথনের খেলার বাক্স নয়। এর অর্থ হলো পরিচয়ের সীমানা সেট করা, প্রতিটি ফ্লোর জুড়ে বিষয়বস্তুর নিরাপত্তা ঢেকে দেওয়া এবং অবজার্ভেবিলিটি ব্যবহার করা।

এখানে বিলিং ফাঁদটি রয়েছে: Foundry-এর মূল্য ব্যবহার-ভিত্তিক (consumption-based) এবং আপনি ব্যবহার করেন এমন নির্দিষ্ট পরিষেবাগুলির সাথে আবদ্ধ। প্রতিটি সংযোগকারী, প্রতিটি রিট্রিভাল কল, প্রতিটি বার্তা আপনার ভাড়াটে (tenant)-এর বিরুদ্ধে বিল করা হয়। আপনি যদি খরচ অনুমান না করেন এবং ব্যবহার ট্র্যাক না করেন, তবে আপনার আর্থিক দল আপনার সারপ্রাইজ বিল দেখে “খুশি” হবে।

আসল হত্যাকারী: দলগুলি মূল্যায়ন পাইপলাইন ছাড়া প্রোটোটাইপকে উৎপাদনে ঠেলে দেয়। আপনি যদি গ্রাউন্ডেডনেস, সাবলীলতা, প্রাসঙ্গিকতা এবং সঙ্গতির জন্য মূল্যায়ন টুলগুলি এড়িয়ে যান, তবে আপনি অন্ধভাবে স্থাপন করছেন।

উত্তরটি প্ল্যাটফর্মে রয়েছে। প্রথম দিন থেকেই Azure AI Foundry Observability ব্যবহার করুন। প্রম্পট ফ্লো (Prompt Flows) এ প্লাগ করুন। প্রতিটি পরীক্ষায় অন্তর্নির্মিত মূল্যায়ন টুলগুলি চালান। লাইভ হওয়ার কথা ভাবার আগেই হাইব্রিড অনুসন্ধান এবং সিমান্টিক রি-র‍্যাঙ্কিং ব্যবহার করে Azure AI Search দিয়ে আপনার সিস্টেমকে গ্রাউন্ড করুন


৬. দায়িত্বশীল AI নাকি দায়িত্বশীল মাথাব্যথা?

দায়িত্বশীল AI একটি অনুপ্রেরণামূলক দর্শন নয় – এটি হলো কনফিগারেশন, অডিট, ফিল্টার এবং গভর্নেন্স ধাপ, যা সার্ভার রক্ষণাবেক্ষণের মতো মনে হয়। দায়িত্বশীল AI হলো সিট বেল্ট, স্পোর্টস কার নয়

এটি এড়িয়ে যাওয়ার কুৎসিত সংস্করণ? ভাড়াটের স্কোপিং ছাড়া সরাসরি আপনার এইচআর রিপোজিটরিতে একটি বট প্লাগ করা। বটটি “দয়া করে” কর্মীদের বেতন স্কেল চ্যাটে পোস্ট করে দেয়। এখন আপনার গোপনীয়তা লঙ্ঘন হয়েছে।

কী এই গোলমালকে দূরে রাখে? Azure AI Content Safety দিয়ে শুরু করুন। তারপরে Foundry এবং Copilot Studio মূল্যায়ন পাইপলাইন যোগ করে যা গ্রাউন্ডেডনেস চেক, প্রাসঙ্গিকতা স্কোরিং এবং ব্যাখ্যাকরণ (explainability) পরিচালনা করে।

আসল সমাধান হলো লাইফসাইকেল গভর্নেন্স: পরীক্ষা → অনুমোদন → প্রকাশ → অডিট → পুনরাবৃত্তি। প্রতিটি চক্রে চেকপয়েন্ট সহ, এটি শিরোনামে আসার আগে আপনি বিচ্যুতিটি ধরতে থাকেন।

কিছু প্রশাসক অভিযোগ করেন যে “দায়িত্বশীল” মানে কেবল “ধীর”। ভুল ধারণা। দায়িত্বশীল গতিকে মেরে ফেলে না, এটি আপনাকে মেরে ফেলা থেকে গতিকে রক্ষা করেভালো গভর্নেন্স মানে আপনি আসলে অডিট থেকে বাঁচতে পারেন এবং এখনও আপনার প্রকল্পগুলি সচল রাখতে পারেন।


৭. উপসংহার

এখানে চূড়ান্ত কথা: ফাঁদটি Foundry বা Copilot Studio নয় – এটি হলো এই ভাবনা যে তারা প্লাগ-এন্ড-প্লে (plug-and-play)। মনে রাখার সহজ বিষয় হলো: শাসন প্রথম, পরীক্ষা দ্বিতীয়, উৎপাদন সবশেষে। নিজের ঝুঁকিতে পরিচয় এবং পর্যবেক্ষণযোগ্যতা এড়িয়ে যান। টুলগুলি আছে, কিন্তু শুধুমাত্র শাসন (governance) প্রোটোটাইপগুলিকে আসল উৎপাদনে পরিণত করে।

সুতরাং, আপনি যদি সেই স্পষ্ট ফিক্সগুলি চান যা আপনার ভাড়াটিকে আসলে বাঁচিয়ে রাখে: পডকাস্টে সাবস্ক্রাইব করুন এবং আমাকে একটি রিভিউ দিন – আমি প্রতিদিন এতে সময় দিই এবং আপনার সমর্থন সত্যিই সাহায্য করে।

টুলগুলি পরিবর্তিত হবে; বেঁচে থাকার কৌশলগুলি টিকে থাকে

Discussion about this episode

User's avatar