ঢাকা শনিবার, ০২ মার্চ ২০২৪

এআই: ভারতে হচ্ছে ১২১ ভাষার ডেটাবেজ

এআই: ভারতে হচ্ছে ১২১ ভাষার ডেটাবেজ

ছবি: ডয়েচে ভেলে

অনলাইন ডেস্ক

প্রকাশ: ০৬ ডিসেম্বর ২০২৩ | ২০:০৮ | আপডেট: ০৬ ডিসেম্বর ২০২৩ | ২২:৩৫

ভারতে চালু ১২১টি ভাষার মানুষের কাছে অনুবাদের মাধ্যমে পৌঁছে যাবে যে কোনো তথ্য। নির্ভরশীলতা কমবে ইংরেজির উপর। খবর ডয়েচে ভেলের

দক্ষিণ ভারতের রাজ্য কর্ণাটকের একটি গ্রামের মানুষ কয়েক সপ্তাহ ধরে একটার পর একটা বাক্য কন্নড় ভাষায় বলে যাচ্ছিলেন। আর তা একটি অ্যাপে তুলে নেয়া হচ্ছিল। এই অ্যাপটি হলো টিবি-র জন্য দেশের প্রথম কৃত্রিম মেধা বা এআই-ভিত্তিক চ্যাটবট।

ভারতে চার কোটি মানুষ কন্নড় বলেন। দেশের ২২টি স্বীকৃত সরকারি ভাষার মধ্যে কন্নড় একটি। ভারতে এমন ১২১টি ভাষা আছে, যা ১০ হাজার বা তার বেশি মানুষ ব্যবহার করেন। কিন্তু খুব কম ভাষাই ন্যাচরাল ল্যাঙ্গুয়েজ প্রসেসিং (এনএলপি)-তে আছে।

এনএলপি হলো এআই-এর একটি শাখা, যার মাধ্যমে কম্পিউটার কথ্য ও লিখিত ভাষা বুঝতে পারে। তাই এনএলপি-তে তথ্য না থাকলে সেই ভাষাকে কম্পিউটার বা নেটবাহিত বিভিন্ন মাধ্যম মানুষের কাছে পৌঁছে দিতে পারে না। ফলে কোটি কোটি ভারতীয় নিজের ভাষায় প্রয়োজনীয় তথ্য জানা থেকে বঞ্চিত হচ্ছেন এবং আর্থিক সুবিধাও পাচ্ছেন না।

এবার এই খামতিটুকু দূর করতে উদ্যোগী হয়েছে, মাইক্রোসফট, গুগলের মতো সংস্থাগুলি। তারা ১২১টি ভারতীয় ভাষায় লিখিত ও কথ্য ডেটা সংগ্রহ করছে, যার মাধ্যমে নিজের ভাষায় সব তথ্য ভারতীয়দের কাছে পৌঁছে যায়।

মাইক্রোসফট রিসার্চ ইন্ডিয়ার প্রধান গবেষক কালিকা বালি বলেছেন, ‘‘কৃত্রিম মেধাভিত্তিক টুলগুলিকে যদি সকলের কাছে পৌঁছাতে হয়, তাহলে ইংরেজি, ফরাসি, স্প্যানিশ ভাষার বাইরের মানুষদের কাছে যেতে হবে।'' 

কালিকা বলেন,‘‘ভারতীয় ভাষাগুলির যদি বিশাল ডেটাবেস তৈরি করতে হয়, তাহলে ১০ বছর সময় লেগে যাবে। তাই আমরা পর্যায়ক্রমে কাজটা করতে পারি। চ্যাটজিপিটি ও লামার মতো এআই মডেলের সাহায্যে তা করা সম্ভব।''

মাইক্রোসফট বা গুগলের জন্য ডেটা বা তথ্য সংগ্রহ করছে টেক ফার্ম কারিয়া। কর্ণাটকের ওই গ্রামের মানুষের মতো বিভিন্ন জায়গায় মানুষরা তাদের ভাষায় সমানে কথা বলছেন। তা রেকর্ড করা হচ্ছে। পরে শিক্ষা, স্বাস্থ্য ও অন্য পরিষেবার ক্ষেত্রে এই তথ্য ব্যবহার করবে কৃত্রিম মেধা ভিত্তিক টুলগুলি।

আরও পড়ুন

×