- বাংলাদেশ
- সংকটেও গবেষণায় ঘটছে অগ্রগতি
সংকটেও গবেষণায় ঘটছে অগ্রগতি

প্রযুক্তির সঙ্গে তাল মিলিয়ে বাংলা ভাষা ব্যবহারে নানা জটিলতায় পড়তে হয়। এর জন্য প্রধানত বাংলায় নির্দিষ্ট ফন্ট না থাকা, ফন্টের বিভিন্ন ধরনের সাইজ ও যুক্তাক্ষরকে দায়ী করা হয়। আগে শুধু রোমান হরফে বাংলা লেখা হতো। তবে অনলাইনে ইউনিকোড ফন্ট ব্যবহারের কারণে বর্তমানে বাংলা বর্ণমালায় লেখার হার অনেক বেড়েছে। কিন্তু বাংলা ব্যবহারে প্রযুক্তিগত সমন্বিত কাঠামো এখনও তৈরি হয়নি। গবেষকদের মতে, বাংলা ভাষার নিজস্ব ধরন (স্টাইল) এবং করপাস অর্থাৎ ডিজিটাল বৃহৎ শব্দভান্ডার নির্ধারণ করা প্রয়োজন। সংকটগুলো চিহ্নিত হলে সমাধানও বের হবে।
প্রযুক্তিতে ইংরেজির ব্যবহার বহু গুণে বেড়েছে। চাইলেই এখন গুগলসহ বিভিন্ন মাধ্যমে ইংরেজি ভাষা অনুবাদ করা যায়। ইংরেজি লেখা স্ক্যান করে বা মুখে বলে মুহূর্তেই ফন্টগুলো টেক্সটে (অক্ষরে) পরিণত করা সম্ভব হচ্ছে। তবে বাংলা ভাষা ব্যবহারকারীদের এসব সুযোগ-সুবিধা এখনও পরীক্ষামূলক পর্যায়ে রয়েছে। ব্যক্তি উদ্যোগ ও গুগলের মাধ্যমে কিছু ক্ষেত্রে এসব সুযোগ-সুবিধা মিললেও তা সীমিত। এগুলোর প্রযুক্তিগত সুবিধা মানোত্তীর্ণ হয়নি।
এ প্রেক্ষাপটে বিশ্বের বাংলাভাষী ৩৫ কোটি মানুষের কথা চিন্তা করে সরকার সমন্বিত কাঠামোর আওতায় বিশ্বজনীন ফন্টসহ করপাস (শব্দভান্ডার) তৈরির উদ্যোগ নিয়েছে। এ লক্ষ্যে এরই মধ্যে বাংলা একাডেমি স্বীকৃত প্রমিত বাংলা ভাষার একই সাইজের ফন্ট, বাংলা থেকে ১০টি ভাষায় যান্ত্রিক অনুবাদের বিভিন্ন সার্ভিস, টাইপ করা ও হাতের লেখা স্বয়ংক্রিয়ভাবে শনাক্তকরণ ও কম্পোজ, কথা থেকে লেখায় রূপান্তর সফটওয়্যার, জাতীয় কি-বোর্ডের (বাংলা) উন্নয়ন, বাংলা ফন্ট রূপান্তর ইঞ্জিন, বাংলা বানান ও ব্যাকরণ সংশোধন উন্নয়ন, স্ট্ক্রিন রিডার সফটওয়্যার উন্নয়ন, ওয়েব ও সফটওয়্যারে ব্যবহূত পরিভাষা, ইমোজিন লোকালাইজেশনসহ ১৬ ধরনের পদ্ধতিগত সফটওয়্যার, টুলস ও রিসোর্স উন্নয়নে কাজ শুরু করছে। কয়েকটি টুল তৈরি এরই মধ্যে শেষ হয়েছে। চলতি বছর থেকে পর্যায়ক্রমে পরীক্ষামূলকভাবে এসব সফটওয়্যার, টুলস ও রিসোর্স ব্যবহারের জন্য উন্মুক্ত করার কথা রয়েছে।
তথ্যপ্রযুক্তি মন্ত্রণালয়ের আওতায় আইসিটি ডিভিশন, বাংলাদেশ কম্পিউটার কাউন্সিল (বিসিসি) ও বাংলা ভাষা সমৃদ্ধকরণ প্রকল্প যৌথভাবে এসব কাজ করছে।
এর প্রকল্প পরিচালক মাহবুব করিম সমকালকে বলেন, ব্যবহারকারীদের মতামতের ভিত্তিতে পরীক্ষামূলক ভার্সন আরও উন্নয়নের মাধ্যমে সর্বজনীন ব্যবহারের উপযোগী করা হবে। এটি সফল হলে বিশ্বের অন্যান্য ভাষার সঙ্গে বাংলা ভাষাভাষীদের দূরত্ব কমে আসবে।
বাংলা ভাষা সমৃদ্ধকরণ প্রকল্পের আওতায় ২০১৭ সালের এপ্রিলে তথ্যপ্রযুক্তিতে বাংলা ভাষার উন্নয়নে কার্যক্রম শুরু হয়। ১৬ ধরনের পদ্ধতিগত সফটওয়্যার, টুলস ও রিসোর্স উন্নয়নের জন্য তিন বছরের লক্ষ্যমাত্রা নির্ধারণ হলেও তা এখনও চলছে। প্রকল্পের মেয়াদ দুই দফা বেড়েছে। ২০২৪ সালে জুনে এ প্রকল্পের কার্যক্রম শেষ হওয়ার কথা।
ঢাকা বিশ্ববিদ্যালয়ে তথ্যপ্রযুক্তি ইনস্টিটিউটের অধ্যাপক বিএম মইনুল হোসেন সমকালকে বলেন, সরকারের অন্যান্য প্রকল্প থেকে বাংলা ভাষা উন্নয়নের গবেষণা প্রকল্পটি ভিন্ন। এই প্রকল্পটি এগিয়েছে গবেষণার ভিত্তিতে। সারাবিশ্বেই এ ধরনের গবেষণা প্রকল্প বাস্তবায়ন সময়সাপেক্ষ। তাঁর মতে, বাংলা ভাষা অত্যন্ত বৈচিত্র্যময়। এটিকে প্রযুক্তির মাধ্যমে উপস্থাপন করা তুলনামূলক দুরূহ।
তথ্যপ্রযুক্তি সংশ্নিষ্ট গবেষকরা বলছেন, বাংলার বিভিন্ন ফন্ট বিভিন্ন সংখ্যক গিলফ (ক্যারেক্টার) সহযোগে তৈরি হয়েছে। কোনো ফন্টের গিলফের সংখ্যা বেশি, কোনোটায় কম। এক ফন্ট থেকে অন্য ফন্টে কনভার্ট করার সময়ও ভেঙে যায়। আবার ভিজুয়াল দিক থেকে বাংলা ফন্টগুলোর সমস্যা প্রকট। বিশেষ করে চন্দ্রবিন্দুর অবস্থান নিয়ে বিতর্ক রয়েছে। চন্দ্রবিন্দু কি আকারের ওপর বসবে নাকি বর্ণের ওপরে বসবে- এ বিষয়ে দুই রকম ব্যবহার দেখতে পাওয়া যায়। বাংলা প্যারাগ্রাফ-ফন্টগুলোর মধ্যে সমন্বয় নেই। কোনো ফন্টের বার সাইজ অন্য ফন্টের বার সাইজ থেকে ভিন্ন। আবার ইন্টার-লাইন স্পেসিং বা দুই লাইনের মাঝে ফাঁক থাকার পরিমাণের বিভিন্ন রূপ দেখতে পাওয়া যায়। ল্যাটিন, অ্যারাবিক ও ইন্ডিক স্ট্ক্রিপ্টের সঙ্গে বাংলা ফন্টের সাইজেরও অসামঞ্জস্য দেখতে পাওয়া যায়। এসব কারণে বাংলা ভাষার সমন্বিত কাঠামো প্রয়োজন।
অগ্রগতি: তথ্যপ্রযুক্তিতে বাংলা ভাষার উন্নয়নে বাংলাদেশ ন্যাশনাল করপাস (বিডিএনসি) অর্থাৎ বাংলা ভাষার ইলেকট্রনিক শব্দভান্ডার তৈরির কার্যক্রম শুরু করেছে সরকার। ব্রিটিশ ন্যাশনাল করপাস এবং আমেরিকান ন্যাশনাল করপাসের আদলে এটি তৈরির কাজ চলছে। করপাসে প্রায় ৩০০ কোটি বাংলা শব্দ অন্তর্ভুক্ত হবে। এ ছাড়া বাংলা শব্দ ও বাক্যে বানান ভুল ও শনাক্তের জন্য স্পেলচেকারের আওতায় প্রায় ৯ লাখ শব্দ ও এর নানারূপ যুক্ত করা এরই মধ্যে শেষ হয়েছে।
সরকারি উদ্যোগে আরও তৈরি হচ্ছে 'ব্যানব্রেইন: বাংলা ল্যাঙ্গুয়েজ মডেল'- এর মাধ্যমে তথ্যপ্রযুক্তি ব্যবহারে একটি বাক্য দিলে তার পরবর্তী বাক্য কৃত্রিম বুদ্ধিমত্তার মাধ্যমে পরামর্শ দেবে। আরও রয়েছে বাংলা ডাটা ড্রাইভেন অভিধান, বাংলা ট্রিব্যাংক :অ্যানোটেটেড করপাস, বাংলা সার্চ ইঞ্জিন সমুদ্র তৈরির কার্যক্রম।
বাংলা ভাষার উন্নয়ন প্রসঙ্গে অধ্যাপক ড. জাফর ইকবাল বলেন, "আমরা যারা বাংলা নিয়ে কাজকর্ম করি, তাঁরা সবাই জানি, তথ্যপ্রযুক্তি জগতের মহাশক্তিশালী প্রতিষ্ঠান 'গুগল' বাংলা ভাষা নিয়ে কাজ করে যাচ্ছে। আমরা হাভাতের মতো তাদের কাজের ওপর নির্ভর করে আছি। কিন্তু আমরা যদি তাদের ওপর পুরোপুরি নির্ভর করি তাহলে আমাদের নিজস্ব প্রযুক্তি কখনোই দাঁড়াবে না। কাজেই বাংলা ভাষার প্রযুক্তি নিয়ে আমাদের আরও বেশি আগ্রহী হতে হবে। আমাদের মাতৃভাষা নিয়ে গবেষণার কাজটি আমাদেরই করতে হবে। এই বিষয়টি আমরা যত তাড়াতাড়ি বুঝব, ততই মঙ্গল।"
মন্তব্য করুন