গুগল অনুবাদ কার্যক্রম


তথ্যানুসন্ধানে যাঁরা প্রায়ই ইন্টারনেট ব্যবহার করে থাকেন, তাঁদের একটি বিরাট অংশ প্রায়ই বিদেশী ভাষায় লিখিত তথ্যাদি পাঠ করতে না পারার জন্য অসহায় বোধ করেন। এক্ষেত্রে আরবি, স্প্যানিশ, জার্মানির মতো ভাষা তো বটেই আমাদের দেশে দীর্ঘদিন ধরে প্রচলিত ইংরেজি ভাষাতেও অনেকই হোচট খান। একজন বাঙালি  ইংরেজিটা ভালো জানেন না, এতে লজ্জা নেই, কিন্তু বিশ্ব-তথ্য ভাণ্ডার থেকে প্রয়োজনী তথ্য আহরণের জন্য বাঙালিকে ইংরেজি ভাষার কাছে যেতেই হয়, এক্ষে্ত্রে লজ্জার কোনো অবকাশ নেই। তারপরেও স্কুল থেকে বিশ্ববিদ্যালয় পর্যন্ত দৌড়েও অনেকে কোনো তথ্যই ইংরেজি থেকে যথাযথভাবে উদ্ধার করতে পারেন না। এই সমস্যা শুধু আমাদের নয়, পৃথিবীর অধিকাংশ মানুষ শুধু ভাষাগত প্রতিবন্ধকতার জন্য আধুনিক শিক্ষা গ্রহণ করতে পারছেন না। এ কারণেই অনেকেই ইন্টারনেটের অবাধ তথ্য প্রবাহ থেকে বঞ্চিত হচ্ছেন।

ইতিমধ্যে বেশ কিছু প্রতিষ্ঠান এই অসুবিধা দূর করার জন্য বিভিন্ন সময়ে বিভিন্ন ধরনের উদ্যোগ নিয়েছে, তারপরেই ভাষাগত এই সমস্যা দূর হয় নি। ইন্টারনেটের বিবিধ হট্টগোলের মধ্যে গুগলের (মার্কিন যুক্তরাষ্ট্রভিত্তিক ইন্টারনেট এবং সফ্‌ট্‌ওয়্যার পরিসেবামূল একটি প্রতিষ্ঠান) এই রকমই একটি উদ্যোগ হলো- গুগল অনুবাদ কার্যক্রম।

ইন্টারনেট ব্যবহারকারীদের ভিতর এমন একজনও হয়তো পাওয়া যাবে না, যিনি গুগল-এর নাম শোনেন নি। গুগলের বিভিন্ন ধরনের ইন্টারনেটভিত্তিক পরিসেবার ভিতরে সর্বাধিক জনপ্রিয় সংযোজন হলো- গুগল অনুসন্ধান। যাতে এখন অন্যান্য ভাষার পাশাপাশি বাংলাও ব্যবহার করা যাচ্ছে। সম্প্রতি এর সাথে যুক্ত হয়েছে 'বাংলা থেকে বিদেশী ভাষা' এবং 'বিদেশী ভাষা থেকে বাংলা' অনুবাদের সুযোগ । গুগলের এই পরিসেবা আপাতত একদম বিনামূল্যে দিচ্ছে। আর এর প্রধান লক্ষ্য হলো যেকোন ওয়েব পৃষ্ঠা বা নথি এক ভাষা থেকে অন্য ভাষায় অনুবাদ করা।

গুগলের অনুবাদক কার্যক্রমের ক্রমধারা
গোড়ার দিকে গুগল কম্পিউটার-ভিত্তিক এই অনুবাদ কার্যক্রম শুরু করেছিল ফরাসি, জার্মানি, স্প্যানিশ ও ইংরেজি ভাষার জন্য। দ্বিতীয় ধাপে যুক্ত করেছিল পর্তুগিজ ও ডাচ ভাষা। তৃতীয় ধাপে শুধু ইতালিয়ান ভাষার উন্নয়ন করেছিল। চতুর্থ ধাপে প্রথম তিনিটি এশিয়ার ভাষা যুক্ত করেছিল। এই তিনটি ভাষা ছিল চীনা, জাপনি এবং কোরিয়ান। এগুলোর সবই ছিল ঘরোয়াভাবে পরীক্ষামূলক।

পঞ্চম ধাপে ২০০৬ খ্রিষ্টাব্দের ২৮ এপ্রিলে গুগল ইন্টারনেট ভিত্তিক এই পরিসেবার সাথে যুক্ত করেছিল আরবি ভাষা। এরপর ষষ্ঠ ধাপে (ডিসেম্বর, ২০০৬ খ্রিষ্টাব্দ ) যুক্ত করে রুশ ভাষা। সপ্তম ধাপে (ফেব্রুয়ারি, ২০০৭ খ্রিষ্টাব্দ) প্রথাগত চীনার সাথে ইংরেজি ভাষার একটি সরল অনুবাদ কার্যক্রম যুক্ত করে। অষ্টম ধাপে (অক্টোবর, ২০০৭ খ্রিষ্টাব্দ) ২৫ জোড়া ভাষার জন্য অনুবাদ কার্যক্রম চালু করতে সক্ষম হয়। নবম অধ্যায়ে এর সাথে যুক্ত হয় হিন্দি ভাষা। এই ধাপ পর্যন্ত শুধু ইংরেজির সাথে এই ভাষাগুলোর অনুবাদ করা সম্ভব হতো। কিন্তু দশম ধাপে (মে, ২০০৮ খ্রিষ্টাব্দ) যে কোনো দুটি ভাষার ভিতরে অনুবাদ করার সুযোগ তৈরি করা হলো। এর সাথে যুক্ত হলো নতুন ১০টি ভাষা। এই ভাষাগুলো হলো- ক্রোয়েশিয়ান, গ্রিক, চেক, ড্যানিশ, নরওয়েজিয়ান, পোলিশ, ফিনিশ, বুলগেরিয়ান, রুমানিয়ান এবং সুইডিশ। একাদশ ধাপে (২৫ সেপ্টেম্বর, ২০০৮ খ্রিষ্টাব্দ) যুক্ত হলো আরও ১১টি ভাষা। এই ভাষাগুলো হলো- ইউক্রেনিয়ান, ইন্দোনেশিয়ান, ক্যাটালান, ফিলিপিনো, ভিয়েথনামিজ, লিথুনিয়ান, ল্যাটভিয়ান, শ্লোভাক, শ্লোভেনি, সার্বিয়ান, এবং হিব্রু। দ্বাদশ ধাপে (৩০ জানুয়ারি, ২০০৯ খ্রিষ্টাব্দ ) যুক্ত হলো ৭টি ভাষা। এই ভাষাগুলো হলো- আলবেনিয়ান, এস্তোনিয়ান, গ্যালিসিয়ান, হাঙ্গেরিয়ান, মাল্টিজ, থাই ও তুর্কি। ত্রয়োদশ ধাপে (১৯ জুন, ২০০৯ খ্রিষ্টাব্দ) একটি মাত্র ভাষা যুক্ত হয়। এই ভাষাটি ছিল ফার্সি। চতুর্দশ ধাপে (২৪ আগষ্ট ২০০৯ খ্রিষ্টাব্দ) যুক্ত হয় নয়টি ভাষা। এই ভাষাগুলো ছিল- আফ্রিকানাস, বেলারুশিয়ান, আইসল্যান্ডিক, আইরিশ, ম্যাসিডোনিয়ান, মালয়, সোয়াহিলি, ওয়েলশ এবং যুদ্দিশ।

পঞ্চদশ ধাপে (১৯ নভেম্বর ২০০৯ খ্রিষ্টাব্দ) অনুবাদ কার্যক্রমের বিটা অধ্যায় শেষ হয়। এই ধাপে রোমান অক্ষরে চীনা, জাপানি, কোরিয়ান, রুশ, ইউক্রেনিয়ান, বেলুরুশিয়ান, বুলগেরিয়ান, গ্রিক, হিন্দি এবং থাই ভাষা লিখার সুযোগ সৃষ্টি করা হয়। অনুবাদের ক্ষেত্রে আরবি, ফার্সি এবং হিন্দি বাক্য ল্যাটিন বর্ণে লিখলেও তার অনুবাদ হবে এবং তা ওই তিনটি ভাষার নিজস্ব হরফে প্রকাশিত হওয়ার ব্যবস্থা রাখা হয়। এছাড়া লিখিত ভাষা ইংরেজি, ইতালিয়ান, ফরাসি এবং জার্মান পড়ে শোনানোর ব্যবস্থা যুক্ত করা হয়।

ষোড়শ ধাপে (৩০ জানুয়ারি ২০১০ খ্রিষ্টাব্দ)  যুক্ত হয় হাইতিয়ান ক্রেওল। সপ্তদশ ধাপে (৫ এপ্রিল ২০১০ খ্রিষ্টাব্দ) হিন্দি ও স্প্যানিশ লিখার পঠন ব্যবস্থা যুক্ত করা হয়। অষ্টাদশ ধাপে (৫ মে ২০১০ খ্রিষ্টাব্দ) পাঠ সুবিধা যুক্ত হয় যে ভাষাগুলোর জন্য, সেগুলো হলো- আফ্রিকানাস, আলবেনিয়ান, ক্যাটালান, চীনা (ম্যান্ডারিন), ক্রোয়হেশিয়ান, চেক, ড্যানিশ, ডাচ, ফিনিশ, গ্রিক, হাঙ্গেরিয়ান, আইসল্যান্ডিক, ইন্দোনেশিয়ান, ল্যাটভিয়ান, ম্যাসোডোনিয়ান, নরওয়েজিয়ান, পোলিশ, পর্তুগিজ, রোমানিয়ান, রুশ, সার্বিয়ান, স্লোভাক, সোয়াহিলি, সুইডিশ, তুর্কি, ভিয়েৎনামিজ এবং ওয়েলশ।

ঊনবিংশ ধাপে (১৩ মে ২০১০ খ্রিষ্টাব্দ) যুক্ত হয় নতুন পাঁচটি ভাষা। এই ভাষাগুলো হলো- আর্মেনিয়ান, আজারবাইজানি, বাসকি, জর্জিয়ান এবং উর্দু। বিংশ ধাপে (জুন ২০১০ খ্রিষ্টাব্দ) আরবি ভাষার রোমান হরফে প্রকাশ করা সুযোগ তৈরি করা হয়। একবিংশ ধাপে (সেপ্টেম্বর ২০১০ খ্রিষ্টাব্দ) উচ্চারণ ভিত্তিক টাইপ ব্যবহারের সুযোগ রাখা হয় ৭টি ভাষার ক্ষেত্রে। এই ভাষাগুলো হলো- আরবি, গ্রিক, হিন্দি, ফার্সি, রুশ, সার্বিয়ান এবং উর্দু।

দ্বাবিংশ ধাপে (ডিসেম্বর ২০১০) রোমান হরফে আরবি লিখন পদ্ধতি অপসারণ করা হয় বানান শুদ্ধিকরণ পদ্ধতি যুক্ত করা হয়। এছাড়া কিছু উচ্চারণের কিছু পরিবর্তন আনা হয়। এর আগে ভাষার উচ্চারণ করার ক্ষেত্রে বৈদ্যুতিন-পাঠের (eSpeak) প্রক্রিয়াটি চলতো যান্ত্রিক প্রক্রিয়া। এই সংস্করণে ভাষার 'পাঠ্য থেকে পঠন' (text-to-speech)-এর বিষয়টি স্থানীয় ভাষার মনুষ্য কণ্ঠে উপস্থাপন করার বিষয়টি যুক্ত করা হয়। এক্ষেত্রে গুগল সাহায্য গ্রহণ করেছিল জুরিখ ভিত্তিক SVOX নামক একটি উচ্চারণ বিষয়ের গবেষণাকারী প্রতিষ্ঠানের।এ ক্ষেত্রে যে সকল ভাষার জন্য এই ব্যবস্থা উন্মুক্ত করা হয়, সেগুলো হলো- গ্রিক, চীনা, চেক, ড্যানিশ, নরওজিয়ান, পোর্তুগিজ, পোলিশ, ফিনিশ, রুশ, সুইডিশ, হাঙ্গেরিয়ান। এছাড়া আরবি, জাপানি এবং কোরিয়ান ভার কথন প্রোগ্রাম রাখা হয়।

ত্রয়োবিংশ ধাপে (১৩ মে ২০১১ খ্রিষ্টাব্দ) যুক্ত করা হয়- একটি শব্দের ভিন্ন ভিন্ন  অনুবাদের ভিতর থেকে যে কোনো একটিকে শব্দ নির্বাচন করার সুবিধা।

এরপর ২০১১ খ্রিষ্টাব্দের ২৬ মে-তে গুগল ঘোষণা দেয় যে, গুগল অনুবাদ এপিআই (Google Translate API (application programming interface))-এর কার্যক্রম ২০১১ খ্রিষ্টাব্দের ১ ডিসেম্বরে বন্ধ করে দেবে। এর স্বপক্ষে গুগল অর্থনৈতিক প্রতিবন্ধকতা, অনুবাদের নিম্নমানের জন্য সমালোচনা ইত্যাদি যুক্তি দেখিয়েছিল। কিন্তু ২০১১ খ্রিষ্টাব্দের ৩ জুন তারিখে বিশ্বব্যাপী বিশাল সংখ্যক ইন্টারনেট ব্যবহারকারীর চাপে গুগল এই সিদ্ধান্ত প্রত্যাহার করে নেয়। অবশ্য গুগল এ ঘোষণাও দিয়েছে অনুবাদ এপিআই-এর মূল্য-প্রদায়ী সংস্করণ প্রকাশ করবে। নতুন এই সিদ্ধান্তের পর গুগল এই কার্যক্রমের চতুর্বিংশ ধাপ প্রকাশ করে। চতুর্বিংশ ধাপে (জুন ২০১১ খ্রিষ্টাব্দ) এই অনুবাদ কার্যক্রমে যে নতুন পাঁচটি ভাষা গ্রহণ করা হয়েছে, সেগুলো হলো- বাংলা, গুজরাটি, কানাড়া, তামিল ও তেলেগু।

গুগল অনুবাদ পদ্ধতি ও তার সুবিধা অসুবিধা
গুগলের অনুবাদ প্রক্রিয়ায় কোনো ভাষারই ব্যাকরণের সূত্র অনুসরণ করে। ব্যাকরণগত সূত্র নির্ভর ভাষান্তরের প্রক্রিয়াটির ভিত্তি সূত্র ভিত্তিক (
rule based) অনুবাদ প্রক্রিয়া বলা হয়। যেমনটা আমরা পাই the UNDL Foundation এর UNL (Universal Networking language) ভাষান্তর-কার্যক্রমে।  কিন্তু গুগুল অনুবাদ প্রক্রিয়া এলগোরিদমের ভিত্তি হলো পরিসংখ্যানগত বিশ্লেষণ। আবার গুগল অনুবাদে প্রতিটি ভাষা থেকে প্রতিটি ভাষার অনুবাদের বিষয়টিও বিবেবচনায় আনা হয় না। মূলত এর প্রাথমিক ক্ষেত্র হলো যে কোনো একটি ভাষা থেকে ইংরেজিতে অনুবাদ করা এবং এরই মাধ্য একটি সাদৃশ্য ভাষাংশ সাদৃশ্য ভাষাংশ (parallel corpus বা parallel collection) তৈরি করা। প্রাথমিক ভাবে প্রতিটি ভাষার জন্য একই ধরনের সাদৃশ্য ভাষাংশ তৈরি করে, কম্পিউটার নিয়ন্ত্রিত একটি আদর্শ গাঠনিক রূপ দেওয়ার চেষ্টা করা হয়। যেমন এই নমুনা হতে পারে- বাংলা থেকে ইংরেজি, হিন্দি থেকে ইংরেজি, আরবি থেকে ইংরেজি ইত্যাদি। ফলে ইংরেজি একটি মধ্যস্থাকারী ভাষা হিসাবে গুগল অনুবাদকে জমা করা হয়। পরে ইংরেজির মাধ্যমে অন্যান্য ভাষাগুলোর মধ্যে অনুবাদের কার্যক্রম পরিচালিত করা হয়। ধরা যাক বাংলা থেকে হিন্দিতে যদি কোনো তথ্য অনুবাদ করতে চাই, তাহলে বিষয়টি হবে-
           
L1 (প্রদেয় ভাষা 'বাংলা')
                 -> EN -
(মধ্যস্থাকারী ভাষা 'ইংরেজি')
         > L2
(প্রাপ্ত অনুবাদ 'হিন্দি')

একটি মোটামুটি ধরনের অনুবাদ ব্যবস্থা গড়ে তোলার জন্য, প্রায় ২,০০,০০,০০০ শব্দের একটি সাদৃশ্য ভাষাংশ গড়ে তোলার প্রয়োজন। সেটা শুধু একটি ভাষার জন্য। এক্ষেত্রে যতগুলো ভাষার মধ্যে অনুবাদ কার্যক্রম পরিচালিত হবে, তার প্রত্যেকটির জন্য এরূপ তথ্য ভাণ্ডারের প্রয়োজন হবে। এই পদ্ধতিতে অনুবাদের সফলতা যাই আসুক না কেন, একটি বিষয় নিশ্চিত বলা যায়, এই পদ্ধতিতে একটি অসাধারণ বহুভাষিক অভিধান সৃষ্টি হবে। অনুবাদের জন্য এটাও একটা প্রয়োজনীয় উপাদান হিসাবেই বিবেচিত হবে। গুগল অনুবাদক পদ্ধতিতে দাবি করা হয় এর ফলে প্রায় ২৫০০ অভিধানের বিশাল ভাণ্ডার মাত্র ৭০টিতে নেমে আসবে।

এই পদ্ধতির প্রকৃত উদ্ভাবক ছিলেন- জার্মানির কম্পিউটার বিজ্ঞানী ফ্রাঞ্জ যোশেফ ওচ (Franz Josef Och)। ইনি ছিলেন সূত্রভিত্তিক অনুবাদ কার্যক্রমের ঘোরতর সমালোচক। তিনি এখনও মনে করেন সূত্রভিত্তিক অনুবাদ প্রক্রিয়া অত্যন্ত জটিল, যথেষ্ঠ ব্যয়সাপেক্ষ এবং সময়সাপেক্ষ। উল্লেখ্য ওচ এখন গুগলের যান্ত্রিক অনুবাদ দলের প্রধান হিসাবে কাজ করে চলেছেন। এক্ষেত্রে ওচ-এর বক্তব্য হলো- একজোড়া ভাষার (বাংলা ও ইংরেজি) ক্ষেত্রে যদি পাঠ্য-ভাষাংশ (text corpus) তৈরি করা যায় তাহলে বিপুল পরিমাণ শব্দের এবং বাক্য বিন্যাসের নমুনা যান্ত্রিকভাবে ধারণ এবং বিশ্লেষণ করা সম্ভব হবে। এবং বিশ্লেষণ ধরেই দুটি ভাষার মধ্যে অনুবাদের সাধারণ রীতি গড়ে তোলা সম্ভব। এক্ষেত্রে গুগল প্রাথমিকভাবে ব্যবহার করেছে জাতিসংঘের বিভিন্ন নথিপত্র। সাধারণত জাতিসংঘ তাদের নথিপত্র তাদের ছয়টি দাফতরিক ভাষায় (আরবি, ইংরেজি, চীনা (ম্যাণ্ডারিন), ফরাসি, রুশ এবং স্প্যানিশ) প্রকাশ করে থাকে। এই ভাষাগুলোর ক্ষেত্রে অনুবাদের ফলাফল অনেকটা ভালো, কিন্তু সামগ্রিক বিচারে তা যথেষ্ঠ ভালো নয়।

এক্ষেত্রে প্রধান সমস্যা ভাষাভেদে কোনো বিশেষ শব্দের অর্থগত বিভিন্নতা। অর্থাৎ একই শব্দ (যার বানান এবং উচ্চারণ একই) যখন বাক্যে ভিন্ন অর্থ প্রকাশ করে তখন অনুবাদক প্রোগ্রাম বাক্যে কোন অর্থটি গ্রহণ করবে তা নিয়ে সংশয়ে পড়ে যায়। বাংলাতে যদি একটি বাক্যে বলা হয়- 'এ বছর কর (tax) পরিশোধ করা হয় নাই', আবার অন্য বাক্যে বলা হয় 'আজি এ প্রভাতে রবির কর (light)'। অনুবাদক প্রোগ্রাম কোন শব্দটি গ্রহণ করবে? আবার ইংরেজিতে light শব্দের সাথে বাংলা কোন অর্থটির মিলাবে, সেটাই সমস্যা হয়ে দেখা দেয়। যেমন ইংরেজি light  হতে পারে আলো, হতে পারে হাল্কা। এছাড়াও আছে প্রতিটি ভাষার গুচ্ছপদ, প্রবাদ, প্রবচন, প্রতিটির ভাষাভাষীর সাংস্কৃত ঐতিহ্যের সাথে সম্পর্কিত শব্দ (যেমন- আলপনা, ঢেঁকি, কুলা, অভিমান, ঠাট ইত্যাদি) যেগুলোর কোনো ইংরেজি প্রতিশব্দই নেই। বাংলা ক্রিয়াপদের ক্ষেত্রে ভিন্নতর সমস্যা দেখা দেয়। বাংলা প্রতিটি ক্রিয়াপদের ভিত্তি হলো ক্রিয়মূল। কাল এবং পুরুষ হিসাবে এই ক্রিয়াপদ ভিন্ন ভিন্ন রূপ ধারণ করে। কথ্য রূপে এর সংখ্যা প্রায় ৩০,০০০। কাব্যিক রূপ ধরলে এর সংখ্যা আরও অনেক বেশি হবে। এর সাথে আছে সংযোজক ক্রিয়ামূলজাত ক্রিয়াপদ, যেমন সাঁতার কাটা, গান করা ইত্যাদি। একক শব্দ হিসাবে প্রযোজক ক্রিয়াপদে ইংরেজি ভাষা বাংলার চেয়ে দুর্বল। যেমন- আমি জানি (I know), কিন্তু আমি জানাই (I make to know)। এই ভাবে অন্যান্য শব্দগুলো পেতে পারি, যেমন- কাঁদি>কাঁদি, নাচি>নাচাই, হাসি>হাসাই ইত্যাদি। ভাষাগত এই বৈশিষ্ট্যর বিচারে ইউরোপীয় ভাষার (ইংরেজি, ফরাসি, জার্মানি, স্প্যানিশ ইত্যাদি) ক্ষেত্রে গুগুল অনুবাদক যতটা ইংরেজির সূত্রে কাছাকাছি পোঁছানো সম্ভব, ইউরোপের বাইরের ভাষার ক্ষেত্রে বিষয়টা অতটা সহজ হবে না। একই কথা বলা যায়- বাংলা, হিন্দি, উড়িয়া, অহমিয়া ভাষার অনুবাদ যে রীতিতে সহজতর হবে, সেই রীতিতে ইউরোপীয় ভাষার অনুবাদ সহজ হবে না। একটি বিষয়ের সাদৃশ্য ভাষাংশ যাঁরা কিছুটা কাজ করেছেন, তাঁরা বিষয়টি হাড়ে হাড়ে উপলব্ধি করেছেন।

সূত্রভিত্তিক অনুবাদের ক্ষেত্রে এর সমাধান করা হয় বাক্যে ব্যবহৃত শব্দসমূহের প্রকৃতি অনুসারে। পরিসংখ্যান ভিত্তিক প্রোগ্রামে সে সুযোগ না থাকায়, এই প্রশ্নটি চলেই আসে- গুগলের অনুবাদক কার্যক্রম কতটা ফলপ্রসূ হবে। এছাড়া প্রতিটি ভাষা বাক্য বিন্যাস একই রকমের হয় না। কোনো নির্দিষ্ট বিন্যাস ধরে ভাষান্তর করতে গেলে অনুবাদে অগোছালো ভাব চলেই আসে। বাংলা হিন্দি বা  অন্যান্য ভারতীয় ভাষায় বাক্যকে বিভিন্ন আঙ্গিকে বিন্যস্ত করলেও দেখা যায় ভাবগত পার্থক্যের খুব একটা পরিবর্তন হয় না। বড়জোর এর ফলে বাক্যটি কখনো কথ্যরূপে বা সাহিত্যে ব্যবহৃত কোনো বিশেষ ঢং-এ উপস্থাপিত হতে পারে। যেমন-
                 তিনি ভাওয়ালের রাজা ছিলেন
                 তিনি ছিলেন ভাওয়ালের রাজা
                 ভাওয়ালের রাজা ছিলেন তিনি

এরূপ একটি বাক্যেকে যদি এতরকমভাবে অনুবাদ করে জড়ো করা যায়, তাহলে অভিধানের সংখ্যা যতই কম হোক সার্বিক ফলাফলে বড় একটা সুবিধা আনবে বলে মনে হয় না। এক্ষেত্রে অনুবাদে কিছু কিছু ক্ষেত্রে চমৎকার ফলাফল দিলেও অধিকাংশ ক্ষেত্রে অর্থহীন বাক্যই প্রকাশ করবে।

গুগুল অনুবাদে বাংলা ভাষা
গুগল অনুবাদ প্রোগ্রামের চতুর্বিংশ (২৪) ধাপে (জুন ২০১১ খ্রিষ্টাব্দ) নতুন পাঁচটি ভাষার সাথে বাংলা যুক্ত করা হয়েছে। যে কোনো ব্রউজারে
http://translate.google.com/# টাইপ করে এন্টার চাপুন। ইংরেজি থেকে বাংলা বা বাংলা থেকে ইংরেজিতে অনুবাদ করে দেখতে পারেন। এখানে,
I eat, you read এই জাতীয় বাক্য লিখে ফলাফল দেখুন। অধিকাংশ ক্ষেত্রে আপনি ফলাফলে সন্তুষ্ট হবে না। কারণ বাংলা অনুবাদকটি এখন আদিস্তরে বা আলফা পর্যায়ে আছে। এক্ষেত্রে আপনি এই প্রোগ্রামটি সমৃদ্ধ করার জন্য আপনি এর তথ্য-উপাত্ত সমৃদ্ধ একটি ফাইল পাঠাতে পারেন। এর জন্য এই পৃষ্ঠার নিচের দিকে Translator Toolkit অংশে ক্লিক করতে পারেন। এখানে প্রবেশের জন্য অবশ্যই আপনার একটি জিমেইল একাউন্ট থাকতে হবে। আপনি আপনার কম্পিউটারের notepad একটি ফাইল তৈরি করে তাতে অনুবাদটি লিখুন, এরপর utf8 ফরমেটে আপনার হার্ডডিস্কে সংরক্ষণ করুন। এরপর Translator Toolkit-এর উপরে upload অংশে ক্লিক করে আপনার লিখিত ফাইলটি পাঠিয়ে দিন। এই কাজটি করার আগে অবশ্যই আপনাকে দুটি বিশেষভাবে নজর দিতে হবে।  ১. অনুবাদটি যেন ঠিক হয়। ২. ইংরেজি এবং বাংলা বানান যেন ব্যাকরণসম্মত অর্থাৎ যথার্থ হয়। মনে রাখবেন আপনার ভুলের জন্য অনেকে এই অনুবাদক প্রোগ্রামের উপর অযথাই বিরক্ত হতে পারে।

যদিও গুগলের অনুবাদ প্রক্রিয়াটি শেষ পর্যন্ত কতটুকু সাফল্যের লক্ষ্যকে স্পর্শ করতে পারবে, এ নিয়ে সংশয় আছে। তারপরেও বলি, সারা পৃথিবীর প্রধান প্রধান সকল ভাষাভাষীরাই গুগলের এই কার্যক্রমের অংশভাগী হয়ে তাদের নিজ নিজ ভাষার জন্য কাজ করে চলেছে, তখন আমরাই বা কেন পিছিয়ে থাকবো। দেখাই যাক না বিপুল সাদৃশ্য ভাষাংশের মধ্য দিয়ে উপরের আলোচিত সমস্যার সমাধান করা যায় কি না। যদি বাঙলা ভাষাভাষীরা বাংলা-ইংরেজি ভিত্তিক সাদৃশ্য ভাষাংশ তৈরি করে গুগল কার্যক্রমের অংশভাগী হতে পারে, তা হলে আমরা অনুবাদ কার্যক্রমের একটি ধারার সাথে সম্পৃক্ত থাকার অধিকার অর্জন করতে পারবো, এটাও তো একটা প্রাপ্তি। অনেক দেরিতে হলেও বাংলাকে এই কার্যক্রমে যুক্ত করা হয়েছে সত্য, কিন্তু আমাদের ঐকান্তিক প্রচেষ্টায় অন্যান্য ভাষার সমকক্ষতা অর্জন করতে পারবো, বলে আশা করি। তবে সতর্কতার কথাটি আবার বলি, সাদৃশ্য ভাষাংশটি যেন যথার্থ হয় এবং ইংরেজি এবং বাংলা বানান যেন ব্যাকরণসম্মত হয়।