উইকিসংকলন:বাংলা ওসিআর

উইকিসংকলন থেকে
পরিভ্রমণে ঝাঁপ দিন অনুসন্ধানে ঝাঁপ দিন
বাংলা ওসিআর
বাংলা অপটিক্যাল ক্যারেক্টার রিডার (বাংলা ওসিআর) বা Bengali OCR বা Bangla OCR

গুগুল বাংলা ওসিআর[সম্পাদনা]

গুগল ড্রাইভ দিয়ে উইকিসংকলনের জন্য স্ক্যানকৃত বাংলা ফাইল (জেপিজি, জেপিইজি, পিএনজি) এবং পিডিএফ ফাইল (২ এমবি) আপলোড করে তাকে টেক্সট বা লেখায় রুপান্তর করা যায়, যার ফলে আর আমাদের টাইপ করার দিন শেষ। পিডিএফ ফাইলের ক্ষেত্রে প্রথম ১০টি পাতা রুপান্তর করতে পারে।

এই জন্য যা করতে হবে
  1. . প্রথমে আপনাকে গুগল ড্রাইভে jpg. jpeg, png কিংবা pdf ফাইলটি আপলোড করতে হবে। (বাংলা: নতুন > ফাইল আপলোড করুন English: New > upload file)
  2. . আপলোড করার পর ফাইলের উপর রাইট (ডান) ক্লিক করে Google দস্তাবেজ নির্বাচন করতে হবে। (বাংলা: এর মাধ্যমে খুলুন > Google দস্তাবেজ English: Open with > Google docs)
  3. . এতে নতুন যে পাতা আসবে সেখানে স্ক্যান করা ফাইলের লেখা থাকবে। আপনাকে শুধু লেখাগুলি কপি বা অনুলিপি করতে হবে। এরপর উইকিসংকলের পাতায় পেস্ট বা প্রতিলেপন করতে হবে।

[টীকা: বন্ধনীতে বাংলাEnglish লেখা অর্থ হল আপনার গুগল ড্রাইভের ভাষা বাংলা হলে কি লেখা আসবে আর English হলে কি লেখা আসবে]

ধাপসমূহ (ইংরেজি ইন্টারফেস)

অঙ্কুর প্রকল্পের বাংলা ওসিআর[সম্পাদনা]

অঙ্কুর প্রকল্পের প্রতিষ্ঠাতা ও মুখ্য সমন্বয়কারী হচ্ছেন যুক্তরাষ্ট্র প্রবাসী তানিম আহমেদ। এই সংগঠনের সাফল্যের মূলে রয়েছে সংগঠনের কর্মীদের অক্লান্ত পরিশ্রম। এই প্রকল্পে অংশগ্রহণকারী যুক্তরাষ্ট্র প্রবাসীদের মাঝে আরো রয়েছেন- দীপায়ন সরকার, কৌশিক ঘোষ, শরিফ ইসলাম। ভারতে অবস্থানরত বাঙালিদের মধ্যে রয়েছেন ইন্দ্রনীল দাশগুপ্ত, রুনা ভট্টাচার্য, শান্তনু চ্যাটার্জি, সায়মিন্দু দাশগুপ্ত। বাংলাদেশে যারা এ প্রকল্পে কাজ করে যাচ্ছেন তারা হচ্ছেন- জামিল আহমেদ, খন্দকার মুজাহিদুল ইসলাম, মোহাম্মদ খালিদ আদনান, প্রজ্ঞাসহ আরো অনেকে।অঙ্কুরের সাথে কাজ করতে আগ্রহী হলে তাদের সাথে যোগাযোগ করতে পারেন http://www.ankurbangla.org ev http://bengalinux.org ঠিকানায়।

সিআরবিএলপি বাংলা ওসিআর[সম্পাদনা]

২০০৯ সালে ব্র্যাক বিশ্ববিদ্যালয় সেন্টার ফর রিসার্চ অন বাংলা ল্যাঙ্গুয়েজ প্রসেসিং সিআরবিএলপি ওসিআর তৈরির উদ্যোগ নেয়। ওসিআর শব্দটি Optical Character Reader/ Recogniser-এর সংক্ষিপ্ত রূপ। এর কাজ হচ্ছে সাধারণ স্ক্যান করা কোনো নথির চিত্রকে সম্পাদনযোগ্য লেখায় পরিণত করা। বাজারে কিছু জনপ্রিয় ওসিআর-এর মাঝে রয়েছে ABBYY Fine Reader ও Omnipage। চিত্রের নথিকে সম্পাদনযোগ্য লেখায় রূপান্তরিত করায় এদের জুড়ি নেই। কিন্তু এগুলোর কোনোটিই বাংলা ফন্টে লেখা নথির চিত্রকে লেখায় রূপান্তর করতে পারে না। তাই বাংলা লেখা ইমেজকে টেক্সটে পরিণত করার লক্ষ্যে এ প্রতিষ্ঠান বাংলা ওসিআর বানানোর উদ্যোগ নেয় এবং সফলতা লাভ করে। নানা চরাইউৎরাই পেরিয়ে এ সফটওয়্যার এখন বেশ ভালোই কাজ করতে পারে। সফটওয়্যারটির নতুন সংস্করণটি হচ্ছে বাংলা ওসিআর ০.৬ আলফা। এটি অনেকগুলো চিত্রের ফরমেট সমর্থন করে। সফটওয়্যারটি পুরোপুরিভাবে কাজে লাগানোর জন্য আপনার পিসিতে থাকতে হবে .NET Framework 2.0, Visual C++ 2005 ও Java Runtime Environment।

টিম ইঞ্জিনের বাংলা ওসিআর[সম্পাদনা]

খবরে প্রকাশ বাংলা ওসিআর তৈরি করেছেন টিম ইঞ্জিনের সফটওয়্যার তৈরির প্রধান নির্মাণকৌশলী হিসেবে কাজ করেছেন এসএম আল-আমিন (সম্রাট) ও তার দল। প্রকল্পের সমন্বয়কারী ছিলেন নাফিসা রেজা বর্ষা।

আরো দেখুন[সম্পাদনা]