বিশ্বকাপের ভীড়ে এখন অন্যান্য পোস্ট কারো নজরে আসার কথা না…. যাই হোক, সেটা সমস্যা না। রোকেয়া কিবোর্ড লেআউট ও প্রোগ্রাম নিয়ে বর্তমানে কি কাজ করছি সেটারই একটা ধারাবাহিক আপডেটমূলক পোস্ট এটা। প্রতি সপ্তাহে গুগল সার্চিংয়ে কোন না কোন ইমপ্রুভমেন্ট করে, কোন ফিচার যোগ করবেই এবং সেটা নিয়ে লিখেও…..গুগলব্লগ যেহেতু আমার প্রিয় ব্লগগুলির একটা তাই ওদের স্টাইলে আমিও ভাবছি একটা রেগুলার আপডেট মূলক পোস্ট লিখে ফেলি 🙂
কিবোর্ডের কাজটা খুব সহজ, আবার খুব কঠিন। সহজ এই সেন্সে যে, অলরেডি অনেকগুলি কিবোর্ড আছেই সুতরাং ওদের মত একটা বানালেই হয়। কিবোর্ডের ইনপুট নিতে হবে, সেটা কোন অক্ষর চেক করে সেইমত প্রোগ্রামকে নোটিফাই করলেই হবে……
কঠিন পার্টটা হল, এই জিনিসটাকে পারফেক্ট করা+ বিজ্ঞানসম্মত করা+ মানুষের কাছে সহজে পৌছাতে পারে এমন করে তৈরী করা….. আমি শুরু করেছি কিবোর্ড দিয়ে তবে আমার ইচ্ছা একটা কমপ্লিট প্যাকেজ তৈরী করে এরপরেই থামবো। কমপ্লিট প্যাকেজ মানে:
১) খুব সহজ/ সেরা কোন একটা কিবোর্ড লেআউট
২) ভয়েস টু টেক্সট ফ্যাসিলিটি
৩) টেক্সট টু ভয়েস ফ্যাসিলিটি
৪) বানান পরীক্ষক
৫) বাংলা ডিকশনারী
৬) ছাপার অক্ষর / হাতের লিখা সনাক্তকারী এরমাঝে
আলাদা আলাদা করে বেশ কয়েকটি’র কাজ হয়েছে, এরমাঝে ওপেন সোর্স জিনিসগুলিকে আমি এক প্ল্যাটফর্মে, একটা সফটওয়ারে নিয়ে আসতে চাই…… আমার লক্ষ্য এটাই…
প্রসঙ্গে ফেরত আসি, আপাতত যেই কাজগুলি করেছি কিবোর্ড নিয়ে:
১) ডাটা জেনারেশন ফেজ শুরু হয়েছে, আপাতত চেষ্টা করছি অঙ্কুর.org এর ফাইলটাকে একটা ফরম্যাটে নিয়ে যেতে (একটু ধাক্কা খেতে পারেন কারণ পোর্টেবল ফাইল ফরম্যাট মানে তো পিডিএফ, আমি তাহলে কি করতে চাইছি ?? উত্তর: তেমন কিছু না, এটাকে এক্স-এম-এল এ ট্রান্সফার করে দিব যাতে পিসি-মোবাইল-ওয়েব/ডেস্কটপ অ্যাপ্লিকেশন-স্মার্টফোন সবাই একইভাবে অ্যাক্সেস করতে পারে….doc ফাইল ডাটাবেজে নেয়ার কোড রেডি করে রেখেছি, আরো কিছু ফরম্যাট নিয়ে কাজ করতে হবে (যেমন: এক্সেল, এইচটিএমএল)। কাজগুলি সহজ বলে ফেলে রাখলে হবে না,করতে হবে….
২) কিবোর্ড নিয়ে অনেক কাজ হয়েছে, সেগুলির সামারি করে এবং বেটার একটা অ্যাপ্রোচ প্রপোজ করার চেষ্টা করছি, এই মাসের মাঝেই ফাইনাল বুঝা যাবে এই অ্যানালাইসিস নিয়ে কতদূর যাওয়া যাবে…. এখন আটকে আছি ant colony optimization প্রবলেম এর ভ্যারিয়েন্স নিয়ে
৩) কিবোর্ডের সফটওয়ার তৈরীর জন্যে কোড দেখছি বেশ কিছু তবে রান করা হয়নি তেমন একটা। মনির ভাইয়ের কোডটা রান করতে পারলাম না, কোন একটা সমস্যা হয়েছে যেটা ধরতে পারছি না….
৪) আমি একা এতগুলি সফটওয়ারের কাজ করতে পারবো না……. অফিসের ফাঁকে এত সময় আমি কখনোই পাব না + আমার সববিষয়ে জ্ঞানার্জন করাও সম্ভব না…… একটা সফটওয়ার বানাতে কি পরিমাণ ধৈর্য্য লাগে সেটা যারা কোড লিখে কোন সফটওয়ার বানিয়েছে তারাই শুধু জানে……. আমি তাই প্ল্যান করছি আমেরিকা-ইউরোপের মত ফান্ডিং করে কোন স্টুডেন্ট প্রজেক্ট হিসেবে কাজটাকে এগিয়ে নিব……. মানে আমরা একটা ফান্ড গঠন করলাম এবং সেই ফান্ডের টাকাটা কোন ভার্সিটির কোন একটা টিচারকে দিলাম…. তিনি সেই টাকার ৩০% রাখবেন ও তার স্টুডেন্টদের ক্লাস প্রজেক্ট হিসেবে সেই কাজটা দিয়ে কাজটা করিয়ে নিবেন এবং সবশেষে বাকি ৭০% টাকা স্টুডেন্টরা পাবে ( আমার ধারণা ভুল না হলে নর্থ আমেরিকান ভার্সিটিগুলিতে স্কলারশীপের ধারণা এটাই, তাইনা ??)
৫) ভাষা নিয়ে এ ধরনের কাজকে শুধু ওপেন সোর্স রাখলেই হবে না, পাশাপাশি ক্লোজড সোর্সও রাখতে হবে এটা আমি জানতাম না….. আজকে জানলাম….. সেইমত একটা লাইসেন্স ডকুমেন্ট লিখতে হবে….
এর কারণ হল ওপেন সোর্সের জিনিস কোডে আপনি যদি পরিবর্তন করে তাহলে আপনি অবশ্যই সেই পরিবর্তিত জিনিসটি ওপেন রাখতে বাধ্য…. এখন যদি এমন হয় যে, সেই পরিবর্তিত অংশটি ওপেন রাখলে আপনার সিকিউরিটি বা এজাতীয় খুব বড় কোন সমস্যা সেক্ষেত্রে আপনি কি ওপেন সোর্স জিনিস নিবেন ?? অবশ্যই না…. একারণে এসব ঘটনা ট্যাকল দিতে ক্লোজড সোর্সও থাকবে ওপেন সোর্সও থাকবে…..
তবে ওপেন+ক্লোজড যেটাই হোক না কেন সারাজীবন সবকিছুই ফ্রি থাকবে এবং যেকারো সেটাতে এক্সেস থাকবে…….. ভাষা নিয়ে কোন ব্যবসা চলবে না….
**********
এইতো আজ এ পর্যন্তই….. পোস্টে মাথা ধরিয়ে দিয়ে থাকলে দুঃখিত…… ভাল থাকবেন
বাংলা ক্যারেক্টার রিকগনিশন নিয়া কিছু করতে চাইলে আওয়াজ দিও। হয়তো সামিল হতে পারব। আর চালায়ে যাও... স্যালুট থাকল।
ভাইয়া, এটা নিয়ে কাজ করতে তো হবেই...... কাজের ২টা ফেজ: (১) অ্যানালাইসিস এবং (২) কোডিং......
অ্যানালাইসিস মানে কোন পেপার কিংবা অ্যালগরিদমের ডিটেইলস ডকুমেন্টেশন বুঝাইলাম আরকি...... আপনি কোন ফেজে হেল্প করবেন ভাইয়া ?? 🙂 যেকোনটাতেই স্বাগতম
এনালাইসিস ফেজ থেকেই শুরু করতে হবে। প্যাটার্ন রিকগনিশন নিয়া কিছু পূর্বঅভিজ্ঞতা আছে। আজকে শাওয়ারে দাঁড়ায়ে চিন্তা করছিলাম ব্যাপারটা নিয়ে। বাংলা অক্ষরগুলা জোড়া লাগানো, তাই আইসোলেশানে ঝামেলা হতে পারে। সেগমেন্টেশান ব্যাপার হবে না। মেডিয়াল এক্সিস ট্রার্ন্সফর্ম ব্যবহার করা যায়। দেখা যাক। একটু সময় পাই হাতে, বিশদ আলোচনা করব তখন। যারা কাজ করতে চায় তাদের জন্যও একটা টিউটোরিয়ালের মতো হয়ে যাবে।
ভাইয়া, অলরেডী অনেকগুলি অ্যানালাইসিস আছেই...... বেশিরভাগ নিউরাল নেটওয়ার্ক দিয়ে করা, কয়েকটা ভেক্টর ম্যাপিংয়ে করা, কয়েকটা ফিচার এক্সট্রাকশন বেসিসে করা। আপনি ওগুলি দেইখেন..... আপনার বলা মেথডটা আমি জানতাম না, এখানে দেখে ওটা নিয়ে একটু পড়াশুনা করলাম.....
আমার মনে হয় ভাইয়া এই মেথডে সমস্যা হবে কারণ হ্যান্ড রাইটিং রিকগনিশনে গেলে মেডিয়াল এক্সিসটা ইউনিফর্ম হবে না কারণ একেকজনের হাতের লিখা একেকরকম...... ফলে কারো লিখায় কার্ভগুলির সমীকরণ হবে elliptical আবার কারো circular. তাহলে তো মেডিয়াল এক্সিসটা চেঞ্জ হয়ে অক্ষরটাও চেঞ্জ হয়ে যাবে...... তাই বলছিলাম আমার মনে হচ্ছে গ্রামার বেজড ফিচার এক্সট্রাকশনটাই ভাল হবে
আপনি লিখে ফেলেন একটা পোস্ট 🙂 আরো ডিটেইলস আলোচনা হোক...... বেশিরভাগের মাথার উপরে দিয়ে যাবে, সেটা সমস্যা না কারণ তারা এটা ব্যবহার করবেন মাত্র ( ডেভেলপ করতে চাইলে তখন পুরোটা ব্যাখ্যা করা যাবে)।
সময় করে পোস্ট দিয়েন, অপেক্ষায় থাকলাম....... আমি এরমাঝে কিবোর্ড আর স্পেলচেকারের কাজটা এগিয়ে নেই
সার্কিটের উপ্রে দিয়া গেছে... ক্ষতি নাই......
চালাইয়া জাআআআআআআআআআআআআআআআআআআআআআআআআআআআআআওওওওওওওওওওওওওওওওওওওওওওওওওও
Proud to be an ex-cadet..... once a cadet, always a cadet
অ্যান্টেনা কোম্পানীকে ফোন দেন 😉
ভাইয়া, সত্যি কথা বলতে আপনার software package-এর শেষ তিনটা আংশকে আমার কাছে প্রথম তিনটার ছেয়ে বেশী গুরুত্বপূর্ণ মনে হয়েছে। Real-time বানান পরীক্ষণ এবং অভিধান এর সমন্বয় যেকোন phonetic keyboard/layout কে চূড়ান্ত মাত্রার user-friendly বানায়ে দিবে। Google Transliteration ব্যবহার করে আমার এই অভিতাই হয়েছে। যদিও কিছু সীমাবদ্ধতার কারণে এটা ব্যবহার করি না। আর শেষের অক্ষর সণাক্তকরণ টা এইজন্য জরুরী যে, এর মাধ্যমে প্রচুর পুরাতন বইকে unicode-এ রূপান্তর করা যাবে যেইটা খুবই জরুরী। অনেক অনেক শুভ কামনা।
জন্যঃ অভিতাই
পড়ুনঃ অভিজ্ঞতাই
এটা একটা মজার অবজারভেশন যে: "কনটেক্সেটর উপর বেজ করে মানুষ ভুল বানানকে ঠিক করে পড়ে", এই যেমন তুমি যে অভিজ্ঞতা-কে অভিতা লিখে ফেলছো এটা আমি নোটিস করিনাই..... তোমার কমেন্ট পড়ে দেখলাম 🙂
২ আর ৩ আসলে আলাদা লাইনের জিনিস, তবে অন্ধ কিংবা দৃষ্টি প্রতিবন্ধীদের জন্যে খুব দরকারী......সফটওয়ারটিতে এটাও তাই যোগ করার প্ল্যান করেছি.... এখানে একটা ইনফো দেই: বাংলা টেক্সট টু ভয়েস কনভার্টারের কাজ করেছেন নওশাদ ভাই, উনি কিন্তু একজন এক্স ক্যাডেট B-) B-) ( ফৌজদারহাট- ২০০১ এইচ.এস.সি, এখন রচেস্টার ভার্সিটি-ইউ.এস.এ তে আছেন)
বাকি ৩টা নিয়ে যা বলছো তা ঠিকই আছে, এখন কাজ করতে হবে স্ট্রং একটা ডিকশনারী বিল্ডআপ নিয়ে
আমি ওসিআরে কাজ করতে আগ্রহী। 😉
চালায়ে যাও। :thumbup:
ভাইয়া কোন পার্টে কাজ করবেন ?? 🙂 কোডিং নাকি অ্যানালাইসিস ??
কোডিং আমার শক্তিশালী দিক। আমি যে কোন পার্টেই কাজ করতে রাজি। আমার একটা বাংলা বইয়ের সাইটের প্লান আছে। তাই ওসিআরে আগ্রহ বেশী।
ঠিক আছে ভাইয়া..... ওসিআরের কাজটা শুরু হলে তাহলে আপনাকে সেই টিমে নিয়ে নিব 🙂
আমারো মনে হয় ৪ ৫ ৬ সবচেয়ে দরকারী (১ নিয়ে তো বলার দরকার নেই)।
৪ ৫ এর বেস কোড করার পর কমিউনিটি বেসড ভাবে চলতে পারে। কনটেন্ট ক্রিয়েশন কারেকশন ইউজাররাই করবে (উইকির মতন)। ৬ নম্বরে আমার যতদুর ধারনা মেশিন লার্নিং (গুগল ট্রান্সলিটেরেশনের মতন) প্রসেস ব্যবহারের দরকার হবে, সেটাতেও ইউজাররাই অংশগ্রহন করতে পারবে, কোনো একটা লেখা স্ক্যান করার পর রিভিশন দিতে হবে ইউজারদেরকেই। আর তা থেকে ডিসট্রিবিউশন তৈরি করে নিতে পারে সফটওয়্যার।
ভাইয়া, আপনার সাথে মোটামুটি একমত...... তবে মেশিন লার্নিং অংশটা ( ৬ নাম্বারের জন্য) মনে হয় লাগবে না যদি আমাদের ডিকশনারী খুব স্ট্রং হয় কারণ সকল ইমেজ-টু-টেক্সট রিডার নিজেদের অ্যাকুরেসি বাড়াতে ডিকশনারী'র উপর নির্ভরশীল ৩০~৪০%...... তাই আমার মনে হয় আমরাও সেটাই করতে পারি
এটা আসলে অ্যানালাইসিস যারা করবেন তাদের উপর 🙂 আমি চাই একটা ওয়ার্কিং এবং ইমপ্লিমেন্ট করা যায় এমন কোন ডাটা স্ট্রাকচারের কোড
সিউল, তৌফিক, গুলশান, মাঈনুল, ইফতেখার ও নওশাদ,
ইশ, তোমাদের এই উৎসাহ দেখে এতো ভালো লাগছে আমার। তোমরা আরো আগে জন্মালে না কেন, অথবা আমার বয়স যদি ২৫-৩০ বছর কম হতো ...
শুভেচ্ছা রইল সবার প্রতি।
সাইফ ভাই
saif_shahid@yahoo.com
ভাইয়া আপনি বেজ তৈরীর কাজ করে রেখেছেন, এখন আমরা সেই বেজের উপর টুইন টাওয়ার থেকেও বড় বিল্ডিং বানাবো 🙂 কোনভাবেই ভাষা শহীদদের অবদান এবং আপনাদের অবদানকে বৃথা যেতে দিব না......
শুভ কামনার জন্যে ধন্যবাদ ভাইয়া। দোয়া রাখবেন যেন কাজগুলি শেষ হয়
সিউল, তোমার প্রজেক্ট এবং চিন্তা ভাবনা সবকিছুই দারুণ লাগছে।
যেভাবে লেগে আছো, নিশ্চয়ই দারুণ কিছু পেতে যাচ্ছি আমরা।
রোকেয়ার কোন এক্সিকিউটেবল ভার্সন কি বানিয়েছো?
সংসারে প্রবল বৈরাগ্য!
না ভাইয়া, এখনো একজিকিউটেবল তৈরী করতে পারিনি। ট্রায়াল একটা কোড রান করানোর ট্রাই করেছিলাম, কাজ করেনি 🙁
যাই হোক, কাজ শুরু হয়েছে। আশা করি হয়ে যাবে 🙂 দোয়া করবেন