ျမန္မာပံုရိပ္မွ စာသားသို႔ ေျပာင္းလဲဖတ္႐ႈစနစ္ (MMOCR) ကို စမ္းသပ္ထုတ္လုပ္ရန္ ရည္ရြယ္ထားေၾကာင္း ကြန္ပ်ဴတာသံုး ျမန္မာစာစနစ္ သုေတသနလုပ္ငန္း အဖြဲ႔မွ ဇူလိုင္ ၂၁ ရက္က သတင္း ထုတ္ျပန္ခဲ့သည္။ ပံုရိပ္မွ စာသားသို႔ ေျပာင္းလဲဖတ္႐ႈ စနစ္ဆိုသည္မွာ ပံုရိပ္ဖိုင္တြင္ ပါဝင္ေနေသာ စာသားမ်ားကို ကြန္ပ်ဴတာမွ ဖတ္႐ႈၿပီး ကြန္ပ်ဴတာတြင္ စာသားအျဖစ္ သိမ္းဆည္းျခင္း၊ ျပဳျပင္ျခင္းႏွင့္ ျပန္လည္ အသံုးခ်ႏိုင္ရန္ ဖန္တီးထားေသာ ကြန္ပ်ဴတာ အသံုးခ်စနစ္ ျဖစ္သည္။ ပံုႏွိပ္စာမ်ားကို ေဖာ္ျပပါစနစ္ အသံုးျပဳ၍ စာသားမ်ား အျဖစ္သို႔ လြယ္ကူစြာ ေျပာင္းလဲႏိုင္မည္    ျဖစ္သည္။

ပံုရိပ္မွ စာသားအျဖစ္ေျပာင္းလဲစဥ္

ပံုရိပ္မွ စာသားအျဖစ္ေျပာင္းလဲစဥ္

ယင္းႏွင့္စပ္လ်ဥ္း၍ “ပံုရိပ္ ဖမ္းစက္(Scanner) မွ ရရွိလာေသာ ပံုရိပ္မ်ားသည္ မူရင္းပံုႏွိပ္စာမ်ား၏ ပံုရိပ္သာျဖစ္   ေသာေၾကာင့္ ကြန္ပ်ဴတာမွ ျပဳျပင္ျခင္းႏွင့္ အသံုးခ်ျခင္း တို႔ကိုလည္း မျပဳလုပ္ႏိုင္ပါ။ ပံုရိပ္မွ စာသားသို႔ ေျပာင္းလဲဖတ္႐ႈ စနစ္သည္ ပံုႏွိပ္စာမ်ားကို ကြန္ပ်ဴတာျဖင့္ ျပန္လည္ျပဳျပင္ႏိုင္ျခင္းႏွင့္ အသံုးျပဳႏိုင္ေသာ စာသားမ်ား အျဖစ္သို႔ ေျပာင္းလဲေပးႏိုင္သျဖင့္ မည္သည့္ စာရြက္စာတမ္းကိုမဆို အစအဆံုး ျပန္လည္႐ိုက္ရန္ မလိုဘဲ စာသားမ်ားအျဖစ္ တိုက္႐ိုက္ အသံုးျပဳႏိုင္သည္”ဟု ကြန္ပ်ဴတာသံုး ျမန္မာစာစနစ္ သုေတသန လုပ္ငန္းအဖြဲ႕က ေဖာ္ျပသည္။

ထို႔အျပင္ ျမန္မာပံုရိပ္မွ စာသားသို႔ ေျပာင္းလဲဖတ္႐ႈေသာ စနစ္ (MMOCR)ကို ၂ဝ၁၁ ခုႏွစ္မွ စတင္၍ သုေတသန ျပဳခဲ့ေၾကာင္း၊ Open Source ေဆာ့ဝဲလ္တစ္ခုျဖစ္သည့္  Tesseract OCR Engine ကို အသံုးျပဳ ထားေၾကာင္းႏွင့္ ယင္းနည္းပညာကို ဂ်ာမနီ၊ စပိန္၊ ဂ်ပန္၊ တ႐ုတ္ႏွင့္ အျခားႏိုင္ငံမ်ားမွလည္း အသံုးျပဳၾက ေၾကာင္း ဆက္လက္သိရသည္။

ႏိုင္ငံတကာတြင္ အသံုးျပဳေနၾကေသာ ပံုရိပ္မွ စာသားသို႔ ေျပာင္းလဲ ဖတ္႐ႈစနစ္မ်ား၏ မွန္ကန္မႈ ရာခိုင္ႏႈန္းသည္လည္း ရာႏႈန္းျပည့္ မရွိေၾကာင္း ေလ့လာသိရွိရသည္။ ျမန္မာပံုရိပ္မွ စာသားသို႔ ေျပာင္းလဲ ဖတ္႐ႈစနစ္၏ မွန္ကန္မႈ ရာခိုင္ႏႈန္း သည္ ၈၇ ရာခိုင္ႏႈန္း ရရွိေနၿပီ ျဖစ္ေၾကာင္း သုေတသန လုပ္ငန္းအဖြဲ႔၏ ထုတ္ျပန္ခ်က္တြင္ ေဖာ္ျပထားသည္။ ယင္းႏွင့္စပ္လ်ဥ္း၍ “MMOCR ၏ အက်ဳိးသက္ေရာက္မႈ အားေကာင္း ေစရန္ႏွင့္ မွန္ကန္မႈ ရာခိုင္ႏႈန္း ပိုမိုတိုးတက္ ေစရန္အတြက္ အေခ်ာသတ္ ျပင္ဆင္ မြမ္းမံျခင္းမ်ား လုပ္ေဆာင္ ၿပီးစီးခဲ့သည္။ လက္ရွိ အေျခအေနအရ တိက်မႈရာႏႈန္း ၈၇ ရာခိုင္ႏႈန္း ရရွိေနၿပီျဖစ္သည္။ ယခုရရွိထားသည့္ ရာႏႈန္းဆိုေသာရလဒ္သည္ ပံုဖတ္ အရည္အေသြး(Resolution) ၃ဝဝ ရွိေသာ စာမ်က္ႏွာ ၁ဝဝ အေပၚတြင္ မူတည္၍ စမ္းသပ္ရရွိလာေသာ ရာခိုင္ႏႈန္းျဖစ္သည္။ ထို႔ေၾကာင့္ ပံုရိပ္ အရည္အေသြး၊ စာလံုးပံုစံႏွင့္ စာလံုးအရြယ္အစား အေပၚမူတည္၍ တိက်မႈ ရာခိုင္ႏႈန္း ေျပာင္းလဲသြားမည္ ျဖစ္သည္” ဟု သုေတသန လုပ္ငန္းအဖြဲ႔က ဆက္လက္ ေဖာ္ျပထားသည္။

ထို႔အျပင္ တိက်မႈရာခိုင္ႏႈန္း တိုးတက္ေစရန္အတြက္ အေခ်ာသတ္ ျပင္ဆင္မြမ္းမံျခင္း(Post-Edition) လုပ္ငန္းမ်ားကို ထည့္သြင္းလုပ္ေဆာင္ ရေၾကာင္းႏွင့္ ထိုသို႔လုပ္ေဆာင္ရာတြင္ ဘာသာစကား၏ သဘာဝႏွင့္ အသံုးျပဳရသည့္ နည္းပညာတို႔ အၾကား အံဝင္ခြင္က် မျဖစ္မႈမ်ား ျဖစ္ေပၚႏိုင္ေၾကာင္း သိရသည္။ ယင္းႏွင့္ စပ္လ်ဥ္း၍ “ျပင္ဆင္မြမ္းမံျခင္း လုပ္ငန္းအဆင့္ကို လုပ္ေဆာင္ရာတြင္ ဝဏၰ(Syllable)အဆင့္ အေခ်ာသတ္ ျပင္ဆင္ျခင္းႏွင့္ စကားလံုး(Word) အဆင့္ အေခ်ာသတ္ ျပင္ဆင္ျခင္း ဟူ၍ရွိရာ ျမန္မာဘာသာစကား၏ နက္နဲေသာ အေျခအေနမ်ားေၾကာင့္ ဝဏၰအဆင္ ့ျပင္ဆင္မႈမ်ားသာ အဆင္ေျပေသးေၾကာင္း၊ မွန္ကန္မႈ ရာခိုင္ႏႈန္း ဆက္လက္ တိုးတက္ေစရန္ စကားလံုးအဆင့္ ျပင္ဆင္မႈမ်ားကို ဆက္လက္ လုပ္ေဆာင္သြားရန္ ရည္ရြယ္ထားသည္”ဟု သုေတသန လုပ္ငန္းအဖြဲ႔က ဆိုသည္။ ျမန္မာပံုရိပ္မွ စာသားသို႔ ေျပာင္းလဲဖတ္႐ႈစနစ္ (MMOCR)ကို အမ်ားျပည္သူမွ အသံုးျပဳႏိုင္ရန္ စမ္းသပ္ထုတ္လုပ္သည့္အေနျဖင့္ ၂ဝ၁၂ ခုႏွစ္အတြင္း၌ ထုတ္ေဝသြားမည္ဟု သုေတသနအဖြဲ႕၏ တာဝန္ရွိသူ တစ္ဦးထံမွ သိရသည္။

ပံုရိပ္မွ စာသားသို႔ ေျပာင္းလဲဖတ္႐ႈ စနစ္သည္ ႐ံုးလုပ္ငန္းမ်ား၊ စာၾကည့္တိုက္မ်ား၊ ေရွးေဟာင္းစာေပမ်ား၊ ပံုႏွိပ္စာအုပ္မ်ားႏွင့္ ဓာတ္ပံုအျဖစ္ မွတ္တမ္းတင္ခဲ့ေသာ ပံုရိပ္စာမ်ားကို ေလ့လာထိန္းသိမ္းရန္၊ ျပန္လည္ အသံုးျပဳရန္အတြက္ အက်ဳိးရွိေသာစနစ္တစ္ခု ျဖစ္သည္။ ကြန္ပ်ဴတာသံုး ျမန္မာစာစနစ္ အေကာင္အထည္ ေဖာ္ျခင္းအဖြဲ႕ လက္ေအာက္ရွိ ကြန္ပ်ဴတာသံုး ျမန္မာစာစနစ္ သုေတသန လုပ္ငန္းအဖြဲ႕သည္ သုေတသန လုပ္ငန္းမ်ားကို ျပဳလုပ္လ်က္ရွိၿပီး ယင္းမွရရွိလာသည့္ ကြန္ပ်ဴတာသံုး ျမန္မာစာစနစ္မ်ားကို အမ်ားျပည္သူ အသံုးျပဳႏိုင္ရန္ အခမဲ့ ျဖန္႔ခ်ိလ်က္ရွိေသာ အဖြဲ႔အစည္း တစ္ခုျဖစ္သည္။

ဝ၃၃

ဆက္စပ္သတင္းမ်ား

သတင္းမွ်ေဝရန္

About Author

စာဖတ္သူ မွတ္ခ်က္မ်ား (၀)

Leave a Reply

Your email address will not be published. Required fields are marked *

*