OCR چیست؟
OCR که مخفف Optical Character Recognition به معنای نویسه خوان نوری است، وظیفه ی آن تشخیص اتوماتیک متن ها در تصاویر و یا اسناد و تبدیل آن به متن قابل جستجو و ویرایش در رایانه می باشد. یک تصویر یا یک سند ممکن است از نظر انسان ارزش اطلاعاتی بسیاری داشته باشد اما از دید کامپیوتر آن سند فقط متشکل از چند پیکسل ساده است که یک تصویر را تشکیل داده است. برای این که بتوانیم از اطلاعات نوشتاری در تصاویر یا اسناد در رایانه استفاده کنیم باید از نرم افزارهای OCR استفاده کنیم.
OCR در ابتدا برای شناسایی ارقام و حروف در اسناد چاپی استفاده میشد. نرم افزارهای نویسه خوان نوری متن آن اسناد چاپی را می خواند و آن را به قالب قابل ویرایش در کامپیوتر تبدیل می کرد. با این که تصاویر اسکن شده در رایانه بسیار سنگین هستند و امکان جستجو در آن ها وجود ندارد اما خروجی فایل هایی که خروجی نرم افزار های نویسه خوان هستند بسیار کم حجم تر از تصاویر بوده و می توان به راحتی یک متن در آن جستجو کرد.
نرم افزارهای نویسه خوان نوری همانند بسیاری از نرم افزارهای هوشمند دیگر، دارای پیچیدگی های زیادی هستند که میزان این پیچیدگی در زبان های گوناگون متفاوت است. برای مثال زبان هایی که حروف آن به صورت جدا از هم و مجزا نوشته می شود آسان تر از زبان هایی هستند که یک کلمه به کلمه ای دیگر می چسبد. مثالا تشخیص حروف انگلیسی بسیار آسان تر از تشخیص حروف فارسی و یا عربی است. تعداد کم کاربران زبان فارسی و تشخیص سخت حروف آن باعث شده نرم افزارهای نویسه خوان فارسی نقاط ضعف زیادی داشته باشند.
کاربرد OCR
برخی از کاربردهای نرم افزارهای نویسه خوان را در زیر شرح می دهیم:
- استخراج اطلاعات کلیدی از اسناد
- امکان جستجو و ویرایش در خروجی فایل های OCR شده
- فریب سامانه های آنتی ربات مثل گوگل ری کپچا
- کمک به نابینایان
نرم افزارهای OCR
شما می توانید از نرم افزار های زیر برای تبدیل تصاویر به فایل متنی استفاده کنید.
- Readiris
- ABBYY FineReader 14
- ابی فاینریدر آنلاین
- Microsoft OneNote
- Free OCR
مببع: سایت ویکی پدیا
دیدگاهتان را بنویسید
می خواهید در گفت و گو شرکت کنید؟خیالتان راحت باشد :)