OCR چیست؟

OCR که مخفف Optical Character Recognition به معنای نویسه خوان نوری است، وظیفه ی آن تشخیص اتوماتیک متن ها در تصاویر و یا اسناد و تبدیل آن به متن قابل جستجو و ویرایش در رایانه می باشد. یک تصویر یا یک سند ممکن است از نظر انسان ارزش اطلاعاتی بسیاری داشته باشد اما از دید کامپیوتر آن سند فقط متشکل از چند پیکسل ساده است که یک تصویر را تشکیل داده است. برای این که بتوانیم از اطلاعات نوشتاری در تصاویر یا اسناد در رایانه استفاده کنیم باید از نرم افزارهای OCR استفاده کنیم.

OCR در ابتدا برای شناسایی ارقام و حروف در اسناد چاپی استفاده میشد. نرم افزارهای نویسه خوان نوری متن آن اسناد چاپی را می خواند و آن را به قالب قابل ویرایش در کامپیوتر تبدیل می کرد. با این که تصاویر اسکن شده در رایانه بسیار سنگین هستند و امکان جستجو در آن ها وجود ندارد اما خروجی فایل هایی که خروجی نرم افزار های نویسه خوان هستند بسیار کم حجم تر از تصاویر بوده و می توان به راحتی یک متن در آن جستجو کرد.

نرم افزارهای نویسه خوان نوری همانند بسیاری از نرم افزارهای هوشمند دیگر، دارای پیچیدگی های زیادی هستند که میزان این پیچیدگی در زبان های گوناگون متفاوت است. برای مثال زبان هایی که حروف آن به صورت جدا از هم و مجزا نوشته می شود آسان تر از زبان هایی هستند که یک کلمه به کلمه ای دیگر می چسبد. مثالا تشخیص حروف انگلیسی بسیار آسان تر از تشخیص حروف فارسی و یا عربی است. تعداد کم کاربران زبان فارسی و تشخیص سخت حروف آن باعث شده نرم افزارهای نویسه خوان فارسی نقاط ضعف زیادی داشته باشند.

کاربرد OCR

برخی از کاربردهای نرم افزارهای نویسه خوان را در زیر شرح می دهیم:

استخراج اطلاعات کلیدی از اسناد
امکان جستجو و ویرایش در خروجی فایل های OCR شده
فریب سامانه های آنتی ربات مثل گوگل ری کپچا
کمک به نابینایان

نرم افزارهای OCR

شما می توانید از نرم افزار های زیر برای تبدیل تصاویر به فایل متنی استفاده کنید.

Readiris
ABBYY FineReader 14
ابی فاین‌ریدر آنلاین
Microsoft OneNote
Free OCR

مببع: سایت ویکی پدیا

میانگین امتیازات ۵ از ۵

از مجموع ۲ رای

OCR چیست؟

کاربرد OCR

نرم افزارهای OCR

دیدگاهتان را بنویسید

دیدگاهتان را بنویسید لغو پاسخ

تماس با ما:

ساعات کاری

صفحات مهم سایت

مجوز های راسل پرینت