OCR چیست؟

OCR که مخفف Optical Character Recognition به معنای نویسه خوان نوری است، وظیفه ی آن تشخیص اتوماتیک متن ها در تصاویر و یا اسناد و تبدیل آن به متن قابل جستجو و ویرایش در رایانه می باشد. یک تصویر یا یک سند ممکن است از نظر انسان ارزش اطلاعاتی بسیاری داشته باشد اما از دید کامپیوتر آن سند فقط متشکل از چند پیکسل ساده است که یک تصویر را تشکیل داده است. برای این که بتوانیم از اطلاعات نوشتاری در تصاویر یا اسناد در رایانه استفاده کنیم باید از نرم افزارهای OCR استفاده کنیم.

تبدیل اسناد به متن به وسیله سیستم OCR

OCR در ابتدا برای شناسایی ارقام و حروف در اسناد چاپی استفاده میشد. نرم افزارهای نویسه خوان نوری متن آن اسناد چاپی را می خواند و آن را به قالب قابل ویرایش در کامپیوتر تبدیل می کرد. با این که تصاویر اسکن شده در رایانه بسیار سنگین هستند و امکان جستجو در آن ها وجود ندارد اما خروجی فایل هایی که خروجی نرم افزار های نویسه خوان هستند بسیار کم حجم تر از تصاویر بوده و می توان به راحتی یک متن در آن جستجو کرد.

نرم افزارهای نویسه خوان نوری همانند بسیاری از نرم افزارهای هوشمند دیگر، دارای پیچیدگی های زیادی هستند که میزان این پیچیدگی در زبان های گوناگون متفاوت است. برای مثال زبان هایی که حروف آن به صورت جدا از هم و مجزا نوشته می شود آسان تر از زبان هایی هستند که یک کلمه به کلمه ای دیگر می چسبد. مثالا تشخیص حروف انگلیسی بسیار آسان تر از تشخیص حروف فارسی و یا عربی است. تعداد کم کاربران زبان فارسی و تشخیص سخت حروف آن باعث شده نرم افزارهای نویسه خوان فارسی نقاط ضعف زیادی داشته باشند.

 

کاربرد OCR

برخی از کاربردهای نرم افزارهای نویسه خوان را در زیر شرح می دهیم:

  1. استخراج اطلاعات کلیدی از اسناد
  2. امکان جستجو و ویرایش در خروجی فایل های OCR شده
  3. فریب سامانه های آنتی ربات مثل گوگل ری کپچا
  4. کمک به نابینایان

 

نرم افزارهای OCR

شما می توانید از نرم افزار های زیر برای تبدیل تصاویر به فایل متنی استفاده کنید.

  1. Readiris
  2. ABBYY FineReader 14
  3. ابی فاین‌ریدر آنلاین
  4. Microsoft OneNote
  5. Free OCR

محیط نرم افزار free OCR

مببع: سایت ویکی پدیا

پیکسل چیست؟

واژه‌ی پیکسل از عبارت عنصر عکس آمده است و کوچکترین عنصر هر عکس می‌باشد. همچنین واحد قابل برنامه نویسی رنگی نیز به حساب می‌آید. این واحد بیشتر از آن که واحدی فیزیکی باشد، واحد منطقی به حساب می‌آید که اندازه‌ی فیزیکی آن به میزان رزولوشن صفحه نمایش شما بستگی دارد. اگر رزولوشن صفحه نمایش را به بیشترین میزان ممکن تنظیم کنید، اندازه فیزیکی هر پیکسل با اندازه فیزیکی هر نقطه از صفحه نمایش برابر است. همچنین اگر رزولوشن عکس کمتر از مقدار بیشینه باشد، اندازه‌ی پیکسل بزرگ‌تر از اندازه هر نقطه از صفحه نمایش خواهد بود، بنابراین هر پیکسل بیشتر از یک نقطه را خواهد گرفت.

با بیش از حد زوم کردن به عکسی می‌توانید درک بهتری از آن داشته باشید، همانطور که در عکس زیر می‌بینید:

همانطور که در عکس می‌بینید، فرد دیده شده در عکس ۱۶۰۰ درصد زوم شده است. هر کدام از بلوک‌های دیده شده، در واقع یک پیکسلی از عکس می‌باشند. به هر تصویری که در صفحه نمایش رایانه وجود دارد نیز زوم کنید، دقیقا پیکسل‌ها دیده می‌شوند. این قانون در مورد عکس‌های پرینت شده نیز صدق می‌کند که از چندین نقطه کوچک تشکیل شده است که با معیاری به نام DPI سنجیده می‌شود.

حتما بخوانید
DPI و PPI چیست؟

پیکسل های صفحه نمایش

به عنوان مثال به عکس زیر که پیکسل‌های یک صفحه نمایش را از نزدیک نشان می‌دهد، دقت کنید. همانطور که مشاهده می‌کنید به حروف he از کلمه‌ی help زوم شده است، با این کار قطعا درک بهتری از کارکرد صفحه نمایش خواهید داشت. در این صفحه نمایش، برای دیده شدن رنگ‌های مختلف غلظت نور‌های قرمز، سبز و آبی (RGB) را تغییر می‌دهند. در واقع رنگی که پیکسل به خود می‌گیرد، ترکیبی از ۳ رنگ RGB می‌باشد. جالب است بدانید تا ۳ بیت از هر داده برای مشخص کردن رنگ پیکسل استفاده می‌شود.

حتما بخوانید
مدل رنگی RGB

پیکسل در مانیتور

 

پیکسل مرده

این اصطلاح هنگامی استفاده می‌شود که دیگر نوری به پیکسل تابانده نشود. این مشکل ممکن است برای هر نوع LCD مانند صفحه نمایش رایانه‌ها، تلفن‌های هوشمند یا حتی تلویزیون‌ها پیش بیاید. معمولا پیکسل‌های مرده در پیش زمینه‌ی سفید به خوبی نمایان می‌شوند و در نتیجه راحت‌تر تشخیص داده می‌شوند.

پیکسل گیر افتاده

این اصطلاح هنگامی به کار می‌رود که با وجود اینکه به پیکسلی نور می‌رسد دیگر تغییر رنگ نمی‌دهد. به عنوان مثال پیکسلی زرد رنگ را در نظر بگیرید که رنگ زرد را به خود گرفته ولی وقتی که باید به سبز رنگ شود، باز هم به رنگ زرد باقی می‌ماند. معمولا پیکسل‌های گیر افتاده در پیش زمینه‌هایی مشکی به راحتی تشخیص داده می‌شوند.

پیکسل مرده و پیکسل گیرافتاده

منبع: سایت www.computerhope.com

رزولوشن عکس

کیفیت و یا رزولوشن عکس در صنعت چاپ عاملی بسیار مهم می‌باشد. اگر رزولوشن بسیار کم باشد، عکس ها در چاپ تار و یا پیکسلی دیده می‌شوند و اگر رزولوشن بالایی داشته باشند، حجم فایل بالا رفته و در نتیجه آپلود کردن آن‌ها سخت و زمانگیر خواهد بود.

برای رسیدن به نتیجه‌ی مطلوب، توصیه می‌شود تا رزولوشن خود را در بازه‌ی ۱۵۰ تا ۳۰۰ (DPI) تنظیم نمایید.

رزولوشن عکس چیست؟

به تعداد پیکسل‌های موجود در هر اینچ از عکس رزولوشن می‌گویند. اگر در هر عکسی در رایانه‌ زوم کنید، متوجه خواهید شد که از مربع‌های کوچکی به نام پیکسل تشکیل شده است. هرچه تعداد این پیکسل‌ها بیشتر باشد، رزولوشن یا dpi عکس نیز بیشتر خواهد بود. عکس‌هایی که رزولوشن پایینی دارند، در صفحه نمایش و یا روی کاغذ، تار و پیکسل پیکسل دیده می‌شوند.

picture resolutionresolution value

 

رابطه ی بزرگ کردن عکس‌ها با رزولوشن عکس

هر وقت عکسی را بزرگ کنید، درواقع رزولوشن  را کاهش داده‌اید. به زبانی دیگر با بزرگتر کردن عکس، پیکسل‌های عکس باید ناحیه‌ی بزرگتری را پوشش دهند. به عنوان مثال اگر کیفیت عکسی ۱۵۰ (DPI) باشد و آن را ۲ برابر بزرگتر کنید، کیفیت عکس به ۷۵ (DPI) معادل نصف رزولوشن اولیه می‌رسد.

حتما بخوانید
DPI و PPI چیست؟

اگر می‌خواهید عکسی بزرگتر برای چاپ کردن داشته باشید، از ابتدا باید به دنبال عکس‌هایی با رزولوشن بیشتری باشید. برای نمونه عکسی با ۳۰۰ DPI را ‌می‌توانید تا ۲ برابر بزرگ کنید، بدون آنکه با مشکلی مواجه شوید زیرا حتی بعد از بزرگ کردن نیز رزولوشن عکس به ۱۵۰ DPI می‌رسد که برای چاپ مناسب می‌باشد.

انتخاب رزولوشن عکس در اسکنر

اسکنر‌های زیادی اجازه‌ی انتخاب رزولوشن از میان مقادیر ۷۵ DPI تا ۶۰۰ DPI و یا حتی بالاتر را به شما می‌دهند. بنابراین می‌توانید عکس های کوچک را با کیفیتی بالا اسکن کنید و سپس تا جایی که کیفیت آن بالاتر از ۱۵۰ DPI باشد، عکس را بزرگ نمایید.

حتما بخوانید
چاپ دیجیتال

رزولوشن عکس های موجود در اینترنت

عکس‌های موجود در اینترنت به خاطر افزایش سرعت لود سایت، معمولا رزولوشن بسیار پایینی دارند. اگر قصد بزرگ کردن عکس‌های کوچک موجود در اینترنت را دارید، احتمالا رزولوشن عکس مورد نظر شما به شدت افت خواهد کرد. بنابراین توصیه می‌شود، به دنبال بزرگترین عکس در اینترنت باشید تا هنگام چاپ کیفیت آن کم نباشد.

 

موارد بالا، نکات حائز اهمیت رزولوشن عکس بودند. نکاتی که رعایت تمامی آن‌ها باعث می‌شود عکس‌ها با کیفیت بهتری چاپ و دیده شوند.

 

منبع: سایت نیوز پیپر کلاب