یادش به خیر! دوازده سال پیش (سال ۸۵) وقتی نرمافزار ReadIRIS (مشهورترین نرمافزار تبدیل عکس به متن در دنیا) زبان عربی را پشتیبانی کرد، ما چقدر ذوقزده شدیم و دربارهاش یک مطلب رفتیم: «OCR عربی! تبدیل عكس به متن تایپ شده با نرم افزار Readiris».
از آن زمان تا به حال، آن نرمافزار بهبودهایی داشت و حتی زبان فارسی را نیز به زبانهای خود اضافه کرد، اما کسانی که با آن کار کرده باشند میدانند که حتی متن انگلیسی را هم آنطور که باید، تبدیل نمیکند چه برسد به فارسی!
اما، امروز چیزی را متوجه شدم که احتمالاً یکی از جذابترین چیزها برای فارسیزبانان است! یادتان هست سال ۹۳ در مطلب «تبدیل گفتار به نوشتار فارسی توسط گوگل (تست Persian Speech Recognition در Google Translate)»
باید عرض کنم که: گوگل بالاخره تبدیل عکس به متن فارسی (OCR فارسی) را به طور کامل پشتیبانی کرد!
(آپدیت: این امکان چند ماه پس از آن مطلب یعنی در حدود سال ۹۴ به گوگل اضافه شده است و پیشبینی من درست بوده)
OCR (مخفف Optical Charater Recognition و به معنی «تشخیص کاراکتر به صورت نوری») تکنولوژیای است که به کمک آن میتوان متن را از داخل عکس استخراج کرد.
طی ده سال گذشته، برای زبان فارسی، نمونههای ایرانی OCR توسط برخی شرکتها تولید و عرضه شده بود اما قیمت آنها به چند میلیون تومان میرسید. اما حالا، گوگل به رایگان این سرویس را در اختیار شما قرار داده است.
چگونه عکس را به متن تبدیل کنم؟ (فارسی یا انگلیسی یا هر زبان دیگر)
بسیار ساده است! کافیست وارد Google Drive شوید: https://drive.google.com
عکسی که از یک نوشته گرفتهاید (با دوربین ساده یا با اسکنر) در آنجا آپلود کنید.
روی عکس کلیک راست کنید و از زیرمنوی Open With گزینه Google Docs را انتخاب کنید، همین!
پس از چند ثانیه:
همانطور که میبینید، حتی یک کلمه را نیز غلط تبدیل نکرده! و این چیزی شبیه به معجزه است!
اما من پا را فراتر گذاشتم و بررسی کردم که آیا گوگل دستخط را نیز تشخیص میدهد؟ یک نوشته را با سه فونت مختلف نوشتم؛ نتیجه:
اگر کلمات را با فاصله مناسب و خوشخط نوشته باشید، تقریباً همه کلمات را صحیح تبدیل خواهد کرد!
حتی بیشتر: آمدم چلیپایی که دیشب نوشته بودم (و میدانید که چلیپا را به خاطر کج و فشرده بودن، انسان به زور میخواند!) آپلود و تست کردم! فکر نمیکردم که حتی یک کلمه آن را تشخیص دهد اما:
رسماً باید اعلام کرد که شغلی به نام «تایپیست» به تاریخ پیوست!
چون شما یا متنی را میخوانید و گوگل برایتان مینویسد: «تبدیل گفتار به نوشتار فارسی توسط گوگل (تست Persian Speech Recognition در Google Translate)»
و یا میخواهید متنی را از داخل یک کتاب یا روزنامه و امثالهم تایپ کنید و یا نهایتاً یک سری مطلب را روی کاغذ نوشتهاید و میخواهید آن را تایپ کنید که این دو مورد هم با کمک این مطلب انجام میشود! دیگر چه نیازی به تایپیست است؟
با توجه به اینکه ما در آفتابگردان مطالب و امکاناتی را برای فارسینویسی بهتر تهیه کردهایم و اینکه ابزارهای مختلفی برای این منظور توسط گوگل و دیگر شرکتها طراحی شده است، نیاز به سایتی که این موارد را مجتمع کند، ضروری به نظر میرسید. بنابراین ما سایتی در این زمینه آماده کردهایم که در پستهای بعدی معرفی خواهد شد ;)
موفق باشید؛
حمید رضا نیرومند