پنج شنبه 31 خرداد 1397 |  عضویت / ورود

تبدیل عکس به متن فارسی (OCR فارسی) با گوگل! (گوگل حتی دست‌خط شما و حتی خط نستعلیق را نیز تبدیل به متن می‌کند!)


یادش به خیر! دوازده سال پیش (سال ۸۵) وقتی نرم‌افزار ReadIRIS (مشهورترین نرم‌افزار تبدیل عکس به متن در دنیا) زبان عربی را پشتیبانی کرد، ما چقدر ذوق‌زده شدیم و درباره‌اش یک مطلب رفتیم: «OCR عربی! تبدیل عكس به متن تایپ شده با نرم افزار Readiris».

از آن زمان تا به حال، آن نرم‌افزار بهبودهایی داشت و حتی زبان فارسی را نیز به زبان‌های خود اضافه کرد، اما کسانی که با آن کار کرده باشند می‌دانند که حتی متن انگلیسی را هم آن‌طور که باید، تبدیل نمی‌کند چه برسد به فارسی!

اما، امروز چیزی را متوجه شدم که احتمالاً یکی از جذاب‌ترین چیزها برای فارسی‌زبانان است! یادتان هست سال ۹۳ در مطلب «تبدیل گفتار به نوشتار فارسی توسط گوگل (تست Persian Speech Recognition در Google Translate)»

باید عرض کنم که: گوگل بالاخره تبدیل عکس به متن فارسی (OCR فارسی) را به طور کامل پشتیبانی کرد!

(آپدیت: این امکان چند ماه پس از آن مطلب یعنی در حدود سال ۹۴ به گوگل اضافه شده است و پیش‌بینی من درست بوده)

OCR (مخفف Optical Charater Recognition و به معنی «تشخیص کاراکتر به صورت نوری») تکنولوژی‌ای است که به کمک آن می‌توان متن را از داخل عکس استخراج کرد.

طی ده سال گذشته، برای زبان فارسی، نمونه‌های ایرانی OCR توسط برخی شرکت‌ها تولید و عرضه شده بود اما قیمت آن‌ها به چند میلیون تومان می‌رسید. اما حالا، گوگل به رایگان این سرویس را در اختیار شما قرار داده است.

چگونه عکس را به متن تبدیل کنم؟ (فارسی یا انگلیسی یا هر زبان دیگر)

بسیار ساده است! کافی‌ست وارد Google Drive شوید: https://drive.google.com

عکسی که از یک نوشته گرفته‌اید (با دوربین ساده یا با اسکنر) در آنجا آپلود کنید.

روی عکس کلیک راست کنید و از زیرمنوی Open With گزینه Google Docs را انتخاب کنید، همین!

https://img.aftab.cc/news/97/google_ocr_farsi.png

پس از چند ثانیه:

https://img.aftab.cc/news/97/google_ocr_farsi.jpg

همانطور که می‌بینید، حتی یک کلمه را نیز غلط تبدیل نکرده! و این چیزی شبیه به معجزه است!

 

اما من پا را فراتر گذاشتم و بررسی کردم که آیا گوگل دست‌خط را نیز تشخیص می‌دهد؟ یک نوشته را با سه فونت مختلف نوشتم؛ نتیجه:

https://img.aftab.cc/news/97/google_ocr_persian.jpg

اگر کلمات را با فاصله مناسب و خوش‌خط نوشته باشید، تقریباً همه کلمات را صحیح تبدیل خواهد کرد!

 

حتی بیشتر: آمدم چلیپایی که دیشب نوشته بودم (و می‌دانید که چلیپا را به خاطر کج و فشرده بودن، انسان به زور می‌خواند!) آپلود و تست کردم! فکر نمی‌کردم که حتی یک کلمه آن را تشخیص دهد اما:

https://img.aftab.cc/news/97/google_ocr_persian_shab_khiz.jpg

 

 

رسماً باید اعلام کرد که شغلی به نام «تایپیست» به تاریخ پیوست!

چون شما یا متنی را می‌خوانید و گوگل برایتان می‌نویسد: «تبدیل گفتار به نوشتار فارسی توسط گوگل (تست Persian Speech Recognition در Google Translate)»

و یا می‌خواهید متنی را از داخل یک کتاب یا روزنامه و امثالهم تایپ کنید و یا نهایتاً یک سری مطلب را روی کاغذ نوشته‌اید و می‌خواهید آن را تایپ کنید که این دو مورد هم با کمک این مطلب انجام می‌شود! دیگر چه نیازی به تایپیست است؟

 

با توجه به اینکه ما در آفتابگردان مطالب و امکاناتی را برای فارسی‌نویسی بهتر تهیه کرده‌ایم و اینکه ابزارهای مختلفی برای این منظور توسط گوگل و دیگر شرکت‌ها طراحی شده است، نیاز به سایتی که این موارد را مجتمع کند، ضروری به نظر می‌رسید. بنابراین ما سایتی در این زمینه آماده کرده‌ایم که در پست‌های بعدی معرفی خواهد شد ;)

موفق باشید؛
حمید رضا نیرومند


[ارسال شده در مورخه : چهارشنبه، 2 خرداد، 1397 توسط Hamid]
[ #گوگل]



بازدیدها از این مطلب: 1167 بار   امتیاز متوسط : 0  تعداد آراء: 0   امتیاز دهید:

نظرات طرح شده

نام: [ کاربر جدید ]
ایمیل:

نظر:


اجازه استفاده از تگهای HTML را ندارید


جمع عدد 11 با 13 را در كادر زیر وارد نمایید:
(این كار برای جلوگیری از فعالیت موتورهای اسپمر است)


* توجه: نظر شما بعد از بررسی، نمایش داده خواهد شد.

ehsan                توسط ehsan در مورخه : چهارشنبه، 2 خرداد، 1397(لینک نظر)
سلام
عالی بود واقعا حال کردم
فقط یک نکته دیگه اینکه من رفتم یه فایل pdf فارسی رو اپلود کردم و با google docs باز کردم ببینم چی میشه، که نتیجه خوبی نداد
با یه نرم افزار دیگه همه صفحات pdf رو به عکس تبدیل کردم و بعد عکس ها رو اپلود کردم و دو برابر کیف کردم. بدون حتی یک غلط همه رو به متن فارسی درست تبدیل کرد.


[ ارسال جوابیه ]


منوچهر                توسط منوچهر در مورخه : چهارشنبه، 2 خرداد، 1397(لینک نظر)
با سلام و تشکر بابت 2 مطلب اخیر.2 مورد دیگه رو هم متوجه شدم.اول اینکه ocr فارسی گوگل صفحات 2 ستونه رو بخوبی تشخیص نمیده و کلا بصورت سطر به سطر متن رو ایجاد میکنه.مثلا سطر اول ستون 1 و سطر اول ستون 2
و اینکه مثل خیلی از ocr های دیگه هنوز جداول رو نمیتونه درست تشخیص بده.
ولی با این وجود ocr گوگل بسیار بسیار عالی هست


[ ارسال جوابیه ]


omid (امتیاز : 0)(لینک نظر)
توسط omid در مورخه : پنجشنبه، 3 خرداد، 1397
سلام. ممنونم، عالی بود...


[ ارسال جوابیه ]


Hamid (امتیاز : 1)(لینک نظر)
توسط Hamid در مورخه : پنجشنبه، 3 خرداد، 1397
من باید یک آپدیت و یک عذرخواهی به این مطلب اضافه کنم: جستجو کردم و متوجه شدم که ظاهراً این امکان حدود ۳ سال هست که به گوگل درایو اضافه شده بوده و من (و بسیاری افراد دیگه) خبر نداشتم :(
عجیبه که در لابه‌لای این همه خبر، خبر به این مهمی چندان در وب داغ نشد!


[ ارسال جوابیه ]

    [بدون موضوع] (امتیاز : 0)
    توسط کاربر مهمان در مورخه : چهارشنبه، 9 خرداد، 1397
    اتفاقا من تعجب کردم چرا الان این مطلب رونوشتید، یا مثلا مطلب قدیمی رو دوباره آوردید بالا مثلا.


    [ ارسال جوابیه ]


qwerty13                توسط qwerty13 در مورخه : پنجشنبه، 3 خرداد، 1397(لینک نظر)
یک پروژه ای انگار با کمک این زدن دوستان انگار:

http://pactos.net/817


[ ارسال جوابیه ]


a_computing_engineer                توسط a_computing_engineer در مورخه : پنجشنبه، 3 خرداد، 1397(لینک نظر)
با سلام.
مقاله ی جالب و خوبی بود و امیدوارم در راه اندازی وب سایت جدید تخصصی ذکر شده موفق باشید.
یک نکته ی جالب دیگری هم که وجود دارد و خواستم اینجا مطرح شود، افزایش قدرت خود Google Translate می باشد. زمانی بود که این ابزار، یک جمله ی ساده مثل I am a student را با خطا ترجمه می کرد، اما مدتی است که حتی متن های طولانی را هم چنان ترجمه می کند که باورش سخت می شود ...

به نظر می رسد شرکت گوگل با قدرت، در حال کار بر روی آزمودن و توسعه ی تکنولوژی "یادگیری ماشین" است که مسلما خود بخشی از پروژه های بلندپروازانه ی این شرکت خواهند بود و به همین خاطر این ابزارها رایگان هستند، درواقع هر بار که کاربری از این ابزار ها استفاده می کند، یک معامله ی برد برد رخ می دهد و هم کاربر و هم شرکت گوگل سود می برند. البته من خیلی کم در مورد این پروژه های بلندپروازانه ی گوگل خوانده ام و نمی توانم زیاد توضیح بدهم اما اگر مایل باشید تحقیق کنید، Google X را در اینترنت جستجو کنید.

از همان مطالعه ی اندک می دانم یکی از پروژه های Google X خودروهای بدون سرنشین هستند. فرض کنید چند سال دیگر، این خودروها وارد بازار ایران نیز بشوند. خب، مسلما باید علائم رانندگی مانند تابلوهای اسامی خیابان ها توسط این خودروها تشخیص داده شوند. پس می بینیم که کاملا طبیعی است که شرکت گوگل بر روی OCR فارسی هم کار بکند و همچنین کاملا منطقی به نظر می رسد که علیرغم پیچیدگی و عظمت تکنولوژی مستقر در پس زمینه، این ابزار ارزشمند، رایگان باشد ...

البته خدا رو شکر، پروژه های Google X کاملا انسان دوستانه و کمک کننده به جامعه ی بشری آینده هستند مثلا یکی دیگر از پروژه ها، در زمینه ی ساخت گلوبول های سفید مصنوعی (نانو روبات های پزشکی) می باشد که روزی بتواند سخت ترین بیماری ها را نیز درمان کند ...

موفق باشید.


[ ارسال جوابیه ]


SAHHH                توسط SAHHH در مورخه : جمعه، 4 خرداد، 1397(لینک نظر)
استاد به نظر شما درآمد گوگل از کجا یا از کیه؟


[ ارسال جوابیه ]


مصطفی                توسط مصطفی در مورخه : یکشنبه، 6 خرداد، 1397(لینک نظر)
برای من که اصلا توی open with برای فایل jpg ، 'گوگل داکس رو نمیاره. حتی از داخل گوگل داکس هم میرم فایل عکسی رو باز نمیکنه


[ ارسال جوابیه ]


مهدی (امتیاز : 0)(لینک نظر)
توسط مهدی در مورخه : چهارشنبه، 9 خرداد، 1397
مهندس جان سلام. گوگل فایلهای pdf رو تبدیل به متن نمی کنه. راهکارتون چیه؟


[ ارسال جوابیه ]

    Hamid (امتیاز : 1)
    توسط Hamid در مورخه : چهارشنبه، 9 خرداد، 1397
    سلام.
    خیلی ساده‌ست: تبدیل به عکس کنید و بعد، از همین مطلب استفاده کنید...
    مبدیل pdf به عکس در اینترنت زیاد هست ضمن اینکه خودتون هم می‌تونید Print Screen بگیرید و ذخیره کنید.


    [ ارسال جوابیه ]