یکی از مشکلات فارسیزبانان تبدیل PDF فارسی به text است. برخی PDFها با خودِ Word به PDF تبدیل شدهاند؛ این فایلها معمولاً به راحتی با انتخاب متن در Acrobat Reader و کپی کردن در ورد، مشکلشان حل میشود. اما اگر پیدیاف با ابزارهای جانبی ساخته شده باشد و یا رمزنگاری شده باشد، با کپی کردن متن، متون خرچنگ قورباغه کپی میشود!
یک ترفند که باید ابتدا تست شود این است که فایل PDF را در گوگل درایو خود آپلود کنید:
https://drive.google.com/drive/u/0
و سپس روی آن فایل کلیک راست کنید و از منوی Open with گزینه Google Docs را انتخاب کنید.
اگر خوششانس باشید، تمام متون با عکسها و جدولها و... استخراج و تبدیل به فایل word میشود.
ابتدا PDF خود را به این سایت بدهید و ببینید نتیجهای حاصل میشود؟
تیر آخر که قطعاً جواب خواهد داد این است که PDF تبدیل به عکس شود و سپس با کمک Google Drive تبدیل به متن شود.
برای تبدیل PDF به عکس از سایت زیر کمک بگیرید:
https://pdftoimage.com/pdf-to-png
سپس عکسها را در یک پوشه در Google Drive آپلود کنید و یکی یکی روی آن کلیک راست کنید و Open with > Google Docs را انتخاب کنید.
همین!
و یا اگر مثلاً فقط یک پاراگراف از کتاب را نیاز دارید، خیلی راحت Print Screen بگیرید و در Paint با فرمت png ذخیره کنید و سپس با گوگل درایو تبدیل به متن کنید.
توجه: این ترفند باید ۱۰۰٪ جواب بدهد، پس اگر موفق نشدید یعنی یک جای کار را اشتباه رفتهاید.
مطلب پیشنهادی:
اگر ویندوز ۱۱ دارید:
قابلیت OCR فارسی ویندوز ۱۱ - در چند ثانیه و به راحتی متن داخل عکسها را کپی کنید!
موفق باشید؛
حمید رضا نیرومند