كيفية تحويل ملف PDF عربي مع الحفاظ على التشكيل
التشكيل في النصوص العربية ليس زخرفة، بل أداة دلالية ضرورية. كلمة "كَتَبَ" مختلفة عن "كُتُب"، و"عُلِمَ" مختلفة عن "عَلِمَ". عندما تحوّل ملف PDF عربي مشكول إلى Word ويختفي التشكيل، قد يتغير المعنى تماماً وقد تفقد قيمة الوثيقة. في هذا الدليل العملي، سنرى لماذا تفشل أغلب المواقع في الحفاظ على التشكيل، وكيف تنجز العملية بشكل صحيح من المرة الأولى.
لماذا يفقد التشكيل أثناء التحويل؟
فهم السبب التقني يساعد في تجنّب المشكلة. هناك ثلاثة سيناريوهات شائعة:
- PDF نصي قابل للنسخ: الملف يحتوي على نص رقمي مباشرة. التشكيل موجود كرموز يونيكود مدمجة. النص يجب أن يُنقل بدقة، لكن بعض المحولات تُسقط الحروف "المركبة" أو تستبدلها بحروف أساسية فقط.
- PDF ممسوح ضوئياً: الملف عبارة عن صور لصفحات. الحرف العربي والتشكيل ليسا نصاً، بل بكسلات. هنا OCR هو من يقرر الجودة. أغلب أنظمة OCR العامة (Tesseract الافتراضي مثلاً) لا تُدرّب على الحفاظ على التشكيل.
- PDF مختلط: صفحات نصية وأخرى ممسوحة. هذا أصعب: الأداة يجب أن تتعرف على نوع كل صفحة وتعالجها بالمحرك المناسب.
اختبار سريع: هل ملفك نصي أم صورة؟
افتح ملف PDF في متصفحك أو في Adobe Reader. حاول تحديد كلمة بالماوس. إذا تحدّدت بحدودها الدقيقة، فالملف نصي. إذا تحدّدت كصورة كاملة (مستطيل صلب)، فالملف ممسوح ضوئياً ويحتاج OCR.
الخطوات العملية للتحويل الصحيح
سنشرح هنا الطريقة الصحيحة باستخدام TheDocMaker. الخطوات نفسها تنطبق على أي خدمة جدية، لكن النتيجة تختلف جذرياً حسب جودة محرك التحويل.
الخطوة 1: تحضير الملف
إذا كان الملف ممسوحاً ضوئياً، تأكد من جودته:
- الدقة 300 DPI أو أعلى. للنصوص المشكولة كاملة، 400 DPI أفضل.
- الإضاءة موزعة بانتظام، لا ظلال على نصف الصفحة.
- الصفحة مستقيمة. إن كانت مائلة بشكل ملحوظ، استخدم أداة مجانية مثل ScanTailor لتعديلها قبل الرفع.
- إذا كان الورق قديماً والمسح به اصفرار شديد، يفضّل تحويله إلى أبيض وأسود قبل الرفع لتحسين دقة OCR.
الخطوة 2: الرفع إلى TheDocMaker
افتح thedocmaker.com، ثم اسحب ملف PDF أو اضغط على زر الرفع واخْتَرْه من جهازك. سيقوم النظام تلقائياً بـ:
- اكتشاف عدد الصفحات.
- تحديد ما إذا كان الملف نصياً أم ممسوحاً.
- عرض السعر المناسب (مجاني حتى 3 صفحات).
الخطوة 3: تأكيد التحويل
إذا كان الملف 3 صفحات أو أقل، التحويل يبدأ مباشرة. إذا كان أكبر، اختر الباقة وادفع. أكثر طرق الدفع راحة في المنطقة العربية:
- Ziina للإمارات.
- مدى وSTC Pay للسعودية.
- Visa/Mastercard من أي بلد.
- Apple Pay وGoogle Pay.
الخطوة 4: تنزيل ملف Word واختباره
بعد بضع ثوانٍ، يُنتج الملف. حمّله وافتحه في Microsoft Word أو LibreOffice. تحقق من:
- وجود التشكيل في كل الكلمات المشكولة بالأصل.
- الاتجاه من اليمين إلى اليسار.
- الخطوط (لا تتوقع خطاً مطابقاً 100%، لكن خطاً عربياً مقبولاً).
- الجداول والصور.
مقارنة قبل/بعد: عينة فعلية
أصل النص في PDF (سورة الفاتحة):
عند التحويل عبر مواقع عامة (مثل بعض المحولات المجانية)، النتيجة الشائعة:
التشكيل اختفى تماماً. أما عبر TheDocMaker بـ OCR العربي المتخصص:
المشاكل الشائعة وحلولها
المشكلة 1: ملف PDF لا يقبل التحويل
أحياناً يرفض الموقع الملف. الأسباب الشائعة:
- الملف محمي بكلمة مرور: فك الحماية أولاً عبر أداة مثل qpdf أو Adobe Acrobat، أو أدخل كلمة المرور في خانة الرفع.
- الملف فاسد: أعد تنزيله من المصدر. إن استمرت المشكلة، افتحه في Adobe Reader واحفظه نسخة جديدة (File → Save As).
- الحجم كبير جداً: ضغّطه عبر أدوات مجانية كـ smallpdf compress أو ilovepdf compress قبل الرفع.
المشكلة 2: الحروف العربية تظهر معكوسة في Word
إذا فتحت الملف في Word ووجدت الحروف "بد ة لا مد" بدل "محمد"، هذا خلل في الترميز. الحل:
- تأكد من اختيار الخط العربي في Word: Arial، Tahoma، أو Cairo.
- اضبط الاتجاه عبر Ctrl+Shift+حق (يمين) لجعل الفقرة RTL.
- إذا استمرت المشكلة، الملف الناتج مكسور التشفير. أعد المحاولة مع TheDocMaker لأن المحرك يضمن ترميز Unicode صحيح.
المشكلة 3: الصور تظل كصور والنص لا يستخرج
هذا يعني أن الصفحة ممسوحة ضوئياً ومحرك OCR ربما لم يُفعّل. تأكد من رفع الملف عبر صفحة OCR المتقدمة. مع TheDocMaker، الكشف تلقائي.
المشكلة 4: ضياع التنسيق (الجداول، الأعمدة)
النصوص العربية ذات التنسيق المعقد قد تفقد بنيتها. لتقليل هذا:
- تأكد من أن جودة المسح ممتازة.
- صفحات بأعمدة متعددة قد تحتاج معالجة يدوية بعد التحويل.
- الجداول البسيطة تنتقل بدقة. الجداول المعقدة بدمج خلايا قد تحتاج تعديلاً.
نصائح متقدمة لجودة أعلى
- قسّم الملفات الكبيرة: ملف 200 صفحة قد يستغرق وقتاً طويلاً. قسّمه إلى أربعة أجزاء كل منها 50 صفحة لتسريع المعالجة وتسهيل المراجعة.
- راجع الكلمات النادرة: أسماء الأعلام، المصطلحات التقنية، والأرقام الكبيرة هي أكثر ما يُخطئ فيه OCR. خصص دقائق لمراجعتها.
- احتفظ بالأصل: لا تحذف ملف PDF الأصلي بعد التحويل. قد تحتاج العودة إليه إذا اكتشفت خطأً لاحقاً.
- للنصوص الدينية: راجع التشكيل آية بآية. حتى أفضل OCR قد يخطئ في حالة واحدة من ألف.
- للنصوص القانونية: طابقها مع الأصل قبل أي استخدام رسمي.
خلاصة
تحويل PDF عربي مع الحفاظ على التشكيل ممكن جداً، شرط استخدام أداة مصممة خصيصاً للنصوص العربية، وتحضير ملف PDF بجودة جيدة. TheDocMaker بُني من البداية لهذا الهدف، وأول 3 صفحات مجانية تتيح لك اختبار النتيجة قبل الالتزام. للمزيد عن تقنية OCR العربية المتقدمة، اطلع على صفحة OCR العربي.
جرّب TheDocMaker الآن مجاناً على ملفك العربي
ابدأ التحويل الآن