If you do not find what you're looking for, you can use more accurate words.
يتضمن التعرف على خط اليد دون اتصال التحويل التلقائي للنص الموجود في صورة ما إلى رموز أحرف قابلة للاستخدام في تطبيقات معالجة النصوص والحاسوب. تعتبر البيانات التي تم الحصول عليها بواسطة هذا النموذج بمثابة تمثيل ثابت من الكتابة اليدوية. من الصعب نسبيا التعرف على خط اليد، لأن كثير من الناس لديهم أنماط مختلفة في الكتابة اليدوية. ولذلك تركز محركات OCR بشكل أساسي على النص المطبوع على الآلة فيما تركز ICR على خط اليد «المكتوب بحروف كبيرة».
تضييق نطاق المشكلة غالبًا ما يساعد على زيادة دقة أنظمة التعرف على الكتابة اليدوية. على سبيل المثال، قد يحتوي حقل نموذج لرمز بريدي بالولايات المتحدة على الأرقام من 0 إلى 9 فقط. هذه الحقيقة من شأنها أن تقلل من عدد الهويات الممكنة.
الأساليب الأساسية:
عادةً ما يتضمن التعرف على الأحرف (بدون اتصال) على فحص نموذج أو مستند مكتوب في وقت ما في الماضي. هذا يعني أنه يجب استخراج الأحرف الفردية الموجودة في الصورة الممسوحة ضوئيًا. توجد أدوات قادرة على تنفيذ هذه الخطوة. ولكن هنالك بعض العيوب في هذه الخطوة أكثرها شيوعا الحروف المتصلة. وهذا يسبب مشكلة كبيرة في مرحلة التعرف. ورغم ذلك هنالك العديد من الخوارزميات المتاحة التي تقلل من مشاكل الحروف المتصلة.
بعد استخراج الأحرف الفردية، يتم استخدام محرك التعرف لإيجاد حرف الحاسوب المطابق. وتوجد عدة تقنيات مختلفة المتاحة حاليا التعرف والمطابقة.
تعمل طريقة استخراج الميزات أو الخصائص بطريقة مشابهة لمعرفات الشبكة العصبية. ومع ذلك، يجب على المبرمجين تحديد الخصائص التي يشعرون أنها مهمة.
بعض الأمثلة على الخصائص تشمل:
بينما تركز التقنيات التقليدية على تقسيم الأحرف الفردية من أجل التعرف عليها، تركز التقنيات الحديثة على التعرف على جميع الأحرف في سطر نص مجزأ. وتركز بشكل خاص على تقنيات التعلم الآلي القادرة على تعلم الميزات المرئية، وتجنب هندسة المقاييس المحددة المستخدمة سابقًا. تستخدم الأساليب الحديثة شبكات عصبية لاستخراج ميزات مرئية عبر عدة إطارات متداخلة لصورة خطية تستخدمها RNN لإنتاج احتمالات الأحرف..