If you do not find what you're looking for, you can use more accurate words.
يخصص الرمز العالمي الموحد يونيكود رقما فريدا لكل حرف أو رمز له دلالة معينة، بغض النظر عن منصة التشغيل أو البرنامج أو اللغة المستخدمة. ويقدّم يونيكود آلية لتوسيع قاعدة المعيار وإضافة الرموز القديمة أو المستجدة، قادرة على ترميز أكثر من مليون رمز إضافي، وهو عدد كاف لتلبية احتياجات تشفير جميع الأحرف ورموز أنظمة الكتابة لكل لغات العالم بما فيها رموز وحروف اللغات البائدة. تعرّف مواصفة يونيكود كل الرموز المستخدمة في اللغات الرئيسية المكتوبة في العالم. وتتضمّن رموز اللغات الأوربية، والآسيوية، واللغات التي تتم كتابتها من اليمين إلى اليسار، كاللغة العربية والفارسية والأوردو والباشتو. وتشمل مواصفة يونيكود أيضاً علامات النقط، وعلامات الشكل أو الأحرف المميزة، والرموز الرياضياتية، والرموز التقنية، إلى غير ذلك. لا تكتفي مواصفات الترميز بتعريف هوية كل رمز، وقيمته الرقمية أو موقع شيفرته، بل إنها تحدد أيضاً كيفية تمثيل هذه القيمة بـالبتات. إن الفارق بين تحديد نقطة الترميز وإظهارها على الشاشة أو الصفحة المطبوعة، بالغ الأهمية لفهم دور مواصفة يونيكود في معالجة النصوص. ويعتبر الرمز المعرّف عن طريق نقطة ترميز يونيكود، مدخلاً مجرّداً. وهكذا يمثل الحرف العربي آ: (U+0622) ""ARABIC LETTER ALEF WITH MADDA ABOVE. أما العلامة المطبوعة على الصفحة أو المعروضة على الشاشة المحرف Glyph فهي تمثيل مرئي للرمز. ولا تعرّف مواصفة يونيكود هذه الصور المنقوشة ؛ بل تعرّف طريقة تأويل الرموز، وليس طريقة إظهار النقوش. وهكذا يعتبر محرك التصميم - عبر طاقم المحارف - هو المسؤول عن إظهار الرموز على الشاشة. كما لا تحدد مواصفة يونيكود حجم أو شكل أو اتجاه الرموز على الشاشة.
مبادئ في تشفير العربية بيونيكود عدد الحروف العربية الأساسية في يونيكود ثابت، وكل حرف منها له رمز وحيد وإن تعددت صوره وأشكاله السياقية. صورة الحرف التي تمثله على جداول الحروف بيونيكود تتعلق بصورة للحرف وهو منفصل.
خرائط تمثيل العربية في يونيكود يقصد بنظام الكتابة العربية Arabic script مجموعة المحارف والرموز الممثلة في خرائط Charts يونيكود - من U+0600 إلى U+06FF - والمستخدمة في كتابة اللغات العربية واللغات التي تستعمل هذه المحارف. يخصص يونيكود 942 شفرة لتمثيل الحروف والرموز المستعملة في اللغة العربية وكذا اللغات المكتوبة بواسطة الحروف العربية. وتجتمع المحارف في عدة خرائط هي
اتصال الكتابة العربية في يونيكود
الواصل والفاصل بعرض منعدم Zero Width: هما محرفان غير مطبوعين منعدما العرض يحملان في يونيكود، على التوالي، الرمزين U+200D وU+200C . عند وضع الواصل بين محرفين يفترض ألا يتصلا أو بعد محرف في صورته النهائية فإنه يجعله متصلا مع ما يليه من المحارف. وعند وضع الفاصل منعدم العرض - أو الفاصلة المجازية - بين محرفين قابلين للاتصال فإنها تمنع اتصالهما مع بعض. إن أي آلية للتصميم لا بد أن توفر على الأقل اختيار المحرف المناسب لكل حرف عربي حسب سياق اتصال الكتابة، وأن يعوض بعض المتتاليات من الحروف بمحارف تمثل أحرفا مركبة igatures.
أقسام الربط: يعطي يونيكود لكل حرف عربي الحق في أن يظهر وفق عدة صور - أو محارف - حسب ما يتطلبه السياق. عدد صور كل محرف محددة بقسم ارتباطه:
قواعد ربط المحارف العربية في يونيكود لتوضيح قواعد ربط حرف عربي X ، نستعمل الرموز التالية لتمثيل المحارف التي ستمثل X: Xn حالة الحرف وهو منفرد - كما يظهر على جدول الحروف الأساسية في يونيكود- ؛ Xr حالة الحرف الموصول من اليمين، يدخل في هذه الحالة الأحرف الموصولة من الجهتين في حال مجيئها منتهية؛ Xl حالة الحرف الموصول من اليسار، يدخل في هذه الحالة الأحرف الموصولة من الجهتين في حال مجيئها ابتدائية؛ Xm حالة الحرف الموصول من الجهتين، يدخل في هذه الحالة وحدها الأحرف الموصولة من الجهتين.
القواعد السبعة لربط المحارف العربية في يونيكود هي:
الحروف المركبة: الحروف المركبة، أو المتشابكة أو المندمجة Ligatures، هي محارف يندمج فيها أكثر من حرف ليكون مجموعها محرفا واحدا. تنقسم المحارف المركبة إلى قسمين: المحارف المركبة التجميلية، والمحارف المركبة اللغوية.
تكوين المحارف المركبة وفق يونيكود: يضع يونيكود ثلاث قواعد لتكوين الأحرف المركبة هي: