اذا لم تجد ما تبحث عنه يمكنك استخدام كلمات أكثر دقة.
في هذه المرحلة يتم قراءة الكود المصدري وتقسيمه إلى مجموعة من الرموز (Tokens)، كل رمز يمثل عنصر من عناصر لغة البرمجة على سبيل المثال، (كلمة محجوزة أو اسم متغير أو عدد أو رمز....الخ).
مثلا إذا كان الكود المصدري بهذا الشكل:
if (a == b) a++;
وبعد مروره بهذه المرحلة يتم تحويله إلى هذا الشكل:
if ------- كلمة مفتاحية ------- مسافة فارغة ( ------- رمز a ------- اسم متغير ------- مسافة فارغة == ------- رمز ------- مسافة فارغة b ------- اسم متغير ) ------- رمز ------- مسافة فارغة a ------- اسم متغير ++ ------- رمز ; ------- رمز