If you do not find what you're looking for, you can use more accurate words.
تدرس المناهج اللغوية والحاسوبية عادة 9 أقسام من الكلام باللغة الإنجليزية (العدد مقارب باللغة العربية): الاسم ، الفعل ، المادة ، الصفة ، حرف الجر ، الضمير ، الظرف ، الاقتران ، والتداخل. ومع ذلك، فهناك العديد من الفئات والفئات الفرعية. بالنسبة للأسماء، يمكن تمييز الجمع والمفرد، التملك، وأسماء الأعلام. وفي العديد من اللغات ومنها العربية، يتم تمييز الكلمات أيضًا وفق حالاتها " مثل الجنس، أو الأزمنة للأفعال وما إلى ذلك. في بعض أنظمة العلامات، قد يعطى للتصاريف المختلفة لجذر معين، علامات لأقسام كلام مختلفة، مما ينتج عدداً كبيراً من العلامات. على سبيل المثال، الرمز الشائع للأسماء المفردة (NN)، أو الرمز (NNS) للأسماء بصيغة الجمع، أو الرمز (NP) لأسماء العلم. غير أن كثيراً من أنظمة العلامات تستخدم عدداً أقل من العلامات وتتجاهل الفروق الدقيقة أو تقوم بنمذجتهم بشكل مستقل عن أقسام الكلام.
قد تكون مجموعة العلامات الأكثر شيوعًا للغة الإنجليزية الأمريكية هي مجموعة علامات بين (Penn)، التي تم تطويرها في مشروع (Penn Treebank). وهي تشبه إلى حد كبير مجموعات علامات ما يُعرف بمتن براون (Brown Corpus) و متن لوب (LOB Corpus) السابقين، على الرغم من أنها أصغر بكثير منهما. أما في أوروبا، فإن مجموعات العلامات الاوسع استخداماً هي المقدمة من ارشادات ايغلز (Eagles Guidelines) وتتضمن إصدارات بلغات متعددة. أما للغة العربية فإن أشهر مجموعة علامات هي ستانفورد، كما أن هناك مجاميع أخرى أيضاً.
اقترح بيتروف وزملاءه مجموعة علامات "شاملة" للعمل مع اللغات المختلفة بشكل موحد، والمجموعة تحتوي على 12 فئة وهي تفتقر للكثير من التحديدات بين الأحرف أو الأسماء أو الأفعال. قد يبدو ذلك غير مفيداً لكن ولبعض الأغراض، قد يبدو ضرورياً وجود مجموعة علامات أصغر وأشمل.