If you do not find what you're looking for, you can use more accurate words.
أوراق الأصيلة التي وضعت الأسس للعديد من التقنيات المستخدمة اليوم قد نشرت بواسطة إتش بي لوهان في عام 1958 وإتش بي ادموندسون في عام 1969.
اقترح لوهن ان يرجح الجمل في بداية الوثيقة أو القرة أكثر من غيرها.أما ادموندسون فقد شدد على أهمية الكلمات العنوانية للتلخيص وكان أول من استخدم قوائم كلمات التوقيف لتصفية الكلمات غير المفيدة ذات المحتوى الدلالي المنخفضة (على سبيل المثال أكثر الكلمات النحوية مثل "عن"، "من"، "في"). كذلك ميز أيضا بين الكلمات الزائدة والكلمات الاصلية للجملة، أي الكلمات التي تحدث على الأرجح مع المعلومات المهمة (مثال على ذلك كلمة "جسيم") أو المعلومات غير المهمة. ان فكرتة في استخدام الكلمات المفتاحية -الكلمات التي تحدث بشكل ملحوظ في كثير من الأحيان في الوثيقة- لا تزال واحدة من من القواعد التجريبية الجوهرية للأنظمة التي تستخدم في التلخيص هذه الأيام. مع توافر الذخائر اللغوية الكبيرة هذه الأيام، فأن القيمة (تي اف-اي دي دف) الذي نشأ من علم استرجاع المعلومات، يمكن تطبيقها واستخدامها بنجاح لتحديد الكلمات المفتاحية التي في نص: إذا كان على سبيل المثال كلمة "القط" تحدث بشكل ملحوظ في كثير من الأحيان في النص الذي يتم تلخيصه (tf == تكرار النص) أكثر من سائر الذخيرة (IDF == "معكوس تردد الوثيقة"؛ هنا الوثيقة تعني الذخيرة)، فبالتالي تكون كلمة "القط" من المرجح أن تكون كلمة هامة في النص -النص قد يكون في الواقع نص عن القطط.