English  

كتب clustering algorithms

اذا لم تجد ما تبحث عنه يمكنك استخدام كلمات أكثر دقة.

عرض المزيد

خوارزميات التجميع (معلومة)


يؤدي استخدام خوارزميات مختلفة إلى نتائج مختلفة، لكن لا يوجد منهج واحد لاختيار الخوارزمية الأمثل، إذ لا تقدم أي منهن إثباتًا نظريًا على صحتها. تُعتبر الخوارزمية التصنيفية المعروفة على نطاق واسع أكثر التقنيات استخدامًا في التجزئة الجيو ديموغرافية. لكن ما تزال الخوارزميات الناتجة عن الشبكات العصبية الصناعية، أو الخوارزميات الجينية، أو المنطق الترجيحي أكثر الخوارزميات فعالية في قواعد البيانات الكبيرة ومتعددة الأبعاد (بريميكوم، 2007).

يمكن للشبكات العصبية تولي أمر العلاقات غير الخطية، وهي منيعة على الضوضاء وتقدم درجة كبيرة من الأتمتة. لا تفترض أي فرضيات حول طبيعة البيانات أو توزعها، كما تقدم مساعدة قيمة عند التعامل مع المشكلات ذات الطبيعة الجغرافية التي استعصى حلها حتى يومنا هذا. تُعتبر الخريطة ذاتية التنظيم إحدى أشهر نظريات الشبكة العصبية وأكثرها فعالية في تشكيل مجموعات غير خاضعة للرقابة. اقتُرحت الخريطة ذاتية التنظيم لتكون شكلًا محسنًا من الخوارزميات التصنيفية، إذ توفر منهجًا أكثر مرونة لإحصاء تجميع البيانات. استخدم سبيلمان وثريل (2008) الخريطة ذاتية التنظيم مؤخرًا لتطوير تجميع جيو ديموغرافي لقاعدة بيانات إحصائية تتعلق بمدينة نيويورك.

تعتمد إحدى الطرق الأخرى لتوصيف تشابه الفرد مع المنطقة ككل على المنطق الترجيحي. ينطوي مبدأ المنطق الترجيحي على فكرة مفادها أنه من الممكن أن ينتمي شيء ما إلى أكثر من تجمع. في المنطق الثنائي، تكون المجموعة محدودة ضمن التعريف الثنائي للإثبات أو النفي، ما يعني أن غرضًا ما ينتمي إلى المجموعة أو لا ينتمي إليها. يتيح التجميع الترجيحي إمكانية انتماء الوحدة المكانية إلى أكثر من تجمع ذي قيم عضوية مختلفة.

المصدر: wikipedia.org