العربية  

books research method

If you do not find what you're looking for, you can use more accurate words.

View more

طريقة البحث (Info)


فاستا يأخذ سلسلة النكليوتيد أو الحمض الأميني المعينة ويبحث قاعدة بيانات السلسلة المقابلة باستخدام التراصف التسلسلي المحلي لإيجاد نظائر لسلاسل قاعدة بيانات مماثلة. برنامج فاستا يتبع طريقة إرشادية على نطاق واسع التّي يساهم في السّرعة العالية لتنفيذها. إنه يلاحظ أوليّاً نمط ضربات الكلمة, نظائر كلمة إلى كلمة بطول معيّن, وتعيين النظائر المحتملة قبل إنجاز البحث المحسّن الأكثر مضيعة للوقت باستخدام خوارزمية نمط سميث واترمان. الحجم المأخوذ بعين الاعتبار, معطى من قبل ktup البارامتر, يتحكّم بحساسية وسرعة البرنامج. زيادة قيمة ktup ينقص عدد الضربات الخلفية الّتي يتمّ العثور عليها. من ضربات الكلمة الّتي تُرجع البرنامج يبحث عن القطاعات الّتي تحتوي على مجموعة من الضربات القريبة. ثمّ يتحقّق من هذه القطاعات لنظير محتمل.

هناك بعض الاختلافات بين fastn و fastp وفقاً لنوع التسلسلات المستخدمة لكن كلاهما يستخدمان أربع خطوات ويحسبان ثلاث درجات لوصف وصياغة نتائج التشابه التسلسلي.وهذه هي:

  • تحديد المناطق ذات الكثافة الأعلى في كل مقارنة تسلسل. بأخذ ktup لمساواة 1 أو 2.
في هذه الخطوة جميع أو مجموعة من المطابقات بين تسلسلين توجد باستخدام جدول المقابلة. قيمة ktup تحدّد كم عدد المطابقات المتعاقبة المطلوبة لنظير ليتمّ إعلانه. وبالتالي أقلّ قيمة ktup: البحث الأكثر حساسية.

Ktup=2 يؤخذ كثيراً من قبل المستعملين لسلاسل البروتين و Ktup=4 أو 6 لسلاسل النكليوتيدات. الأليغو نكليوتيدات القصيرة غالباً يتمّ تشغيلها مع Ktup=1. ثمّ يجد البرنامج جميع المناطق المحلية المماثلة, ممثّلاً كأقطار بطول محدّد في الرسم البياني, بين التسلسلين الاثنين من خلال عدّ مطابقات Ktup وإعاقة عدم المطابقات المعترضة. بهذه الطريقة, المناطق المحلية ذات الكثافة الأعلى المكافئة بقطر معزولة عن الضربات الخلفية. لسلاسل البروتين قيم قوالب مصفوفة بدائل الحمض الأميني تستخدم لتسجيل نظائر ktup. هذا يضمن أنّ مجموعات من المتطابقات بأعداد عالية من التشابه تساهم أكثر للنتيجة القطرية المحلّية من المتطابقات بأعداد منخفضة من التشابه. سلاسل النكليوتيد تستخدم مصفوفة المتطابقة للغاية نفسها. أفضل 10 مناطق محليّة مختارة من جميع الأقطار مجتمعة يتمّ حفظها بعد ذلك.

  • إعادة تفحص المناطق المأخوذة باستخدام مصفوفات التسجيل. تشذيب نهايات المنطقة لتشمل فقط تلك التي تساهم بالنتيجة الأعلى.

إعادة تفحص المناطق العشرة المأخوذة. هذه المرة باستخدام مصفوفات التسجيل المرتبطة أثناء إعادة التسجيل للسماح بنقل متطابقات أقصر من قيمة ktup. أيضاً أثناء إعادة تسجيل الاستبدالات المقاومة التي تساهم في المحافظة على نقاط التشابه يتمّ اتخاذها. رغم أنّ سلاسل البروتين تستخدم مصفوفات قوالب مصفوفة بدائل الحمض الأميني، لتسجيل المصفوفات على أساس الحدّ الأدنى لعدد تغييرات القاعدة المطلوبة لاستبدال محدّد, على المتطابقات وحدها, أو على قياس بديل للتشابه مثل النقطة القابلة للتغير، يمكن استخدامها أيضاً مع البرنامج. لكل من هذه المناطق القطريّة المعاد تفحصها بهذه الطريقة, المنطقة الثانوية بالدرجة القصوى يتمّ تعيينها. المتطابقات الأوليّة التي وجدت في الخطوة الأولى يتمّ استخدامها لترتيب تسلسل المكتبة. الدرجة الأعلى يشار إليها بدرجة nit1.

  • في التراصف إذا تمّ العثور على عدة مناطق أولية بأعداد أكبر من قيمة القطع, التحقّق ما إذا كان يمكن ضمّ المناطق الأولية المشذّبة لتشكيل تراصف تقريبي مع فجوات. حساب درجة التشابه الّتي هي مجموع المناطق المنضمّة تعاقب 20 نقطة لكلّ فجوة. درجة التشابه الأولية هذه (initn) تستخدم لتصنيف السلاسل المكتبية. درجة المنطقة المفردة الأولية الأفضل وجدت في الخطوة 2تمّ ذكرها (init1).

هنا البرنامج يحسب التراصف المثالي للمناطق الأولية كمجموعة من المناطق المتوافقة بالدرجة القصوى. هذا التراصف المثالي للمناطق الأولية يمكن حسابه بسرعة باستخدام خوارزمية البرمجة الديناميكية. الدرجة الناتجة initn تستخدم لتصنيف السلاسل المكتبية. عملية الانضمام هذه تزيد الحساسيّة ولكن تنقص الانتقائيّة. قيمة الفرق المحسوبة بعناية هي بالتالي تستخدم للتحكم بمكان تنفيذ هذه الخطوة, القيمة الّتي تكون تقريباً ذات انحراف معياري واحد فوق معدّل الدرجة المتوقّع من سلاسل غير مرتبطة في المكتبة. تسلسل استفسار 200-بقايا مع ktup2 يستخدم قيمة 28.

  • استخدام خوارزمية سميث واترمان الموحّدة لحساب الدرجة المثالية للتراصف.

هذه الخطوة تستخدم خوارزمية سميث واترمان الموحّدة لإحداث الدرجة المحسّنة (opt) لكل تراصف من تسلسل الاستفسار إلى تسلسل قاعدة البيانات (المكتبي). إنّه يأخذ مجموعة من 32 بقايا تركّزت على منطقة init1 من الخطوة 2 لحساب التراصف المثالي. بعد أن يتمّ فحص جميع السلاسل يقوم البرنامج بتعيين موقع الدرجات الأوليّة لكل تسلسل قاعدة بيانات في الرسم البياني، ويحسب الأهمية الإحصائيّة لدرجة "opt". لسلاسل البروتين, التراصف النهائي ينتج باستخدام تراصف سميث واترمان كامل. لسلاسل الحمض النووي DNA، يتمّ تجهيز تراصف موحّد.

Source: wikipedia.org
 
(27)
Research Methods

Research Methods