English  

كتب a simple arithmetic model that shows the error limit

اذا لم تجد ما تبحث عنه يمكنك استخدام كلمات أكثر دقة.

عرض المزيد

نموذج حسابي بسيط يوضح حد الخطأ (معلومة)


لنفترض وجود جزيء مكون من 3 أرقام هي [A وB وC]، حيث يمكن أن تأخذ A وB وC القيم 0 و1. وهناك ثمانية تسلسلات من ذلك ([000] و[001] و[010] و[011] و[100] و[101] و[110] و[111]). ولنفترض أن الجزيء[000] هو الأكثر كفاءة، وفي كل عملية تناسخ، ينتج ما متوسطه نسخة، حيث . يطلق على هذا الجزيءاسم "التسلسل الرئيسي". ولنفترض أن التسلسلات الثمانية الأخرى أقل كفاءة، حيث ينتج كل منها نسخة واحدة فقط في كل عملية نسخ. ويتم استنساخ كل رقم من الأرقام الثلاثة من خلال معدل طفرات μ. وبمعنى آخر، عند كل استنساخ لرقم في تسلسل، تكون هناك احتمالية تعدد ويتم استبدال 0 ويحل محلها 1 أو العكس بالعكس. دعونا نتجاهل الطفرات المزدوجة، ثم نقسم الجزيئات الثمانية إلى ثلاث فئات اعتمادًا على مسافة هامينج من التسلسل الرئيسي:

لاحظ أن عدد التسلسلات في المسافة d ما هي إلا معامل ذو حدين إذا كانت L = 3، ويمكن النظر إلى كل تسلسل على أنه سمت مكعب الأبعاد لـ L=3، حيث تحدد كل حافة من حواف المكعب مسار طفرة تكون فيه مسافة هامينج للتغيير تساوي صفرًا أو ±1. ويمكننا أن نرى أن ثلث الطفرات، على سبيل المثال، لجزيئات [001]، سوف تنتج جزيئات [000]، في حين أن الثلثين الآخرين سينتجان الجزيئات من الفئة الثانية [011] و[101]. ويمكننا الآن كتابة التعبير للأطفال الناتجين من الفئة i فيما يتعلق بالآباء .

حيث يتم عرض مصفوفة الكفاءة w حسب:

حيث هي احتمالية أن الجزيء بالكامل سيتم نسخه بشكل ناجح. تنتج المتجهات الذاتية لمصفوفة w أعداد التوازن لكل فئة من الفئات. على سبيل المثال، إذا كان معدل الطفرات μ هو صفرًا، فسوف يكون لدينا Q = 1، وستكون تركيزات التوازن . ويصبح التسلسل الرئيسي، كونه الأكثر كفاءة، هو الوحيد الذي يبقى على قيد الحياة. إذا كان لدينا دقة نسخ Q=0.95، فإن تركيزات التوازن تكون تقريبًا . ويمكن أن نرى أن التسلسل الرئيسي ليس سائدًا. إذا كان لدينا دقة نسخ Q=0، فإن تركيزات التوازن تكون تقريبًا . وهذا يعني تساوي العدد في كل التسلسلات. (إذا كان لدينا عدد متساوٍ بدقة لكل التسلسلات، فيجب أن تكون الأعداد كما يلي [1,3,3,1]/8.)

إذا انتقلنا الآن إلى الحالة التي يكون فيها عدد الأزواج القاعدية كبيرًا، لنقل L=100، فإننا نحصل على سلوك يشبه انتقال المرحلة. يوضح المخطط الموجود أدناه على اليمين سلسلة من تركيزات التوازن المقسومة على المعامل ذي الحدين . (تعرض عملية الضرب هذه العدد للتسلسل المفرد في هذه المسافة، ويؤدي إلى الحصول على خط مستوٍ يشير إلى تساوي التوزيع. يتم ضبط الميزة الانتقائية للتسلسل القياسي على a=1.05. والمحور الأفقي هو مسافة هامينج d . أما المنحنيات المتعددة فهي تشير إلى معدلات الطفرات الإجمالية المتنوعة . ومن الواضح أنه بالنسبة للقيم المنخفضة لمعدل الطفرات الإجمالي، يتكون العدد من أشباه أنواع يتم تجميعها إلى جوار التسلسل الرئيسي. وعندما يكون معدل الطفرات الإجمالي أكبر من حوالي 1-Q=0.05، ينتشر التوزيع بسرعة ليشمل كل التسلسلات بشكل متساوٍ. ويوضح المخطط الموجود إلى اليسار أدناه العدد الكسري للتسلسل الرئيسي كدالة لمعدل الطفرات الإجمالي. ومرة أخرى، يتضح أنه في معدلات الطفرات الخطيرة الأقل من حوالي 1-Q=0.05، يحتوي التسلسل الرئيسي على أغلب العدد، في حين أنه في الحالات التي تتجاوز هذا المعدل، فإنه يحتوي فقط على حوالي من إجمالي العدد.

يمكن ملاحظة وجود انتقال حاد عند القيمة 1-Q  بشكل أكبر بقليل من 0.05. وبالنسبة لمعدلات الطفرات التي تتجاوز هذه القيمة، ينخفض العدد التابع للتسلسل الرئيسي إلى الصفر بشكل عملي. أما في الحالات التي تتجاوز هذه القيمة، فإنه يكون سائدًا.

عند توجه الحد L نحو اللانهاية، فإن النظام يكون في واقع الأمر في حالة انتقال مرحلة بالوصول إلى قيمة خطيرة لـ Q: . ويمكن أن ننظر إلى معدل الطفرات الإجمالي (1-Q) على أنه شكل من أشكال "درجة الحرارة"، التي "تذيب" دقة التسلسل الجزيئي عند تجاوز "درجة الحرارة" الخطيرة التي مقدارها . وللحصول على نسبة نسخ دقيقة، يجب أن يتم "تجميد" المعلومات في الجينوم.

المصدر: wikipedia.org