اذا لم تجد ما تبحث عنه يمكنك استخدام كلمات أكثر دقة.
الباحثون ينشرون بيانات جمعوها من المشاركين. ولحفظ خصوصية المشاركين، يتم معالجة البيانات بطريقة يتم فيها إزالة التعرف عليهم (De-identification). القيام بتلك الطريقة يهدف إلى نزع المعلومات الصحية المحمية والتي يمكن من خلالها ربط المشترك بمساهمته في بحث شارك فيه.
الهجمة أو الاعتداء على الخصوصية هو استغلال معين يؤدي إلى التعرف على الشخص المشارك بناء على بيانات البحث العامة . والطريقة التي قد تؤدي إلى هذا الإستغلال تكون وفق ما جمعه الباحثون من بيانات تحتوي على معلومات سرية تؤدي إلى التعرف على المشاركين. وهذا ينتج مجموعة بيانات (dataset). قبل أن يتم إرسال البيانات لمعالجة البحث، يتم إزالة التعرف على المشاركين، وبالتالي فإن البيانات الشخصية تزال من مجموعة البيانات. بشكل مثالي، هذا يعني أن مجموعة البيانات وحدها لا يمكن أن تستخدم للتعرف على المشاركين.
في بعض الحالات، الباحثون ببساطة يخطئون في تقدير المعلومات التي يجب إزالة التعرف عنها في مجموعة البيانات، أو ربما ورود التوكنولوجيا الجديدة تجعل من التعرف على البيانات بسيطة. وفي حالات اخرى، البيانات المنشورة والتي تم إزالة التعرف عليها يمكن أن تحال أو تشار إلى مجموعات بيانات أخرى، وبواسطة إيجاد أقران بين مجموعات البيانات الشخصية ومجموعات البيانات الغير شخصية، هنا يمكن الفصح والكشف عن المشاركين في مجموعات البيانات الغير شخصية .
الحالة المثالية من منظور البحث هي أن تتم مشاركة البيانات. بما أن الأولوية هي الحفاظ على خصوصية المشاركين، فقد تم فرض عدة أطروحات لحماية المشاركين لأهداف مختلفة. استبدال البيانات الحقيقية بأخرى مصطنعة تسمح للباحثين بعرض البيانات والتي تعطي نتيجة متكافئة ومشابهة للبيانات المأخوذة من قبل الباحثين، ولكن البيانات قد تكون غير صالحة لإعادة توظيفها في أبحاث أخرى. طرق أخرى تشمل "إضافة الضوضاء" وهذا المصطلح يعني إضافة تغييرات على القيمة العشوائية أو "مبادلة البيانات" بواسطة تبديل القيم عبر المدخلات . ويبقى هناك حل أو مدخل أخر وهو فصل المتغيرات الشخصية عن البقية في البيانات، ومن ثم تجميع المتغيرات الشخصية وإرفاقها ببقية البيانات. وقد استخدم هذا المبدأ بنجاح في إنشاء خرائط لمرضى السكري في أستراليا و المملكة المتحدة بواسطة استخدام بيانات سرية تابعة لعيادات الطب العام.