مؤشر التطابق
مؤشر التطابق (بالإنجليزية: Index of coincidence)، يعرف أيضا بمؤشر المصادفة أو مؤشر الصدفة. وهو مؤشر حسابي تم اختراعه من طرف ويليام فريدمان سنة 1922م بغرض المساعدة في تحليل وكسر بعض الشفرات خصوصا تلك التي تعتمد على مبدأ المقابلة أو التبادل (بالإنجليزية: substitution ciphers).[1]
يقوم مبدأ الحساب على عد عدد مرات تطابق حروف نفس الموضع بين نصين مختلفين وبالتالي فهو يمكن من إعطاء فكرة حول نوعية التشفير المستخدم اذا ماكان تشفير مبادلة أحادية (بالإنجليزية: monoalphabetic substitution) أو تشفير مبادلة متعددة (Polyalphabetic substitution). كما أنه يستخدم لاستنباط جنس لغة النص وكذلك حجم المفتاح المستخدم في بعض الشفرات المتقدمة كشفرة فيجينير.
ينبني مؤشر التطابق بشكل مباشر على تحليل التكرار، إذأن توزيع حروف اللغة لا يتبع قانون التوزيع المنتظم (بالإنجليزية: uniform distribution)وبالتالي فإن أي لغة تتميز بمؤشر تطابق مختلف عن بقية اللغات الأخرى.
مبدأ حساب مؤشر التطابق
[عدل]يعكس مؤشر التطابق مدى احتمالية سحب حرفين متطابقين بشكل عشوائي من نفس النص. لذلك فهو يرتبط بشكل وطيد بحساب تواتر حروف هذه اللغة. فيم يلي الصيغة الرياضية العامة لحساب مؤشر التطابق باعتبار أبجدية مكونة من حرف وباعتبار نص مكون من حرف:
بحيث تمثل عدد مرات ظهور الحرف الأبجدي ذي الترتيب في النص المراد تحليله. مثلا باعتبار حروف الأبجدية العربية، نرمز ب لعدد ظهور حرف الألف في النص، و ب لعدد مرات ظهور حرف الباء في النص، وهكذا.
يمكن ملاحظة أن القيمة تمثل احتمالية سحب نفس الحرف الأبجدي مرتين: إذ أن القيمة تمثل عدد إمكانيات سحب نفس الحرف مرتين، وتمثل القيمة عدد إمكانيات سحب حرفين (مهما كانا) بشكل عام من النص.
يمكن استنباط مؤشر التطابق من التوزيع الإحصائي لحروف اللغة (وذلك باعتبار أن هذا التوزيع الإحصائي تم الحصول عليه باستخدام نص كبير جدا) باستخدام العلاقة الرياضية التالية:
بحيث تكون احتمالية ظهور الحرف الأبجدي ذي الموضع ضمن حروف الأبجدية. بالرجوع مثلا إلى توزيع حروف اللغة العربية، نجد مثلا أن نسبة ظهور الحرف الجيم «ج» الذي هو الحرف الخامس في الترتيب الأبجدي العربي، هو .
تطبيع مؤشر التطابق
[عدل]يمكن تطبيع (normalize) قيمة مؤشر التطابق وذلك بالضرب في عدد حروف الأبجدية كما يلي:
بحيث تمثل عدد حروف أبجدية النص. تمكن هذه العلاقة من تطبيع قيمة مؤشر التطابق بحيث نحصل في حالة توزيع منتظم لحروف النص على القيمة 1.00
.
المراجع
[عدل]- ^ [Department of Ciphers. Publ 22 "The index of coincidence and its applications in cryptography"]. Riverbank Laboratories. 1922.
{{استشهاد بدورية محكمة}}
: الاستشهاد بدورية محكمة يطلب|دورية محكمة=
(مساعدة)، الوسيط|الأول=
يفتقد|الأخير=
(مساعدة)، وتحقق من قيمة|مسار=
(مساعدة)