تقييم سياسة دفاعية قائمة على التعلم المعزز مع مراعاة التوافر ضد الهجمات الإلكترونية

نوع المستند : Original Article

المؤلف

الجامعة التقنية الشمالية

10.69513/jncs.v3.i1.a6
المستخلص
تُنفذ الهجمات الإلكترونية المدعومة من دول لتحقيق أهداف مُخطط لها مسبقًا، لذا فإن تأثيرها كبير. يجب على المدافعين الاستجابة، لكن نطاق الهجوم واسع، وهناك احتمال لاستغلال ثغرات أمنية غير معروفة، مما يُصعّب الاستجابة. علاوة على ذلك، قد تؤدي الاستجابة المفرطة إلى تقليل توافر المستخدمين وتعطيل العمل. لذلك، من الضروري وجود سياسة استجابة فعّالة للدفاع ضد الهجمات مع ضمان توافر المستخدمين. تقترح هذه الورقة البحثية طريقة لمعالجة هذه المشكلة من خلال جمع عدد جلسات إعادة ترطيب العمليات لأصول بوب في الوقت الفعلي واستخدامها للتعلم. باستخدام هذه الطريقة، قمنا بتدريب سياسة قائمة على التعلم المعزز على مُحاكي هجوم إلكتروني. ونتيجة لذلك، انخفضت مدة الهجوم لنموذجين من المهاجمين بمقدار 279 و31 خطوة زمنية على التوالي، بناءً على 100 خطوة زمنية. علاوة على ذلك، انخفض أيضًا عدد "إجراءات الموارد" التي تُعيق توافر المستخدمين أثناء عملية الدفاع، مما أدى إلى سياسة ذات أداء عام أفضل.

الكلمات الرئيسية