رونمایی از مدل متنباز LlamaFirewall برای ایمنسازی سیستمهای هوش مصنوعی
- دوشنبه, ۱۶ ارديبهشت ۱۴۰۴، ۱۱:۰۵ ق.ظ
متا از LlamaFirewall، یک مدل متنباز که برای ایمنسازی سیستمهای هوش مصنوعی (AI) در برابر خطرات سایبری نوظهور مانند تزریق سریع، فرار از زندان و کد ناامن و موارد دیگر طراحی شده است، رونمایی کرد.
این شرکت اعلام کرد که این مدل شامل سه محافظ، از جمله PromptGuard 2، Agent Alignment Checks و CodeShield است. هدف از طراحی PromptGuard 2 شناسایی تلاشهای مستقیم فرار از زندان و تزریق سریع در زمان واقعی است، در حالی که Agent Alignment Checks قادر به بررسی استدلال عامل برای سناریوهای احتمالی ربودن هدف و تزریق غیرمستقیم سریع است.
متا در توضیح GitHub این پروژه گفت: «LlamaFirewall به گونهای ساخته شده است که به عنوان یک چارچوب محافظ انعطافپذیر و در زمان واقعی برای ایمنسازی برنامههای مبتنی بر LLM عمل کند.»