L
Lewis Birch
Исследователь ИИ-безопасности
Исследователь в Mindgard, занимается тестированием и защитой LLM от adversarial угроз.
КибербезопасностьНевидимые Unicode-символы: атаки на ИИ GPT и Claude (8000+ тестов)
Как невидимые символы Unicode используются для сокрытия инструкций и prompt injection атак на GPT, Claude. Результаты тестов на 8000+ случаев, влияние на code execution, способы защиты и удаления невидимых символов.
7 ответов• 1 просмотр