L

Lewis Birch

Исследователь ИИ-безопасности

Исследователь в Mindgard, занимается тестированием и защитой LLM от adversarial угроз.

КибербезопасностьНевидимые Unicode-символы: атаки на ИИ GPT и Claude (8000+ тестов)

Как невидимые символы Unicode используются для сокрытия инструкций и prompt injection атак на GPT, Claude. Результаты тестов на 8000+ случаев, влияние на code execution, способы защиты и удаления невидимых символов.

7 ответов 1 просмотр