William Hackett
Инженер по машинному обучению, сооснователь
PhD-исследователь ИИ и безопасности из Lancaster University. Специалист по AI-атакам, guardrails и state-of-the-art решениям для защиты моделей.
КибербезопасностьНевидимые Unicode-символы: атаки на ИИ GPT и Claude (8000+ тестов)
Как невидимые символы Unicode используются для сокрытия инструкций и prompt injection атак на GPT, Claude. Результаты тестов на 8000+ случаев, влияние на code execution, способы защиты и удаления невидимых символов.
7 ответов• 1 просмотр