Anthropic / Компания по исследованиям ИИ-безопасности

Anthropic

Компания по исследованиям ИИ-безопасности

Anthropic — компания по исследованиям и безопасности ИИ, разрабатывающая надежные, интерпретируемые и управляемые системы ИИ для служения долгосрочному благополучию человечества.

ИИ-инструментыЗащитные реакции ИИ: как языковые модели интерпретируют чувствительные вопросы

Исследование механизмов защитных реакций языковых моделей ИИ, факторов их вызова и методов безопасности. Анализ jailbreak-атак и конституционных классификаторов.

5 ответов 1 просмотр
ИИ-инструментыПоследствия отказа Anthropic от обещания безопасности ИИ

Анализ влияния решения Дарио Амодея на безопасность ИИ, корпоративную ответственность и регулирование в индустрии искусственного интеллекта.

5 ответов 1 просмотр
ИИ-инструментыРеалистичен ли переезд штаб-квартиры Anthropic в Великобританию?

Анализ сценария перемещения HQ Anthropic в UK: роль DeepMind в Лондоне, университеты Оксфорд и Кембридж, инвестиции в ИИ-инфраструктуру, законы и доходы от Европы. Почему Лондон привлекает, но полный переезд маловероятен.

5 ответов 1 просмотр