R

Ravid Shwartz-Ziv

Исследователь в области ИИ

Соавтор статьи о LiveBench, представленной на ICLR 2025

ИИ-инструментыLiveBench с Codex 5.3: выводы о производительности и регрессии

Анализ последнего запуска LiveBench с Codex 5.3: производительность в агентном программировании, проблемы регрессии и ключевые выводы.

5 ответов 1 просмотр