
AI-Stat
Рейтинговая платформа нейросетей
Русскоязычный ресурс с рейтингами 200+ языковых моделей и нейросетей: бенчмарки (MMLU, HumanEval, GPQA, ARC и 300+ тестов), цены API, характеристики, сравнения GPT, Claude, Gemini, DeepSeek. Новости, обзоры и демонстрации ИИ.
ИИ-инструментыОткрытые LLM vs проприетарные: бенчмарки 2026
Насколько близки открытые большие языковые модели вроде DeepSeek V3.2, GLM-5 и Kimi K2.5 к проприетарным по llm leaderboard и llm arena февраля 2026? Разрыв 5-10%, достижения в скорости, MMLU-Pro и Elo. Обзор и рекомендации по llm моделям.
6 ответов• 3 просмотра