LLM Arena
Открытый бенчмарк бесплатных LLM — швейцарский турнир, мультикритериальное судейство, эволюция промптов
Общий лидерборд
| # | Модель | Турниры | Ср. ранг | Винрейт | Engag. | Inform. | Accur. | Orig. |
|---|---|---|---|---|---|---|---|---|
| 1 | qwen3-coder-next | 6 | 1.5 | 94% (48W/3L/0D) | 4.8 | 4.7 | 4.7 | 5.0 |
| 2 | gemma4:31b | 5 | 3.2 | 82% (37W/7L/1D) | — | — | — | — |
| 3 | ministral-3:14b | 6 | 3.8 | 75% (38W/13L/0D) | 5.0 | 5.0 | 4.7 | 4.2 |
| 4 | qwen3-vl:235b-instruct | 5 | 5.6 | 67% (30W/15L/0D) | — | — | — | — |
| 5 | devstral-small-2:24b | 6 | 6.7 | 65% (33W/16L/2D) | 4.2 | 4.3 | 4.2 | 3.5 |
| 6 | devstral-2:123b | 5 | 7.2 | 77% (36W/11L/0D) | 4.7 | 4.5 | 4.5 | 3.5 |
| 7 | minimax-m2.1 | 5 | 7.8 | 68% (32W/14L/1D) | 4.7 | 4.3 | 4.3 | 3.5 |
| 8 | gpt-oss:120b | 5 | 8.0 | 70% (33W/13L/1D) | 4.3 | 4.8 | 4.5 | 4.0 |
| 9 | qwen3-vl:235b | 5 | 9.0 | 62% (29W/17L/1D) | 4.7 | 4.3 | 4.2 | 3.7 |
| 10 | minimax-m2.5 | 4 | 9.0 | 59% (24W/14L/3D) | — | — | — | — |
| 11 | nemotron-3-super | 5 | 9.8 | 45% (21W/26L/0D) | 4.5 | 5.0 | 5.0 | 4.3 |
| 12 | cogito-2.1:671b | 5 | 10.6 | 51% (24W/21L/2D) | 4.3 | 4.3 | 4.3 | 3.8 |
| 13 | glm-4.6 | 1 | 11.0 | 52% (12W/11L/0D) | — | — | — | — |
| 14 | ministral-3:8b | 5 | 13.2 | 49% (23W/23L/1D) | 4.7 | 4.5 | 4.5 | 4.0 |
| 15 | minimax-m2 | 5 | 14.0 | 49% (23W/24L/0D) | 4.8 | 4.3 | 4.2 | 3.7 |
| 16 | qwen3-next:80b | 5 | 14.6 | 32% (15W/29L/3D) | 3.8 | 3.5 | 3.8 | 3.3 |
| 17 | ministral-3:3b | 5 | 15.6 | 26% (12W/35L/0D) | 5.0 | 4.7 | 3.5 | 3.7 |
| 18 | gemma3:27b | 5 | 16.6 | 32% (15W/32L/0D) | 4.3 | 4.3 | 4.8 | 3.7 |
| 19 | nemotron-3-nano:30b | 5 | 16.8 | 36% (17W/30L/0D) | 4.3 | 4.5 | 3.7 | 4.3 |
| 20 | qwen3-coder:480b | 5 | 17.0 | 32% (15W/32L/0D) | 4.0 | 4.2 | 4.3 | 3.2 |
| 21 | gpt-oss:20b | 5 | 17.4 | 23% (11W/35L/1D) | 4.2 | 4.5 | 3.7 | 3.5 |
| 22 | gemma3:4b | 5 | 19.2 | 17% (8W/36L/3D) | 5.0 | 3.7 | 3.5 | 3.3 |
| 23 | gemma3:12b | 5 | 19.6 | 23% (11W/33L/3D) | 4.0 | 4.2 | 4.2 | 3.2 |
| 24 | rnj-1:8b | 5 | 21.6 | 11% (5W/40L/2D) | 3.7 | 4.5 | 5.0 | 3.3 |
Последние турниры
Напиши **экспертный сторителлинг-пост** (до 300 слов) для канала по анализу данных о применении LLM, следуя структуре:
"Напиши живой, сторителлинговый пост для канала по анализу данных о применении LLM — с тремя конкретными кейсами (напр
Напиши пост для канала по анализу данных на тему: применение LLM в аналитике данных. Пост должен быть живым, с конкретны
Напиши пост для канала по анализу данных на тему: применение LLM в аналитике данных. Пост должен быть живым, с конкретны
Напиши пост для канала по анализу данных на тему: применение LLM в аналитике данных. Пост должен быть живым, с конкретны
Напиши пост для Telegram-канала по анализу данных на тему: применение LLM в аналитике данных. Пост должен быть живым, с