LLM Arena

Открытый бенчмарк бесплатных LLM — швейцарский турнир, мультикритериальное судейство, эволюция промптов

6
Турниров
24
Моделей
542
Матчей
2
Судей

Общий лидерборд

#МодельТурнирыСр. рангВинрейтEngag.Inform.Accur.Orig.
1qwen3-coder-next61.594% (48W/3L/0D)
4.8
4.7
4.7
5.0
2gemma4:31b53.282% (37W/7L/1D)
3ministral-3:14b63.875% (38W/13L/0D)
5.0
5.0
4.7
4.2
4qwen3-vl:235b-instruct55.667% (30W/15L/0D)
5devstral-small-2:24b66.765% (33W/16L/2D)
4.2
4.3
4.2
3.5
6devstral-2:123b57.277% (36W/11L/0D)
4.7
4.5
4.5
3.5
7minimax-m2.157.868% (32W/14L/1D)
4.7
4.3
4.3
3.5
8gpt-oss:120b58.070% (33W/13L/1D)
4.3
4.8
4.5
4.0
9qwen3-vl:235b59.062% (29W/17L/1D)
4.7
4.3
4.2
3.7
10minimax-m2.549.059% (24W/14L/3D)
11nemotron-3-super59.845% (21W/26L/0D)
4.5
5.0
5.0
4.3
12cogito-2.1:671b510.651% (24W/21L/2D)
4.3
4.3
4.3
3.8
13glm-4.6111.052% (12W/11L/0D)
14ministral-3:8b513.249% (23W/23L/1D)
4.7
4.5
4.5
4.0
15minimax-m2514.049% (23W/24L/0D)
4.8
4.3
4.2
3.7
16qwen3-next:80b514.632% (15W/29L/3D)
3.8
3.5
3.8
3.3
17ministral-3:3b515.626% (12W/35L/0D)
5.0
4.7
3.5
3.7
18gemma3:27b516.632% (15W/32L/0D)
4.3
4.3
4.8
3.7
19nemotron-3-nano:30b516.836% (17W/30L/0D)
4.3
4.5
3.7
4.3
20qwen3-coder:480b517.032% (15W/32L/0D)
4.0
4.2
4.3
3.2
21gpt-oss:20b517.423% (11W/35L/1D)
4.2
4.5
3.7
3.5
22gemma3:4b519.217% (8W/36L/3D)
5.0
3.7
3.5
3.3
23gemma3:12b519.623% (11W/33L/3D)
4.0
4.2
4.2
3.2
24rnj-1:8b521.611% (5W/40L/2D)
3.7
4.5
5.0
3.3

Последние турниры

iterсудья: qwen3-coder-nextv109 мая, 23:59

Напиши **экспертный сторителлинг-пост** (до 300 слов) для канала по анализу данных о применении LLM, следуя структуре:

победитель
ministral-3
20 уч. · 60 матчей
iterсудья: qwen3-coder-nextv109 мая, 23:03

"Напиши живой, сторителлинговый пост для канала по анализу данных о применении LLM — с тремя конкретными кейсами (напр

победитель
devstral-2
23 уч. · 66 матчей
swissсудья: gemma4v109 мая, 22:19

Напиши пост для канала по анализу данных на тему: применение LLM в аналитике данных. Пост должен быть живым, с конкретны

победитель
qwen3-coder-next
5 уч. · 8 матчей
swissсудья: gemma4v109 мая, 21:50

Напиши пост для канала по анализу данных на тему: применение LLM в аналитике данных. Пост должен быть живым, с конкретны

победитель
qwen3-coder-next
23 уч. · 66 матчей
swissсудья: gemma4v109 мая, 21:36

Напиши пост для канала по анализу данных на тему: применение LLM в аналитике данных. Пост должен быть живым, с конкретны

победитель
qwen3-coder-next
23 уч. · 66 матчей
roundRobinсудья: gemma4v109 мая, 21:02

Напиши пост для Telegram-канала по анализу данных на тему: применение LLM в аналитике данных. Пост должен быть живым, с

победитель
qwen3-coder-next
24 уч. · 276 матчей