Марат Баширов: Российская команда, в которую вошли представители научного партнера Сбера — Институт AIRI, In2AI выиграла престижное соревнование по стратегическому мышлению для ИИ-агентов MindGames Arena, проходившее в...

Марат Баширов: Российская команда, в которую вошли представители научного партнера Сбера — Институт AIRI, In2AI выиграла престижное соревнование по стратегическому мышлению для ИИ-агентов MindGames Arena, проходившее в...

Российская команда, в которую вошли представители научного партнера Сбера — Институт AIRI, In2AI выиграла престижное соревнование по стратегическому мышлению для ИИ-агентов MindGames Arena, проходившее в рамках NeurIPS. Исследователи использовали одну модель на 8B параметров. Агент успешно противостоял решениям на базе GPT-5, Gemini 2.5 Pro, Grok 4 и других крупных LLM. Всего участвовали 76 команд и 944 модели со всего мира.

Второй российский коллектив — команда VIM из AIRI и iMak AI Lab — вошел в топ-8 челленджа CURE-Bench от MIT и Гарварда и получил Excellence Award за согласованность прогнозов. Участникам предлагались клинические сценарии: от оценки безопасности терапии до планов лечения.

Кроме того, это еще раз подчеркивает силу российских ИИ-технологий, ярким примером которых является нейросеть ГигаЧат. На днях Сбер выложил в открытый доступ линейку передовых российских нейросетевых моделей, включая GigaChat — Ultra-Preview и Lightning, которые опережают многие зарубежные решения на задачах на русском языке.

Автор: Марат Баширов

Топ

Лента новостей