Российская команда, в которую вошли представители научного партнера Сбера — Институт AIRI, In2AI выиграла престижное соревнование по стратегическому мышлению для ИИ-агентов MindGames Arena, проходившее в рамках NeurIPS. Исследователи использовали одну модель на 8B параметров. Агент успешно противостоял решениям на базе GPT-5, Gemini 2.5 Pro, Grok 4 и других крупных LLM. Всего участвовали 76 команд и 944 модели со всего мира.
…
Второй российский коллектив — команда VIM из AIRI и iMak AI Lab — вошел в топ-8 челленджа CURE-Bench от MIT и Гарварда и получил Excellence Award за согласованность прогнозов. Участникам предлагались клинические сценарии: от оценки безопасности терапии до планов лечения.
…
Кроме того, это еще раз подчеркивает силу российских ИИ-технологий, ярким примером которых является нейросеть ГигаЧат. На днях Сбер выложил в открытый доступ линейку передовых российских нейросетевых моделей, включая GigaChat — Ultra-Preview и Lightning, которые опережают многие зарубежные решения на задачах на русском языке.


























