Сегодня индустрия преодолела новый порог: сразу две компании представили модели с более чем триллионом параметров. Пока гиганты наращивают мощности, ученые используют глубокое обучение для исследования дальнего космоса и медицины.
Приветствуем! Это ежедневный выпуск TokenBurn. Сегодня, 3 июня 2026 года, мы наблюдаем исторический момент в гонке параметров: на рынок вышли сразу два «триллионника» от Cursor и Xiaomi. Параллельно с этим исследовательское сообщество продолжает интегрировать нейросети в критически важные сферы — от сегментации опухолей до поиска внеземной жизни.
Новые модели
- Composer 2.5 (Cursor): Настоящий монстр производительности с 1,04 триллиона параметров. Модель ориентирована на сверхсложные задачи программирования и архитектурного проектирования, устанавливая новый стандарт для инструментов разработки.
- MiMo-V2.5-Pro (Xiaomi Corp): Ответ Пекина — модель на 1,02 триллиона параметров. Xiaomi делает ставку на глубокую интеграцию в экосистему умных устройств и беспрецедентные возможности локальной обработки данных.
- Qwen 3.7 Max (Alibaba): Новейшая итерация флагманской языковой модели. Хотя точное число параметров не раскрывается, тесты показывают значительный рывок в логическом мышлении и понимании контекста.
- TML-Interaction-Small (Thinking Machines): Мультимодальная модель на 276 млрд параметров, работающая с аудио, видео и текстом. Несмотря на приставку "Small", она демонстрирует выдающиеся результаты в анализе взаимодействий в реальном времени.
- Mistral Medium 3.5 (Mistral AI): Европейский ответ на глобальную экспансию. Мультимодальная модель (128 млрд параметров), оптимизированная для высокой эффективности при сохранении точности, характерной для семейства Mistral.
Исследования дня
- ИИ в глубоком космосе: Группа исследователей (James Bird и др.) представила метод оптимизации моделей для поиска признаков жизни в будущих космических миссиях. Используя симуляторы и глубокое обучение, авторы автоматизировали обнаружение астрономических объектов, которые могут быть обитаемы.
- Сегментация опухолей: Работа Jun Ma и Xiaoping Yang объединяет сверточные нейросети с гибридными активными контурами. Этот метод значительно повышает точность автоматической сегментации опухолей головы и шеи на комбинированных КТ- и ПЭТ-снимках.
- Концепция Панархии в CS: Исследование социально-экологических систем через призму «панархии» адаптирует теорию взаимно вложенных циклов адаптации для компьютерных наук. Это позволяет лучше понять, как сложные системы меняются и сохраняют устойчивость с течением времени.
- Ультразвук высокого разрешения: Ученые разработали самообучающуюся сеть CycleGAN для повышения качества ультразвуковых изображений. Метод сохраняет перцептивную согласованность, решая проблему низкого разрешения, вызванную ограничениями медицинских датчиков.
- Графовые сети для распознавания действий: Hichem Sahbi предложил новый подход к распознаванию действий с использованием графовых сверточных сетей (GCN) на основе ядер. Это позволяет эффективнее работать с нерегулярными структурами данных и обобщать глубокое обучение для сложных видеопоследовательностей.
Сегодняшний день подтверждает: ИИ перестал быть просто «умным чат-ботом». Мы видим, как технологии масштабируются до триллионов параметров и одновременно с этим проникают в самые тонкие материи — от спасения человеческих жизней в госпиталях до поиска новых миров за пределами нашей планеты. Оставайтесь с TokenBurn, чтобы быть в курсе будущего.