Главные ИИ-новости недели: TIME100, Claude, Qwen, Apple, Mistral и Granite

Главные ИИ-апдейты недели: TIME100, Claude, Qwen, Apple, Mistral и локальные LLM

В новом выпуске #AINews собрали ключевые новости недели из мира искусственного интеллекта: TIME назвал самых влиятельных игроков ИИ-рынка 2026 года, GitHub меняет модель оплаты Copilot, Claude получил новые инструменты для креативной работы и кибербезопасности, Alibaba ускорила длинный контекст в Qwen, Apple предложила новый подход к reasoning, а Mistral и IBM выпустили модели для локального и корпоративного запуска.

TIME назвал 10 самых влиятельных ИИ-компаний 2026 года

TIME представил список 10 самых влиятельных ИИ-игроков 2026 года. В рейтинг вошли ожидаемые лидеры рынка: OpenAI, Anthropic, Meta*, Alphabet с Gemini, Alibaba и ByteDance.

Кроме них, TIME отметил несколько компаний, которые особенно заметно влияют на развитие ИИ-инфраструктуры, открытых моделей и корпоративных сценариев.

Zhipu вошла в рейтинг как один из ключевых китайских LLM-игроков. Компания стала первым китайским разработчиком больших языковых моделей, вышедшим на биржу в Гонконге. Среди сильных показателей — модель GLM-5 на 744 млрд параметров и более 4 млн корпоративных клиентов и разработчиков.

Amazon отметили за развитие инфраструктуры для обучения больших моделей: чипы Trainium2 и Project Rainier, на которых обучаются модели Anthropic.

Mistral и Hugging Face попали в рейтинг за вклад в развитие открытых моделей и инфраструктуры для разработчиков.

Примечательно, что xAI и DeepSeek в список TIME не вошли.

*Meta признана экстремистской и запрещена в РФ.

GitHub Copilot переходит к оплате по использованию

GitHub меняет экономику Copilot. С 1 июня Copilot Code Review начнёт расходовать минуты GitHub Actions на вычислениях GitHub.

Это означает, что агентная проверка кода становится платной не только с точки зрения доступа к модели, но и с точки зрения инфраструктуры. Чем сложнее становится ИИ-инструмент, тем больше значение приобретает стоимость вычислений, latency и оптимизация рабочих процессов.

Этот шаг хорошо показывает общий тренд рынка: ИИ-инструменты для разработки переходят от «магического помощника по подписке» к более прозрачной модели, где пользователь платит за реальные вычислительные ресурсы.

Claude получил новые инструменты для креативной работы и безопасности

Anthropic продолжает развивать Claude как универсального ИИ-помощника для профессиональных задач. На этой неделе у Claude появилось сразу несколько заметных обновлений.

Во-первых, Anthropic добавила коннекторы к креативному стеку: Ableton, Adobe, Blender, Fusion, SketchUp и другим инструментам. Теперь Claude может помогать с документацией, сценами, объектами, настройками и рутинными задачами в креативном производстве.

Во-вторых, компания представила Claude Security. Это инструмент для поиска уязвимостей в коде и подготовки патчей для ревью. Пока решение доступно в бета-версии для пользователей Enterprise.

В-третьих, Anthropic провела эксперимент Project Deal, где агенты Claude совершали сделки во внутреннем маркетплейсе на базе Slack. Всего было проведено 186 сделок на сумму более $4000. Самый мемный эпизод — один из Claude купил 19 шариков для пинг-понга и назвал их «идеально круглыми шариками возможностей».

Alibaba ускорила длинный контекст в Qwen

Alibaba открыла FlashQLA — библиотеку для ускорения линейного внимания в Qwen3-Next при контексте 256K+ токенов.

Это важное обновление для задач, где длинный контекст становится критическим ограничением: агенты, RAG-системы, большие кодовые базы, аналитика документов и корпоративные ассистенты. Чем длиннее контекст, тем выше стоимость обработки и задержка ответа.

FlashQLA решает эту проблему на уровне производительности. На GPU Hopper прямой проход ускоряется в 2–3 раза, обратный — примерно в 2 раза. Для разработчиков агентных систем и LLM-продуктов это может означать более дешёвую и быструю работу с большими объёмами контекста.

Apple предложила новый подход к reasoning для LLM

Apple и UCSD представили LaDiR — подход к reasoning, при котором модель не строит одну линейную цепочку рассуждений, а уточняет несколько скрытых вариантов решения перед финальным ответом.

Это может повысить устойчивость моделей в задачах, где ошибка на одном шаге ломает весь результат: математике, программировании, планировании и многошаговом анализе.

LaDiR отражает общий тренд в развитии LLM: индустрия ищет способы сделать рассуждения моделей менее хрупкими и более проверяемыми. Вместо одной цепочки ответа модель получает возможность рассмотреть несколько внутренних вариантов и выбрать более устойчивый.

Mistral Medium 3.5: открытая dense-модель для локального запуска

Mistral выпустила Mistral Medium 3.5 — мультимодальную dense-модель на 128 млрд параметров с контекстом 256K.

На SWE-Bench Verified модель показывает 77.6%. Она не обгоняет всех лидеров рынка, но выглядит сильным вариантом для локального запуска и корпоративных сценариев, где важны контроль, приватность и независимость от закрытых API.

Стоимость API составляет $1.5 за миллион входных токенов и $7.5 за миллион выходных токенов.

Dense-модель — это архитектура, где на каждом шаге генерации работает вся сеть параметров. Противоположный подход — MoE, где активируется только часть экспертных блоков.

IBM Granite 4.1: ещё одна открытая модель для бизнеса

IBM открыла Granite 4.1 — семейство dense-моделей для бизнес-сценариев. Модели ориентированы на агентные задачи, RAG, автоматизацию и корпоративное использование.

Ключевые характеристики Granite 4.1:

— контекст 128K;

— поддержка 12 языков;

— фокус на agentic-сценариях и RAG;

— ориентация на бизнес-агентов и автоматизацию.

Оптимальный баланс показывает версия 8B. По заявленным метрикам она достигает 92.5% на GSM8K, 85.4% на HumanEval и 68.3% в Tool Calling.

Для компаний, которые ищут локальные или более контролируемые LLM-решения, Granite 4.1 может стать ещё одним кандидатом в стек.

Google показал ERA — ИИ-помощника для научных исследований

Google представил ERA — систему, которая помогает исследователям строить научный софт и модели для прикладных задач.

Среди примеров применения: прогноз госпитализаций, анализ CO₂ и поиск механизмов нейронных цепей. В блоге Google приведены четыре кейса использования ERA в реальной научной работе.

Это направление особенно интересно, потому что ИИ здесь используется не просто для генерации текста или кода, а как инструмент поддержки эмпирических исследований. Такие системы могут ускорять проверку гипотез, разработку моделей и анализ сложных данных.

Open Design: опенсорс-версия Claude Design

Open Design — опенсорс-инструмент, который превращает кодинг-агента в дизайнера по принципу Claude Design.

Система работает с десятками навыков и более чем 70 дизайн-системами. Агент уточняет бриф, удерживает визуальные ограничения и по шагам собирает интерфейс.

Главный плюс — возможность локального запуска. Это особенно важно для команд, которые хотят экспериментировать с ИИ-дизайном, но сохранять контроль над данными, инструментами и процессом разработки.

Talkie: LLM из 1930 года

В рубрике #ЧерноеЗеркало — Talkie, 13B-модель, обученная на 260 млрд токенов исторических данных до конца 1930 года.

Идея проекта — проверить, как модель «предсказывает будущее», если не знает современность. Такой подход позволяет исследовать не только генерацию текста, но и то, как языковая модель работает с историческим контекстом, причинностью и прогнозированием событий.

С Talkie уже можно поговорить как с ИИ из прошлого.

JMLC стартует через неделю

Junior ML Contest — это шанс поступить в AI Talent Hub на бюджет без экзаменов.

Приём заявок: 11 мая – 8 июня.

Конкурс подойдёт тем, кто уже сделал ML-проект и хочет поступить в магистратуру по искусственному интеллекту через защиту практического результата.