Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.
Неделя выдалась насыщенной: Mistral выкатили Devstral 2, Photoshop, Express и Acrobat встроили прямо в ChatGPT, а исследования показывают, что более 80% вайб-кода могут содержать уязвимости. Криштиану Роналду инвестирует в Perplexity, а Сэм Альтман считает, что сейчас невозможно воспитывать детей без ИИ.
Всё самое важное — в одном месте. Поехали!
? В этом выпуске:
? Модели и LLM
? Генеративные нейросети
? AI-инструменты и платформы
? AI в обществе и исследованиях
Mistral представила Devstral 2 — открытую модель для кодинга на 123B параметров, набравшую 72.2% на SWE-Bench Verified. Обгоняет почти всех опенсорс конкурентов.
Вышла и компактная версия Devstral Small 2 на 24B параметров — работает локально, поддерживает 256K контекста и распространяется по лицензии Apache 2.0.
Одновременно Mistral выпустила Vibe CLI — аналог Claude Code и Codex. Агент умеет исследовать проект, исправлять файлы сразу и выполнять shell-команды.
На старте модели доступны бесплатно по API и в Vibe CLI.
Линейка Devstral остаётся очень компактной для своего уровня — Small 2 можно крутить прямо на потребительском железе, сохраняя приватность кода.
? Mistral ? OpenRouter ? Веса Devstral Small 2 ? Веса Devstral 2
Google запустили Gemini 3 Deep Think — режим для сложных математических, научных и логических задач.
Использует параллельное рассуждение, где несколько Gemini 3 Pro одновременно изучают разные гипотезы, а модель-арбитр выбирает лучший ответ. Что-то напоминающее LLM Council от Андрея Карпаты из прошлых выпусков.
Такой подход медленнее, но ответы более продуманные и обоснованные, судя по метрикам.
Deep Think набирает 41% на Humanity’s Last Exam и 45.1% на ARC-AGI-2, опережая как Gemini 3 Pro (31.1%), так и закрытые модели вроде GPT-5.1.
Режим доступен только подписчикам Google AI Ultra, поэтому генерация может занимать время, так как параллельный ризонинг требует много вычислений.
OpenRouter опубликовал анализ 100 трлн токенов реального трафика. Собрал ключевые инсайты.
На открытые модели приходится 30% трафика. Китайские DeepSeek, Qwen и Kimi выросли с 1–2% до 30% в некоторые недели, в среднем — ~13%.
Смещение в сторону средних моделек на 15–70B. Рост у Qwen2.5 Coder 32B, Mistral Small 3, GPT-OSS 20B. А вот доля маленьких моделей падает.
Два главных сценария у OSS-моделей — roleplay и кодинг. Но не у китайцев — кодинг + технологии у них занимают ~39%.
>50% токенов у ризонинг-моделей
Средняя длина промпта выросла с 1.5K до >6K
Больше всего запросов про кодинг — 11% в начале года и до >50% в последние недели. Очевидный лидер здесь — Claude с >60% трафика. Доля OpenAI выросла до ≈8%, Google — ≈15%
Цена почти не влияет на объём. Дорогие модели получают сопоставимый трафик с дешёвыми. Важнее качество и стабильность.
«Бумеранг» DeepSeek. Пользователи возвращаются к этой модели после тестирования альтернатив.
География трафика: Северная Америка — 47%, Азия — ≈29–31%, Европа — ≈21%.
Языки: Английский — ≈83%, Русский — 2,47%, Китайский — <5%.
Полный отчёт опубликован на сайте OpenRouter.
Meituan представила LongCat-Image — открытую модель на 6B параметров. Модель показывает хорошую фотореалистичность, уверенное следование промптам и стабильную визуальную консистентность.
Превосходит модели, которые в несколько раз больше: HunyuanImage‑3.0 и Qwen Image. По бенчмаркам близка к GPT Image 1, по слепым тестам — отстает от базовой Nano Banana, но опережает FLUX.1 Kontext [Pro] .
Три версии:
LongCat-Image — флагман
LongCat-Image-Dev — промежуточный чекпоинт для файн-тюнинга.
LongCat-Image-Edit — специализированная модель редактирования, которая выходит в SOTA среди открытых моделей.
Вся экосистема открыта: чекпоинты, полный тренировочный пайплайн, интеграция с ComfyUI и Diffusers, LoRA-адаптеры, Apache 2.0.
По первым отзывам моделькаочень сильна в редактировании — особенно на сложных правках, где многие открытые модели теряют контроль.
? GitHub ? HuggingFace ? Официальный сайт ? Demo — Edit ? Demo — Image
Alibaba представила Wan-Move — открытую технологию для генерации видео с управлением движения объектов через траекторию.
Это по сути аналог Motion Brush в Kling: кистью задаём траекторию движения, а модель воспроизводит его в соответствии с этим путём.
Инструмент работает поверх видеомоделей семейства Wan и добавляет детальный контроль над динамикой сцены.
Для ComfyUI уже есть LoRA — Wan-Move: Kijai’s Video Motion LoRA. Можно использовать траекторное управление прямо в локальном пайплайне.
На LMArena появились две секретные модели для изображений — hazelnut и chestnut. Разработчик не указан, но по промптам модели сами признаются, что созданы OpenAI. Судя по всему, это обновлённые версии будущего GPT-Image-2.
Модели умеют рассуждать внутри изображения: во время генерации они корректируют композицию, устраняют ошибки и подстраивают детали под запрос.
Существенно улучшена работа с текстом, а характерный жёлтый оттенок прошлых DALL-E почти исчез. Отмечают более быструю генерацию по сравнению с нынешней моделью в ChatGPT.
Посмотреть работу можно прямо на LMArena, если модель попадётся в пул генерации. Запуск на платформ�� OpenAI обычно следует через несколько дней или недель после появления гост-версий — ожидается релиз обновлённой генерации изображений, возможно вместе с GPT-5.2.
? LMArena ? Design Arena
Adobe и OpenAI интегрировали Photoshop, Express и Acrobat в ChatGPT. Доступ дали ибесплатным пользователям.
Через чат теперь можно редактировать изображения, собирать макеты и работать с PDF без отдельных приложений.
Функции зависят от устройства: на старте полноценная работа доступна в веб-версии и на iOS; Android пока получает только Express, остальные инструменты появятся позже.
Что доступно:
Photoshop: правка отдельных частей изображения, яркость, контраст, экспозиция, эффекты и размытия
Acrobat: редактирование текста, объединение, конвертация и сжатие PDF
Express: быстрые постеры, обложки и другие материалы по шаблонам
Вызвать инструменты можно через @ прямо в чате.
? Официальный пресс-релиз Adobe ? ChatGPT Web
Хабр внедрил SourceCraft Code Assistant от Яндекса во все кодовые сниппеты. Теперь под каждым фрагментом есть кнопка «Объяснить код с SourceCraft»: ассистент анализирует статью и выбранный блок, после чего показывает оверлей с разбором — от импортов и переменных до логики функций и взаимодействия объектов.
Интерфейс адаптирован под устройства: на мобильных окно выводится снизу, на десктопе — в боковой панели.
Дополнительно можно перейти в расширенный режим на самой платформе SourceCraft и продолжить разбор как в IDE: задавать вопросы, адаптировать код под задачу или переписывать его на другой язык.
Фича снизит порог входа для новичков и вайбкодеров, а авторам не нужно дублировать базовые объяснения в тексте. Черновики и личные данные при этом не передаются внешним сервисам.
Появилось исследование на тему того, насколько безопасен код, который генерирует ИИ. Агентам дали 200 задач, основанных на реальных GitHub-коммитах, исправлявших уязвимости. Каждая задача требовала работы с несколькими файлами и в среднем ~170 строк кода.
Лучшим оказался Claude Sonnet 4:
61% решений запускались и проходили тесты
Но среди них 82.8% всё равно содержали уязвимости
Важно, что даже если заранее указать тип уязвимости или сосредоточить модель на безопасности, качество не улучшилось: рабочего кода становилось меньше, а безопасного — нет.
Исследователи предупреждают: такие результаты вызывают серьёзные опасения для использования вайб-кодинга в приложениях, где критична безопасность.
? arXiv
Сэм Альтман рассказал, что регулярно использует ChatGPT, чтобы разбираться с бытовыми вопросами ухода за ребёнком. По его словам, он «постоянно спрашивает совета у ИИ» и даже однажды спрятался в ванной, чтобы уточнить, нормально ли, что шестимесячный ребёнок ещё не ползает — модель заверила, что всё в порядке.
Альтман стал отцом в феврале, и его откровения вызвали дискуссию. Педиатры и эксперты относятся к такой зависимости от ИИ неоднозначно: модели всё ещё могут галлюцинировать, а ошибки в вопросах развития и здоровья детей могут быть критичными.
? Futurism
Криштиану Роналду стал инвестором и глобальным бренд-амбассадором Perplexity. Сделка даёт компании доступ к аудитории футболиста — более 1 млрд подписчиков, что усиливает её экспансию за пределы США и Европы.
Для фанатов запускают иммерсивный хаб Perplexity x CR7: интерактивную страницу с архивами, разборами голов и визуальной историей карьеры. Судя по формату, это прям полноценная интеграция в продукт.
Роналду объяснил выбор просто: «любознательность — условие величия», и Perplexity, по его словам, помогает задавать правильные вопросы.
? Bloomberg ? Perplexity x CR7
Реддитора RailfanHS попытались развести по классической схеме с оплатой доставки. Он решил контратаковать — и с помощью одного промпта в ChatGPT сгенерировал поддельную страницу «платёжного шлюза».
Страница при открытии запрашивала доступ к камере и GPS, делала снимок и отправляла данные на сервер.
RailfanHS отправил ссылку мошеннику под предлогом «ускоренной оплаты». Тот, ожидая лёгких денег, нажал «Разрешить» не задумываясь — и в этот момент скрипт получил селфи злоумышленника и его точные координаты.
Испугавшись раскрытия, мошенник начал звонить автору и клялся, что «бросит эту работу».
11 декабря 2008 года с браузера Google Chrome сняли плашку «Beta». До этого момента браузеры были просто просмотрщиками страниц, а Chrome привнес движок V8, который компилировал jаvascript в машинный код, ускорив веб в разы.
Это событие фактически убило Internet Explorer, породило Node.js, который построен на V8, и сделало возможным появление сложных веб-приложений, которыми мы пользуемся сегодня.
Неделя получилась насыщенной: новые LLM и генераторы картинок, открытые решения растут в качестве, а крупные игроки продолжают расширять экосистемы.
ИИ развивается системно: меняются технологии, инфраструктура и пользовательские привычки.
До встречи в следующем выпуске!
Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале ↩