Nvidia опубликовала новую версию агентных моделей Nemotron. Линейка Nemotron 3 будет выпускаться в трёх вариантах:
Nemotron 3 Nano — модель с 30 млрд параметров, ориентированная на узкоспециализированные и ускоренные задачи;
Nemotron 3 Super — версия на 100 млрд параметров для мультиагентных сценариев с высокоточным рассуждением;
Nemotron 3 Ultra — с мощным движком рассуждений и ~500 млрд параметров, рассчитанная на самые сложные задачи.
При создании Nemotron 3 Nvidia, как она сама подчёркивает, опиралась на гибридную архитектуру микшера экспертов (MoE), чтобы повысить масштабируемость и эффективность.
«Мы считаем, что находимся в уникальном положении, позволяющем обслуживать самый широкий круг разработчиков, которым нужна полная свобода в кастомизации моделей для создания специализированного ИИ, — за счёт сочетания нашей новой гибридной архитектуры mixture‑of‑experts с контекстным окном в один миллион токенов», — пояснила Карри Бриски, вице‑президент Nvidia в области GenAI‑софта.
По данным Nvidia, среди первых пользователей Nemotron 3 — Accenture, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens и Zoom.
В Nvidia подчёркивают, что дизайн «обеспечивает рост пропускной способности по токенам до 4-кратного» по сравнению с Nemotron 2 Nano, а также существенно уменьшает стоимость генерации за счёт сокращения генерации токенов рассуждения — вплоть до 60%.
Кроме того, в версиях Super и Ultra задействована новая архитектура latent MoE.
Модели Nemotron 3 также выиграли от расширенного обучения с подкреплением. Более крупные версии — Super и Ultra — обучались с использованием 4-битного формата NVFP4, что позволяет тренировать их на существующей инфраструктуре без потери точности.
Бенчмарк‑тесты от Artificial Analysis показали, что модели Nemotron занимают высокие позиции среди решений сопоставимого размера.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!