Новости ChatGPT

Perplexity обошел Google и OpenAI в глубоком поиске и запустил «совет моделей»

Компания Perplexity выпустила сразу два крупных обновления: Advanced-версию Deep Research и функцию Model Council. Обновленный глубокий поиск работает на Claude Opus 4.5 от Anthropic и занял первое место в лидерборде Google DeepMind Deep Search QA с результатом 79.5% — выше, чем у Moonshot K2.5 (77.1%), самого Opus 4.5 без обвязки Perplexity (76.1%), GPT-5.2 (71.3%) и Gemini Deep Research Agent от Google (66.1%).

Компания также представила собственный бенчмарк DRACO (Deep Research Accuracy, Completeness and Objectivity) и выложила его в открытый доступ. Он включает 100 задач в 10 доменах — от финансов и медицины до права и шопинга, каждая оценивается по ~40 экспертным критериям. На DRACO Perplexity Deep Research набрал 67.15%, обойдя Google Gemini Deep Research (58.97%) и OpenAI Deep Research на o3 (52.06%). Лучшие абсолютные показатели — в категориях "Право" (89.4%) и "Академические исследования" (82.4%).

Вторая новинка — Model Council, режим "совета моделей". Один запрос одновременно уходит на три модели — Claude Opus 4.5, GPT-5.2 и Gemini 3.0. Затем модель-синтезатор анализирует ответы, разрешает конфликты и выдает единый результат, показывая, где модели сошлись, а где разошлись. По сути, Perplexity превратила конкурентов — OpenAI, Anthropic и Google — в совещательный орган внутри одного сервиса.

Обе функции уже доступны подписчикам Max, Advanced Deep Research скоро появится и для Pro. Также интересно, что в API Perplexity заметили упоминание Claude Opus 4.6 — ранее ходили слухи о выпуске Sonnet 5, но не исключено, что в Anthropic решили пропустить вперед флагманскую модель.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.