Точность ответов ChatGPT-4 за несколько месяцев упала с 97% до 2,4% — исследование

Новости 20 июля 2023

Наталья Гормалева

Новостной редактор RB.RU

Наталья Гормалева

Команда исследователей из Стэнфордского университета и Калифорнийского университета в Беркли выяснила, что точность ответов платной версии ChatGPT стремительно упала.

Подписаться на RB.RU в Telegram

Ученые обнаружили, что если в марте текущего года ChatGPT-4 решал математические задачи с точностью в 97,6%, то к июню цифра критически снизилась до 2,4%.

При этом корректность ответов предыдущей версии GPT-3.5 лишь растет. Если в марте точность математических расчетов составляла 7,4%, то в июне она возросла до 86,8%.

Помимо математических вычислений ученые проанализировали динамику точности работы AI-моделей в области генерации кода, визуального мышления и с точки зрения ответов на деликатные или опасные вопросы.

Изменились показатели GPT-4 при ответах на опасные вопросы, в июне бот предоставил меньше ответов, чем в марте. При этом обе версии в июне перестали разъяснять, почему не могут ответить на тот или иной вопрос. Еще в марте пользователи получали развернутое разъяснение.

Кроме того, увеличилось число ошибок при генерации программного кода. Если в марте GPT-4 выполнял 50% из 50 поставленных задач, то в июне смог реализовать только 10%. Аналогичная тенденция отмечается и в версии GPT-3.5.

Одно из возможных объяснений состоит в том, что июньские версии постоянно добавляли в свои генерации дополнительный текст, не относящийся к коду.

В июле OpenAI, разработавшая ChatGPT, предоставила доступ к API последней версии языковой модели GPT-4. Саму версию компания разработала еще в марте.

Фото на обложке: Caprieleeeh / Shutterstock

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

ТЕГИ

Искусственный интеллект
ChatGPT
IT
openai
Исследования
Технологии
Искусственный интеллект
ChatGPT
IT
openai
Исследования
Технологии

Возможности

31 декабря 2027

DeepTech Studio

Все возможности

Колонки

Материалы по теме

Пройти курс «Старт работы на Wildberries»
1 Почему люди становятся зависимы от голосовых чат-ботов Это признает даже OpenAI 20 августа 19:01
2 Фабрика фаундеров: чем занимаются экс-сотрудники OpenAI На эти стартапы стоит обратить внимание 09 августа 14:28
3 Соучредитель OpenAI Джон Шульман перешел на работу в компанию-конкурента Он продолжит следовать своим целям в ИИ-стартапе Anthropic 06 августа 15:47
4 OpenAI рассказала подробности о GPT-4o Mini: это дешевая альтернатива GPT-3.5 Turbo Несмотря на экономичность, эффективность от этого не страдает 21 июля 06:39

Точность ответов ChatGPT-4 за несколько месяцев упала с 97% до 2,4% — исследование

Возможности

Популярное

Product Hunt: что это такое?

Хакеры атаковали компании через взломанные системы для лифтов

32 факта о Павле Дурове

«Сбер» возобновил выдачу ипотеки для ИТ-специалистов

Исключение из ЕГРЮЛ — что нужно знать

Материалы по теме