OpenAI представляет GPT-4: Новое поколение языковой модели ИИ

После нескольких месяцев слухов и спекуляций, OpenAI анонсировала GPT-4: последнюю в линейке языковых моделей ИИ, которые используются в таких приложениях, как ChatGPT и новый Bing.

Содержание

OpenAI, создатель ChatGPT, наконец-то представил GPT-4, способный принимать текстовые или графические данные
Улучшения GPT-4 очевидны по результатам работы
GPT-4 является мультимодальной системой
История GPT — путь развития ИИ модели OpenAI

OpenAI, создатель ChatGPT, наконец-то представил GPT-4, способный принимать текстовые или графические данные

Компания утверждает, что эта модель «более творческая и совместная, чем когда-либо прежде» и «может решать сложные задачи с большей точностью». Она может анализировать как текст, так и изображения, но отвечать может только текстом. OpenAI также предупреждает, что системы сохраняют многие из тех же проблем, что и более ранние языковые модели, включая склонность к выдумыванию информации (или «галлюцинациям») и способность генерировать агрессивные и вредные тексты.

OpenAI заявляет, что уже сотрудничает с рядом компаний для интеграции GPT-4 в их продукты, включая Duolingo, Stripe и Khan Academy. Новая модель доступна для широкой публики через ChatGPT Plus, ежемесячную подписку OpenAI на ChatGPT за 20 долларов, и используется в чат-боте Bing от Microsoft. Она также будет доступна в виде API для разработчиков. (Здесь есть список ожидания, который, по словам OpenAI, начнет принимать пользователей уже сегодня).

В исследовательском блоге OpenAI сообщила, что различие между GPT-4 и его предшественником GPT-3.5 «едва уловимо» в обычном разговоре (GPT-3.5 — это модель, на которой работает ChatGPT). Генеральный директор OpenAI Сэм Альтман написал в Твиттере, что GPT-4 «все еще несовершенен, все еще ограничен», но он также «все еще кажется более впечатляющим при первом использовании, чем после того, как вы проведете с ним больше времени».

Улучшения GPT-4 очевидны по результатам работы

Компания утверждает, что улучшения GPT-4 очевидны в результатах работы системы на ряде тестов и эталонов, включая Единый экзамен по адвокатуре, LSAT, SAT Math и SAT Evidence-Based Reading & Writing. На упомянутых экзаменах GPT-4 набрала 88-й процентиль и выше, а полный список экзаменов и результаты системы можно посмотреть здесь.

Спекуляции о GPT-4 и ее возможностях были многочисленны в течение последнего года, многие предполагали, что это будет огромный скачок по сравнению с предыдущими системами. Однако, судя по заявлению OpenAI, улучшения носят скорее итерационный характер, о чем компания ранее предупреждала.

«Люди умоляют разочароваться, и они будут разочарованы», — сказал Альтман в интервью о GPT-4 в январе. «Шумиха такая же, как… У нас нет настоящего AGI, и это вроде как то, чего от нас ждут».

На прошлой неделе мельница слухов еще больше разгорелась после того, как один из руководителей Microsoft в интервью немецкой прессе проговорился, что система будет представлена на этой неделе. Он также предположил, что система будет мультимодальной — то есть способной генерировать не только текст, но и другие носители информации. Многие исследователи ИИ считают, что мультимодальные системы, объединяющие текст, аудио и видео, — это лучший путь к созданию более способных систем ИИ.

GPT-4 является мультимодальной системой

GPT-4 действительно является мультимодальной, но в меньшем количестве, чем некоторые прогнозировали. OpenAI утверждает, что система может принимать на вход текст и изображения и выдавать на выходе текст.

Компания утверждает, что способность модели одновременно анализировать текст и изображение позволяет ей интерпретировать более сложные входные данные.

В примерах ниже вы можете увидеть, как система объясняет мемы и необычные изображения:

История GPT — путь развития ИИ модели OpenAI

Это был долгий путь к GPT-4. OpenAI — и языковые модели ИИ в целом — медленно набирали обороты в течение нескольких лет, а затем в последние месяцы стали активно использоваться.

Оригинальная научная статья, описывающая GPT, была опубликована в 2018 году, GPT-2 был анонсирован в 2019 году, а GPT-3 — в 2020 году. Эти модели обучаются на огромных массивах данных текста, в значительной степени взятого из Интернета, которые обрабатываются для выявления статистических закономерностей. Эти закономерности затем используются для предсказания того, какое слово следует за другим. Это относительно простой механизм, но в итоге мы получаем гибкие системы, которые могут генерировать, обобщать и перефразировать написанное, а также выполнять другие текстовые задачи, такие как перевод или генерация кода.

Первоначально OpenAI откладывала выпуск своих моделей GPT, опасаясь, что они будут использоваться в злонамеренных целях, например, для генерации спама и дезинформации. Но в конце 2022 года компания запустила ChatGPT — разговорный чат-бот на основе GPT-3.5, доступ к которому мог получить любой желающий. Запуск ChatGPT вызвал ажиотаж в мире технологий, вскоре за ним последовала компания Microsoft со своим собственным чатботом ИИ Bing (часть поисковой системы Bing), а Google бросился догонять.

Как и предсказывалось, широкая доступность этих языковых моделей ИИ создала проблемы и трудности. Система образования все еще адаптируется к существованию программного обеспечения, которое пишет приличные эссе для колледжей; такие онлайн-сайты, как Stack Overflow и научно-фантастический журнал Clarkesworld, были вынуждены закрыть прием заявок из-за наплыва контента, генерируемого ИИ; а первые случаи использования инструментов написания текстов с помощью ИИ в журналистике были в лучшем случае нестабильными. Однако некоторые эксперты утверждают, что вредные последствия все же оказались меньше, чем ожидалось.

В своем анонсе GPT-4 OpenAI подчеркнул, что система прошла шестимесячный курс обучения безопасности, и что в ходе внутренних тестов она «на 82% реже отвечает на запросы о запрещенном контенте и на 40% чаще дает фактические ответы, чем GPT-3.5».

Однако это не означает, что система не допускает ошибок и не выдает вредный контент. Например, компания Microsoft показала, что ее чат-бот Bing все время работал на GPT-4, и многие пользователи смогли нарушить защитные ограждения Bing самыми разными творческими способами, заставляя бота давать опасные советы, угрожать пользователям и выдумывать информацию. GPT-4 также все еще не знает о событиях, «которые произошли после того, как подавляющее большинство его данных прервалось» в сентябре 2021 года.

OpenAI анонсирует GPT-4 — следующее поколение своей языковой модели ИИ

OpenAI, создатель ChatGPT, наконец-то представил GPT-4, способный принимать текстовые или графические данные

Улучшения GPT-4 очевидны по результатам работы

GPT-4 является мультимодальной системой

История GPT — путь развития ИИ модели OpenAI