GPT-4 – это новейшая модель ИИ от компании OpenAI, которая стала четвертой в линейке языковых моделей GPT и первой мультимодальной. Это значит, что она может обрабатывать не только текст, но и другие виды информации, – например, изображения.
Чем GPT-4 отличается от предшественников
Чтобы лучше понять разницу между привычным нам чат-ботом и его усовершенствованной версией, перечислим пять основных различий.
1. GPT-4 может понимать изображения
Мультимодальность позволяет GPT-4 понимать более одного «модального» типа информации. Все предыдущие модели GPT могли обрабатывать только текст. В отличие от них, GPT-4 способен анализировать изображения и понимать, что на них изображено. ChatGPT анализирует изображения и понимает юмор.
В сочетании с возросшими логическими способностями это приводит к удивительным результатам. Например, GPT-4 не только понимает, что на картинке изображен огромный разъем для iPhone, но может объяснить почему это смешно! А ведь юмор долго считали недостижимой для ИИ вершиной.
Многообещающим выглядит также сотрудничество OpenAI с платформой Be My Eyes для незрячих людей. Приложение на основе GPT-4 позволит слепым и слабовидящим получить звуковое описание всего, что видит их телефон.
Например, если пользователь отправит фотографию своего холодильника изнутри, виртуальный помощник сможет определить, что в нем находится. Кроме этого он может описать узор на платье, перевести этикетку, прочитать карту и объяснить, как добраться до нужного отдела в магазине.
2. GPT-4 сложнее сбить с толку
OpenAI провела огромную работу, чтобы сделать GPT-4 более безопасным. В результате модель на 82% реже предшественницы отвечает на запросы о запрещенном контенте. Существенно изменились в лучшую сторону также ответы на деликатные и неоднозначные запросы.
Между тем остается вероятность того, что GPT-4 может сгенерировать вредоносный контент. Условно его можно разбить на 5 групп риска.
Советы, которые могут привести к самовредительству.
- Преследование, унижение и ненависть.
- Материалы эротического характера.
- Информация, которая может быть полезной для планирования нападений или насилия.
- Инструкции по поиску незаконного содержания.
3. GPT-4 может помнить в ходе разговора больше текста
Большие языковые модели обучались на миллионах веб-страниц. Но когда вы пытаетесь ввести в ChatGPT страницу текста, может выясниться, что это слишком много. Аналогичным образом ответ чат-бота часто прерывается после 4–5 абзаца.
Дело в том, что существует предел количества информации, которую языковая модель может «держать в уме». Кстати, подробнее об этом мы писали в статье про интеграцию GPT-помощника в Google Docs.
В GPT-4 проблема решена: максимальное количество токенов в запросе возросло до 32 768. Это примерно 50 страниц текста. Вполне достаточно для содержательной беседы с ИИ на любую тему.
4. GPT-4 имеет улучшенную многоязычность
Изначально ответы ChatGPT на английском были заметно лучше аналогичных на других языках. Поэтому многие пользователи были вынуждены делать двойную работу: сначала переводить запрос на английский, а потом переводить ответ с английского.
GPT-4 сделал в этом направлении шаг вперед. Теперь ответы на итальянском, украинском, корейском и еще 26 языках почти такие же корректные, как и на английском.
5. GPT-4 может менять свое поведение по требованию
Разработчики внедрили в GPT-4 расширенный инструментарий управляемости. Он позволяет отправлять через API системные сообщения, которые меняют стиль работы ИИ, задают тон его ответов и устанавливают определенные сценарии взаимодействия с человеком.
GPT-4 может менять тон ответов и сценарии взаимодействия с человеком
Например, системное сообщение может выглядеть так: «Вы репетитор, который всегда отвечает в стиле Сократа. Вы никогда не даете ученику ответа, но всегда стараетесь задать правильный вопрос, чтобы помочь ему научиться думать самостоятельно».
Ограничения и недостатки GPT-4
«GPT-4, как правило, не знает о событиях, которые произошли после сентября 2021 года, и не учится на своем опыте, – пишет OpenAI. – Иногда он может совершать простые логические ошибки или быть слишком легковерным, принимая очевидные ложные утверждения от пользователя».
GPT-4 также по-прежнему имеет социальные предубеждения, склонен к галлюцинациям и враждебным подсказкам. Однако разработчики стремятся расширить возможности участия людей в формировании модели и призывают их активнее оценивать удачные и неудачные ответы ИИ в окне чата.
Где можно попробовать GPT-4
Сразу после запуска бота в американской компании объявили, что GPT-4 уже доступен в ряде сервисов. По словам разработчиков, новую модель ИИ даже взяли на вооружение власти Испании. Если вы тоже хотите протестировать GPT-4, вот несколько сервисов, где можно это сделать.
Чат-бот ChatGPT – новое поколение нейросети, к сожалению, пока доступно только в платной версии. Кроме того, использование GPT-4 ограничено 100 запросами в течение четырех часов.
Duolingo – у известного приложения для изучения языков появилась новая платная подписка. После покупки добавятся еще две функции: разобрать свои ошибки с чат-ботом и пообщаться с GPT-4 в режиме Role Play. Пока нейросеть работает только с французским и испанским языками.
Poe – это приложение создано разработчиками популярного ресурса с вопросами и ответами Quora. В нем можно пообщаться с GPT-4 и спросить его обо всем, что интересно. Функция доступна только в платной версии сервиса.
Возможности и перспективы
OpenAI уже сотрудничает с рядом компаний, которые интегрировали GPT-4 в свои продукты. Например, приложение Stripe использует GPT-4 для сканирования сайтов.
GPT-4 – Generative Pre-Trained Transformer model 4
Duolingo встроил новейшую модель ИИ в новый уровень подписки на изучение языков. Morgan Stanley создает систему на основе GPT-4, которая будет извлекать информацию из документов компании и предоставлять ее финансовым аналитикам.
В дальнейшем таких приложений станет еще больше. А простые пользователи получат более мощного и безопасного GPT-ассистента, который понимает шутки, может запоминать длинные разговоры, заменит для детей репетиторов по любому предмету и станет вторыми глазами для слабовидящих.
«Мы надеемся, что GPT-4 станет ценным инструментом для улучшения жизни людей за счет поддержки многих приложений, – пишет OpenAI. – Предстоит еще много работы, и мы с нетерпением ждем возможности улучшить эту модель благодаря коллективным усилиям сообщества».