OpenAI в ходе презентации Spring Update представила мультимодальную генеративную модель GPT-4o. Это ИИ, натренированный на тексте, фото и видео. С ним можно будет общаться абсолютно бесплатно и без регистрации.
GPT-4o может не только отвечать на вопросы в формате чат-бота, но также общаться голосом, поддерживать беседу и распознавать объекты в режиме реального времени через камеру смартфона.
Всё это напоминает ИИ из картины «Она» с Хоакином Фениксом и Скарлетт Йоханссон, на что намекнул и глава OpenAI Сэм Альтман.
По словам разработчиков, GPT-4o вдвое быстрее GPT-4, что позволяет моментально отвечать на команды пользователя и не тратить время на обработку. Также ИИ может распознавать эмоции, чтобы отвечать с соответствующей интонацией, шутками или даже сарказмом.
В числе других интересных возможностей: функция переводчика в режиме реального времени — голосом, и с поддержкой русского языка. Всего же ИИ способен распознать речь на 50 языках.
Пока GPT-4o доступна через API и стоит в два раза дешевле базового тарифа. Но на релизе ИИ станет полностью бесплатным для всех пользователей. Компания обещает начать внедрение в свои продукты уже в ближайшие недели.
GPT-4o будет доступна как в вебе, так и в формате десктопного приложения. В последнем случае ИИ сможет работать с различными приложениями для написания кода или текста. Можно будет просто показать ассистенту экран и задать вопрос.