OpenAI задерживает выпуск долгожданной функции голосового помощника для ChatGPT, чтобы гарантировать, что она может безопасно и эффективно обрабатывать запросы от миллионов пользователей.
Стартап, занимающийся искусственным интеллектом, представил функцию голосовой связи на мероприятии по запуску продукта GPT-4o в мае, обновленной версии своей модели GPT-4, которая лучше справляется с текстом, аудио и изображениями в режиме реального времени. В своем заявлении OpenAI сообщила, что что первоначально компания намеревалась внедрить голосовую функцию для небольшой группы платных подписчиков ChatGPT Plus в конце июня, но решила, что ей потребуется еще месяц, чтобы «достичь нашей планки для запуска». «Мы улучшаем способность модели обнаруживать определенный контент и отклонять его», - заявила компания во вторник. «Мы также работаем над улучшением взаимодействия с пользователями и готовим нашу инфраструктуру к масштабированию до миллионов пользователей, сохраняя при этом оперативность реагирования».
Задержка представляет собой возможную неудачу для Openal, поскольку она стремится опередить конкурентов в области искусственного интеллекта, число которых становится все больше. В прошлом году компания представила более ограниченную возможность для ChatGPT отвечать пользователям, но новая функция обещала быть более быстрой и в сочетании с мощными возможностями распознавания изображений превратить чат-бота в гораздо более полезного и динамичного партнера для общения.
На сцене во время презентации сотрудники OpenAI продемонстрировали, что ChatGPT практически мгновенно реагирует на запросы, такие как решение математической задачи на листе бумаги, помещенном перед камерой смартфона исследователя. Некоторые зрители сравнили этот инструмент с виртуальным ассистентом с искусственным интеллектом в фильме «Она» 2013 года, озвученным Скарлетт Йоханссон. Позже актриса потребовала удалить один из голосов в чате, потому что он слишком похож на нее.
Во вторник OpenAI заявил, что планирует развернуть функцию голоса для всех своих платных подписчиков осенью. Openai сказал, что «также работает» над выпуском функций обмена видео и экраном, которые компания продемонстрировала во время своего майского мероприятия. Он также сообщила, что позволит пользователям узнать больше о времени для этих функций в будущем.
В результате, вполне вероятно, что когда в следующем месяце голосовая опция станет доступна для некоторых платных пользователей, ее возможности будут более ограниченными, чем те, что были продемонстрированы на мероприятии. Например, чат-бот не сможет получить доступ к функции компьютерного зрения, которая позволяла бы ему в устной форме комментировать танцевальные движения пользователя, просто используя камеру смартфона.