Новая функция является частью цикла обновлений приложения OpenAI.
Возможность общаться с ChatGPT основана на двух отдельных моделях. Whisper, существующая модель преобразования речи в текст OpenAI, преобразует ваш голос, в текст, который затем передается чат-боту. А новая модель преобразования текста в речь преобразует ответы ChatGPT в произнесенные слова.
В демонстрации, которую компания предоставила на прошлой неделе, продемонстрированы варианты синтетических голосов ChatGPT. Они были созданы путем обучения модели преобразования текста в речь на голосах актеров, нанятых OpenAI. В будущем разработчики могут разрешить пользователям создавать свои собственные голоса. «При создании голосов критерием номер один было то, можно ли слушать этот голос весь день», — говорит менеджер проекта.
OpenAI поделится этой функцией преобразования текста в речь с несколькими компаниями, включая Spotify. Spotify сообщил, что использует одну и ту же технологию синтетического голоса для перевода подкастов о знаменитостях.
Реклама. ЧОУ ЧАСТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ДОПОЛНИТЕЛЬНОГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ ОБРАЗОВАТЕЛЬНЫЕ ТЕХНОЛОГИИ СКИЛБОКС (КОРОБКА НАВЫКОВ), ИНН 9704088880, erid: LdtCJzD4K
ChatGPT теперь также может отвечать на вопросы об изображениях. OpenAI представила эту функцию в марте, вместе с GPT-4 (модель, на которой работает ChatGPT). Теперь вы можете загружать изображения в приложение и проверять, что на них изображено.
Эти обновления показывают, насколько быстро OpenAI превращает свои экспериментальные модели в готовые продукты. OpenAI с момента своего неожиданного успеха ChatGPT в ноябре прошлого года постоянно совершенствует свою технологию и продает ее как частным, так и коммерческим потребителям.