13 мая компания OpenAI на презентации в Сан-Франциско представила свою новую языковую модель с искусственным интеллектом, GPT-4.0, которая внесла значительные изменения во взаимодействие человека с компьютером.
Новая модель способна обрабатывать текстовую, аудио- и визуальную информацию, генерируя ответы, близкие к человеческим. Наибольшее внимание было уделено голосовым возможностям GPT-4.0, которые были существенно улучшены по сравнению с предыдущими версиями. Теперь задержка в ответах сократилась до 320 миллисекунд, что приближает модель к скорости реакции человека.
Примечательно, что большинство ответов GPT-4.0 начинаются с вводных слов, что создает иллюзию мгновенного ответа, хотя на самом деле модель в это время подготавливает полноценную реакцию. Этот прием делает общение с моделью более естественным и похожим на диалог с реальным человеком.
Читайте также
Важным новшеством является возможность модели изменять интонацию голоса, делая его более выразительным или роботизированным по желанию пользователя. Также GPT-4.0 способна распознавать эмоции пользователя и анализировать визуальную информацию, что открывает новые перспективы для использования модели в различных сферах, включая образование, перевод и аналитику данных.
Приложение ChatGPT для macOS представляет собой удобный инструмент для общения с моделью и отображения информации на экране. Модель успешно справляется с распознаванием текста, кода, графиков и других визуальных элементов, что делает ее полезной не только для программистов, но и для пользователей с различными профилями.
Первые пользователи уже оценили возможности GPT-4.o как «сумасшедшие» в лучшем смысле слова, особенно в контексте работы с графиками и анализа данных. Пока голосовые функции доступны ограниченному числу пользователей, но в ближайшем будущем планируется их расширение для всех пользователей.
Подготовила Н.Григорян