OpenAI, Mayıs ayında tanıttığı GPT-4o modeliyle ses getiren yeniliklerine bir yenisini daha ekliyor. GPT-4o’nun insan benzeri gelişmiş ses modunun, önümüzdeki hafta ile beraber sunulacağını duyurdu. Peki bu özellik tüm kullanıcılar için mi geçerli olacak? İşte GPT-4o gelişmiş ses modu özelliğiyle ilgili detaylar…
Ses getiren yenilik GPT-4o gelişmiş ses modu özelliği neler sunuyor?
OpenAI, geçtiğimiz aylarda duyurduğu GPT-4o ile yapay zekâda yeni bir dönemi başlattı. Bu model, yüz ifadelerini okuyabilme, konuşulan dili gerçek zamanlı olarak tercüme edebilme ve farklı duygu türlerini taklit edebilme yetenekleriyle dikkat çekiyor. Şimdi ise bu özelliklere ek olarak gelişmiş ses modu özelliği, ChatGPT Plus abonelerine sunulacak.
OpenAI CEO’su Sam Altman, yeni ses modunun ChatGPT Plus abonelerine sunulacağını X hesabından duyurdu. Ancak, tüm Plus abonelerine mi yoksa belirli bir kullanıcı kitlesine mi sunulacağı henüz net değil. Yine de, bu gelişme kullanıcılar arasında büyük bir merak oluşturmuş durumda.
GPT-4o’nun ses modu, gerçek zamanlı yanıt verme yeteneğiyle öne çıkıyor. Kullanıcının sesindeki nüansları algılayarak çeşitli duygusal tarzlarda sesler üretebilen bu mod, şarkı söyleme dâhil birçok farklı seslendirme stili sunuyor. Teknik olarak GPT-4o gelişmiş ses modu, ses girdilerine iki yüz otuz iki milisaniye kadar kısa bir süre içinde yanıt verebiliyor ki bu, bir insanın ortalama yanıt süresiyle eş değer.
Önceki modellerde, ChatGPT ile konuşmak için Ses Modu kullanıldığında gecikme süreleri oldukça yüksekti. GPT-3.5 ve GPT-4 modellerinde bu süreler sırasıyla ortalama 2,8 saniye ve 5,4 saniyeydi. Bu modellerde, sesin metne dönüştürülmesi, metnin işlenmesi ve tekrar sese dönüştürülmesi gibi karmaşık bir süreç vardı. Ancak, GPT-4o ile bu süreç tek bir modelde birleşiyor. Artık ses, metin ve görsel bilgiler, tek bir model elinden analizden geçip çıktıya dönüştürülüyor.
OpenAI CEO’su Sam Altman’ın, GPT-4o gelişmiş ses modu özelliği için yorumları şu şekilde:
“Yeni ses (ve video) modu şimdiye kadar kullandığım en iyi bilgisayar arayüzü. Filmlerdeki yapay zekâ gibi hissettiriyor; ve gerçek olması benim için hâlâ biraz şaşırtıcı. İnsan seviyesinde tepki sürelerine ve ifade gücüne ulaşmak büyük bir değişiklik olacak gibi görünüyor.”
Önümüzdeki hafta itibariyle, ChatGPT Plus aboneleri bu yenilikçi ses modunu deneyimleme fırsatı bulacak. OpenAI’ın bu adımı, yapay zekâ ile etkileşimde yeni bir dönemin kapılarını aralıyor.
Peki sunulan bu yeni yapay zekâ özelliği hakkında siz ne düşünüyorsunuz? Görüşlerinizi aşağıda bulun yorumlar kısmında bizlerle ve okurlarla paylaşabilirsiniz…