Ana içeriğe atla

GELDİ! - ChatGPT Advanced Voice Mode Kullanıma Sunuldu!

 OpenAI, GPT-5 tanıtımı beklediğimiz bir sunumda aniden GPT 4o adında bir model tanıtıp herkesi dumura uğratmış, ve akabinde devrimsel bir ses modelini bizlerle buluşturmuştu. O kadar gerçek olmak için fazla mükemmel duruyordu ki, benim aklımdan her saniye "acaba arkada birisi tarafından önceden oluşturulmuş bir ses dosyasını mı oynatıyorlar" diye geçip durdu. O kıkırdamalar, gülüşmeler, espriler, cilveler işveler, gerçek olmak için fazla insansıydı. Bildiğin birisini arayıp sohbet etmişçesine doğal geliyordu kulağa. İleriki haftalarda dedikten sonra tabii, beklendiği gibi ertelenip durdu, ve en son temmuz sonu işaret edildi. O gün geldi çattı ve sonunda yayınlandı, ve ben yanıldığım için o kadar mutlu hissediyorum ki kendimi şu an anlatamam sizlere :)

Advanced mode adı altında çok küçük bir gruba - ki ben o gruba dahil değilim :( - erişime açıldı, gördüklerimiz ise sunumdakinden tamamen farksız resmen. Keşke gösterme şansım sizlere olsa, ama şuanlık sadece gördüklerimi iletmekten başka şansım yok.

Öncelikle birkaç YouTube kanalı saolsun çokça fazla örnek şuan video olarak yer almakta, sizler de "ChatGPT Advanced Voice" aramasını yaparak bakabilirsiniz. Benim gördüğüm konuşmanın doğallığı, tonlamalar tam da gösterildiği gibi inanılmaz gerçekçi. Sesleri istediğiniz şekle, dramatik, sinirli, utangaç, heyecanlı, kalın, ince şeklinde şekillendirmesini isteyebiliyorsunuz. Dil kabiliyetleri de çok gelişmiş, Türkçe de dahil benim gördüğüm neredeyse tüm dilleri konuşabilmekte, ama tek bir eksiyle, ufak bir Amerikan aksanı her dilde kendini belli ediyor, ama rahatsız etmiyor. Tüm dilleri native halde konuşan bir Amerikan olarak düşünürsek inanılmaz başarılı, ve diller arasındaki geçiş de pürüzsüz. Demolarda gördüğünüz o tüm konuşmaları, denemeleri yapabilirsiniz yani, ve mükemmel de çalışıyor kesinlikle.

İkinci artısı da, konuşmalarda sizin cümlenizden sonraki o gecikme az olduğu söylenmişti, tam olarak öyle de olmuş. Doğal bir konuşma gibi neredeyse duraksama olmaksızın sohbet edebiliyorsunuz.

Video modu daha yayınlanmadı, yani canlı olarak kamerayla etrafı ya da kendinizi gösterip konuşamıyorsunuz, ilerleyen zamanlarda geleceğini söylüyorlar ki umarım gelir, biz de ağzımız açık şekilde denemeye devam ederiz.

OpenAI bizleri fazlasıyla bekletti, ama görünen o ki sonuca değmiş gibi duruyor. Ben fazlasıyla etkilendim, mükemmel olmuş gerçekten. Keşke deneyebilsem de kişisel olarak yorumlayabilsem, ama bu şekilde başkalarının denemelerini görmek bile heyecanımı yeniden diriltmeye yetmiş gibi duruyor...

Yorumlar

Bu blogdaki popüler yayınlar

E Bu Çok İyiymiş - Xbox 9.Nesil Oyun Kolu İncelemesi

Daha yeni sizlere bir yazı paylaştım, bu yazıda 2 adet imitasyon kol, ve hesaplı olmasına rağmen harika bir performansa sahip logitech oyun kollarını beraber her açıdan irdelemiştik. Şimdi, ben bu yazıyı yazdığımda f310 modeli 2 3 yıllık serüveninin sonuna gelmek zorunda kaldı, çünkü Lb tuşu bir düşürme sonucu çalışmaya devam etse de hissizleşti, yani basıp basmadığınızı anlamıyorsunuz ama bastırdığınızda bir şekil çalışıyor gibi düşünebilirsiniz. Ben de bunun sonrasında fellik fellik yeni oyun kollarını araştırmaya başladım. Önümde 2 seçenek vardı, ya ucuza yönelecektim ve geleceği pek düşünmeyecektim, ya da bir çılgınlık yapıp almışken tam alayım diyecektim. Yazının başlığından hangisini seçtiğim malum gibi 😅 Aldım kendisini, hemen ertesi gün kapıma geldi, ve evet taksitle aldım tekte ödeyecek maddi durumum yoktu maalesef :') Beklentim de, tamamiyle stabil her şeyi düzgün çalışan sorunsuz bir kol olmasıydı. Ve galiba da elde ettim, birkaç pürüz dışında en azından... Bu pürüzleri...

Yapay Zeka Kapışması V2 - Copilot vs Gemini vs ChatGPT

 Ben ilk defa bu kapışmayı yapalı 2,5 ay geçti, ve bu sırada düşündüğümden çok daha fazla gelişme gördük. Ben de dedim ki, madem geliştiler bir daha kapıştıralım geleceğin asistanlarını. Bu sefer biraz puanlama tarafına da gireceğiz, ve sonda kategorileşmiş ve toplu halde kimin daha iyi olduğuna her yönden karar vereceğiz. Eski yazım için  Geleceğin Asistanları, Fakat Hangisi En İyisi? (ChatGPT vs Microsoft Copilot vs Google Bard) (alphardal.blogspot.com)  linkine tıklayabilirsiniz. Ama önce şuradan başlayalım, 2,5 ayda ne değişti? Copilot'un tasarımı elden geçirildi, GPTs denilen özellik hem ChatGPT hem de Copilot'a geldi, Copilot'a eklentiler dahil oldu, ChatGPT ile sesli konuşma özelliği geldi, Bard direkt olarak kimlik değiştirdi, modeli güncellendi ve tasarımı yine değiştirildi, yeni adı Gemini olan Bard'ın mobil uygulaması çıktı vs vs. Evet, bunların hepsi son 2.5 ayda oldu, ciddi manada sert bir kapışma var ortada ve tüm modeller birbirlerine ayak uydurma çabasın...

50 mp giriş seviyesi kameralar neden 48 mp giriş seviye kameralardan daha kötü?

 Evet bu konu birazcık benim pazarlama argümanlarına saldırım gibi olacak, çünkü insanları pazarlama yöntemleri ile kandırmanın peşindeler belli ki. Ortada şöyle saçma bir kanı var, aynı fiyat etiketindeki iki telefona bakıyor mesela Mehmet diye biri, Mehmet telefonlardan pek anlamıyor ve sayılara bakarak karar vermek istiyor. Birinde 48, diğerinde 50 mp kamera görünce matematik bilgisiyle 50>48 diyerek 50 mp kameranın daha iyi olduğu kanısına varıyor. Amma velakin detaya indiğimizde durum pek öyle değil. Öncelikle Sony'nin orta üst segmentteki telefonlarda kullanılan 50 mp sensörü konumuzun dışında, o sensör bambaşka bir kitleye hitap ediyor. Biz giriş ve orta seviyedeki telefonların sensörlerini baz alacağız. En basit örnek ile redmi note 10 ve redmi note 11 farkına göz atalım. Note 10 sensör olarak Sony IMX 582 48 mp'lik sensörünü kullanırken, Note 11 sensör olarak Samsung JN1 50 mp'lik sensörünü kullanıyor. Şimdi Mehmet olduğumuzu varsayarsak, Note 10 eski model 1 yı...