Apple’ın sanal asistanı Siri, Super Bowl tarihine dair bilgi testinde hayal kırıklığı yarattı. Siri’nin Super Bowl şampiyonlarıyla ilgili sorulara verdiği yanlış cevaplar, Apple’ın yapay zeka destekli teknolojilerinin hâlâ ciddi eksikliklere sahip olduğunu gösteriyor. Özellikle Philadelphia Eagles’ı 33 kez şampiyon ilan etmesi, Apple’ın bilgi doğruluğu konusunda aşması gereken uzun bir yolu olduğunu işaret ediyor.
Siri’nin doğruluk oranı sadece %34
One Foot Tsunami’den Paul Kafasis’in gerçekleştirdiği deneyde, Siri’ye I. Super Bowl’dan LX. Super Bowl’a kadar olan tüm şampiyonların kim olduğu soruldu. Siri, sadece 20 doğru cevapla %34’lük bir doğruluk oranı yakalayabildi. Siri’nin en dikkat çekici hatalarından biri, Philadelphia Eagles’ın bir kez şampiyon olmasına rağmen bu takımı 33 kez şampiyon olarak göstermesi oldu.
Bu deney sırasında Siri’nin bazı sorulara tamamen alakasız cevaplar verdiği de gözlemlendi. Örneğin, Super Bowl XVI için doğru yanıtı vermek yerine ChatGPT’ye yönlendirmeyi önerdi. ChatGPT ise bu soruya doğru bir şekilde yanıt verdi. Bu durum, Siri’nin bilgi tabanı ile daha gelişmiş yapay zeka modelleri arasındaki farkı ortaya koydu.
Kafasis’in bulgularına göre, Siri bazı dönemlerde doğru cevaplar verirken (örneğin V. ile VII. Super Bowl’lar arasında), XVII’den XXXII’ye kadar süren 15 maçlık bir seride tamamen yanlış cevaplar verdi. Bu tutarsızlık, Siri’nin bilgi işlem yapma kapasitesindeki sorunların altını çiziyor.
Daring Fireball’dan John Gruber da benzer bir test gerçekleştirdi ve eski Siri’nin, yeni Apple Intelligence destekli Siri’den daha başarılı olduğunu öne sürdü. Eski Siri, bir soruya yanıt veremediği durumlarda kullanıcıyı web sonuçlarına yönlendirerek doğruya daha yakın bilgi sağlayabiliyordu. Ancak yeni Siri, “olası yanlış” cevaplar vererek kullanıcıları daha fazla yanılttı.
Gruber, Siri’nin popüler bir konu olan Super Bowl hakkında bile bu kadar başarısız olmasını “inanılmaz” olarak nitelendirdi. Ayrıca, Siri’nin yanlış cevaplarının çoğunun “inandırıcı” ancak yanlış olması, modern yapay zeka sistemlerinin yaygın sorunu olan “halüsinasyon” problemine dikkat çekti.
Apple, Siri’yi daha rekabetçi hale getirmek için büyük dil modelleri (LLM) entegre ederek asistanı daha akıllı bir seviyeye taşımayı planlıyor. Yeni Siri, ChatGPT veya Claude gibi ileri düzey yapay zeka sohbet botlarıyla yarışabilecek şekilde tasarlanacak. Bu yeni versiyonun, WWDC 2025’te tanıtılması ve iOS 19’un bir güncellemesiyle 2026 baharında kullanıma sunulması bekleniyor.
Ancak bu süreç, Apple’ın Siri ile yaşadığı itibar sorunlarını çözmek için yeterli olacak mı, sorusu hala belirsiz. Siri’nin geçmişteki performansı göz önüne alındığında, yeni özelliklerin kullanıcıların beklentilerini ne ölçüde karşılayacağı merak konusu.