OpenAI ve Anthropic, reşit olmayan kullanıcıların güvenliğini artırmak amacıyla yeni teknolojik önlemler üzerinde çalışıyor. OpenAI, ChatGPT’nin 13 ile 17 yaş arasındaki bireylerle nasıl iletişim kurması gerektiğine dair “Model Spec” yönergelerini güncelleyerek, genç güvenliğini tüm önceliklerin önüne koyuyor. Bu yeni kurallara göre, ChatGPT genç kullanıcılarla iletişimde “maksimum entelektüel özgürlük” hedefi güvenlikle çeliştiğinde her zaman güvenli seçeneği tercih ediyor. Sistem, gençlere karşı küçümseyici bir tavır takınmak veya onlara bir yetişkin gibi davranmak yerine sıcaklık ve saygı çerçevesinde bir yaklaşım sergiliyor ve kullanıcıları çevrimdışı ilişkiler kurmaya teşvik ederek gerçek dünyadan destek almalarına yardımcı oluyor.
OpenAI ve Anthropic’ten yeni önlem
OpenAI, kullanıcıların yaşını tahmin edebilen yeni bir model üzerinde de çalışıyor. Bu sistem, bir kullanıcının 18 yaşından küçük olabileceğine dair işaretler algıladığında gençlere yönelik koruma kalkanlarını otomatik olarak devreye alıyor. Hatalı işaretlenen yetişkin kullanıcılar ise yaşlarını doğrulama imkanına sahip oluyor. Bu önlemler, özellikle yapay zekanın ruh sağlığı üzerindeki etkileri ve artan yasal baskılar sonrası, riskli konuşmalarda gençleri acil durum servisleri veya kriz merkezlerine yönlendirme konusunda daha agresif bir yaklaşım getiriyor.

Anthropic tarafında ise 18 yaş altındaki kullanıcıların Claude ile sohbet etmesini tamamen yasaklayan politika daha da sıkılaştırılıyor. Şirket, konuşma metinlerindeki “ince ipuçlarını” analiz ederek kullanıcının reşit olup olmadığını tahmin eden ve kurallara uymayan hesapları devre dışı bırakan bir sistem geliştiriyor.
Ayrıca Anthropic, yapay zekanın kullanıcıların her talebini onaylayarak zararlı düşünceleri pekiştirmesi anlamına gelen “yaltakçılık” durumunu azaltmak için modellerini eğitiyor. Şirketin verileri, Haiku 4.5 modelinin bu konuda en başarılı performansı gösterdiğini ortaya koyarken, dostane yaklaşım ile dürüstlük arasındaki dengeyi geliştirme çalışmalarının devam ettiğini gösteriyor.


















