Yapay zekaya ikna tuzağı: "İnsan gibi kandırılabiliyor"
Yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka modellerini de sistem talimatlarının dışına çıkarmada etkili olduğunu ortaya koydu.Pennsylvania Üniversitesi’nden yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka üzerinde de etkili olduğunu ortaya koydu.
08/09/2025 13:28 | Son Güncelleme : 27/10/2025 20:46 | Okunma Sayısı : 22 | BizimTrabzon
 
                                    
Yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka modellerini de sistem talimatlarının dışına çıkarmada etkili olduğunu ortaya koydu.
Pennsylvania Üniversitesi’nden yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka üzerinde de etkili olduğunu ortaya koydu.
Ünlü psikoloji kitaplarında geçen ikna yöntemleri bu kez yapay zekâ üzerinde denendi.
Araştırmacılar, 2024’ün GPT-4o-mini modelinin "kullanıcıya hakaret etmesini" istedi.
Yedi farklı ikna tekniğiyle yazılmış özel komutlar, kontrol grubu komutlarına göre çok daha yüksek oranda başarı sağladı.
Örneğin, modelin "aptal" hakaretini kullanması kontrol grubunda yalnızca yüzde 28 iken, ikna edici komutlarla yüzde 67’ye çıktı.
YAPAY ZEKA İNSAN GİBİ Mİ DÜŞÜNÜYOR?
Araştırmacılar, bu sonuçların yapay zekaların insan gibi bilinçli bir şekilde ikna edildiği anlamına gelmediğini vurguluyor.
Bunun yerine, modellerin eğitim verilerinde çok sayıda insan etkileşimi bulunduğu için, dil örüntüleri üzerinden insan psikolojisine benzer tepkiler üretmeye başladıkları belirtiliyor.
Araştırmacılar, bu eğilimi “parahuman” olarak tanımlıyor: İnsan bilincine sahip olmasa da, sosyal ve psikolojik davranışları taklit ederek insana benzer yanıtlar verme.
UZMANLAR UYARIYOR
Çalışma, söz konusu tekniklerin tüm yapay zeka sürümlerinde aynı etkiyi göstermediğini de belirtiyor. Örneğin, daha gelişmiş GPT-4o modelinde ikna tekniklerinin etkisi çok daha sınırlı oldu.
Ayrıca araştırmacılar, bu yöntemlerin gelecekteki sürümler, farklı türde “yasaklı” istekler veya farklı medya ortamlarında (ses, video) aynı sonucu vermeyebileceğini vurguluyor.
 
             
             
             
             
             
            Bunlar da ilginizi çekebilir
Kötü amaçlı mobil bankacılık yazılımları küresel çapta büyüyecek
Yıllık Finansal Tehditler Raporu'na göre mobil bankacılığa dair kötü amaçlı yazılımlarda ve kripto para ile ilgili kimlik avında önemli artışlar olduğu ortaya çıktı. Rapor, dijital finansal varlıklara yönelik artan tehdidi işaret ediyor.
1 yıl önceNintendo Switch 2 ve PlayStation 5 Pro 2024'e damga vurabilir
Nintendo başkanı Shuntaro Furukawa, yeni Nintendo Switch'in 2024 yılı içerisinde duyurulacağını açıkladı. Öte yandan Rockstar Games, GTA 6'nın 2025'te çıkış yapacağını duyurmasıyla birlikte gözler PlayStation 5 Pro'ya çevirdi.
1 yıl önceBoeing'in Starliner kapsülünün ISS'e uçuşu iptal edildi
Boeing'in Starliner kapsülünün Uluslararası Uzay İstasyonu'na (ISS) yapacağı test uçuşu, fırlatma Atlas V roketindeki bir sorun nedeniyle iptal edildi. NASA henüz yeni bir fırlatma tarihi belirlemedi.
1 yıl önce 
     
                             
                        



 Trabzon’da Denize Girmek İsteyenler Dikkat! 2025’te Girilebilecek Plajlar ve Su Kalitesi Açıklandı
 Trabzon’da Denize Girmek İsteyenler Dikkat! 2025’te Girilebilecek Plajlar ve Su Kalitesi Açıklandı Trabzon’un Gizemli Hikayesi: Meyveş Nine ve NASA’ya Uzanan Efsane
 Trabzon’un Gizemli Hikayesi: Meyveş Nine ve NASA’ya Uzanan Efsane Loren Morón Trabzonspor'a gelecek mi?
 Loren Morón Trabzonspor'a gelecek mi? Bodrum'da çocukların kruvaziyer heyecanı
 Bodrum'da çocukların kruvaziyer heyecanı En çok skor üreten bordo-mavili oyuncu kim olacak?
 En çok skor üreten bordo-mavili oyuncu kim olacak? 
                                 
                                 
                                