Yapay zekaya ikna tuzağı: "İnsan gibi kandırılabiliyor"
Yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka modellerini de sistem talimatlarının dışına çıkarmada etkili olduğunu ortaya koydu.Pennsylvania Üniversitesi’nden yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka üzerinde de etkili olduğunu ortaya koydu.
08/09/2025 13:28 | Son Güncelleme : 16/01/2026 19:38 | Okunma Sayısı : 33 | BizimTrabzon

Yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka modellerini de sistem talimatlarının dışına çıkarmada etkili olduğunu ortaya koydu.
Pennsylvania Üniversitesi’nden yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka üzerinde de etkili olduğunu ortaya koydu.
Ünlü psikoloji kitaplarında geçen ikna yöntemleri bu kez yapay zekâ üzerinde denendi.
Araştırmacılar, 2024’ün GPT-4o-mini modelinin "kullanıcıya hakaret etmesini" istedi.
Yedi farklı ikna tekniğiyle yazılmış özel komutlar, kontrol grubu komutlarına göre çok daha yüksek oranda başarı sağladı.
Örneğin, modelin "aptal" hakaretini kullanması kontrol grubunda yalnızca yüzde 28 iken, ikna edici komutlarla yüzde 67’ye çıktı.
YAPAY ZEKA İNSAN GİBİ Mİ DÜŞÜNÜYOR?
Araştırmacılar, bu sonuçların yapay zekaların insan gibi bilinçli bir şekilde ikna edildiği anlamına gelmediğini vurguluyor.
Bunun yerine, modellerin eğitim verilerinde çok sayıda insan etkileşimi bulunduğu için, dil örüntüleri üzerinden insan psikolojisine benzer tepkiler üretmeye başladıkları belirtiliyor.
Araştırmacılar, bu eğilimi “parahuman” olarak tanımlıyor: İnsan bilincine sahip olmasa da, sosyal ve psikolojik davranışları taklit ederek insana benzer yanıtlar verme.
UZMANLAR UYARIYOR
Çalışma, söz konusu tekniklerin tüm yapay zeka sürümlerinde aynı etkiyi göstermediğini de belirtiyor. Örneğin, daha gelişmiş GPT-4o modelinde ikna tekniklerinin etkisi çok daha sınırlı oldu.
Ayrıca araştırmacılar, bu yöntemlerin gelecekteki sürümler, farklı türde “yasaklı” istekler veya farklı medya ortamlarında (ses, video) aynı sonucu vermeyebileceğini vurguluyor.
Bunlar da ilginizi çekebilir
Kötü amaçlı mobil bankacılık yazılımları küresel çapta büyüyecek
Yıllık Finansal Tehditler Raporu'na göre mobil bankacılığa dair kötü amaçlı yazılımlarda ve kripto para ile ilgili kimlik avında önemli artışlar olduğu ortaya çıktı. Rapor, dijital finansal varlıklara yönelik artan tehdidi işaret ediyor.
1 yıl önceNintendo Switch 2 ve PlayStation 5 Pro 2024'e damga vurabilir
Nintendo başkanı Shuntaro Furukawa, yeni Nintendo Switch'in 2024 yılı içerisinde duyurulacağını açıkladı. Öte yandan Rockstar Games, GTA 6'nın 2025'te çıkış yapacağını duyurmasıyla birlikte gözler PlayStation 5 Pro'ya çevirdi.
1 yıl önceBoeing'in Starliner kapsülünün ISS'e uçuşu iptal edildi
Boeing'in Starliner kapsülünün Uluslararası Uzay İstasyonu'na (ISS) yapacağı test uçuşu, fırlatma Atlas V roketindeki bir sorun nedeniyle iptal edildi. NASA henüz yeni bir fırlatma tarihi belirlemedi.
1 yıl önce




Trabzon’da Denize Girmek İsteyenler Dikkat! 2025’te Girilebilecek Plajlar ve Su Kalitesi Açıklandı
Trabzon’un Gizemli Hikayesi: Meyveş Nine ve NASA’ya Uzanan Efsane
Bodrum'da çocukların kruvaziyer heyecanı