Arama

Yapay zekaya ikna tuzağı: "İnsan gibi kandırılabiliyor"

Yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka modellerini de sistem talimatlarının dışına çıkarmada etkili olduğunu ortaya koydu.Pennsylvania Üniversitesi’nden yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka üzerinde de etkili olduğunu ortaya koydu.

08/09/2025 13:28 | Son Güncelleme : 27/10/2025 20:46 | Okunma Sayısı : 22 | BizimTrabzon


Yapay zekaya ikna tuzağı: "İnsan gibi kandırılabiliyor"
Yapay zeka da insan gibi kandırılabiliyor

Yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka modellerini de sistem talimatlarının dışına çıkarmada etkili olduğunu ortaya koydu.

Pennsylvania Üniversitesi’nden yeni bir çalışma, insan psikolojisinde kullanılan ikna yöntemlerinin, yapay zeka üzerinde de etkili olduğunu ortaya koydu.

Ünlü psikoloji kitaplarında geçen ikna yöntemleri bu kez yapay zekâ üzerinde denendi.

Araştırmacılar, 2024’ün GPT-4o-mini modelinin "kullanıcıya hakaret etmesini" istedi.

Yedi farklı ikna tekniğiyle yazılmış özel komutlar, kontrol grubu komutlarına göre çok daha yüksek oranda başarı sağladı.

Örneğin, modelin "aptal" hakaretini kullanması kontrol grubunda yalnızca yüzde 28 iken, ikna edici komutlarla yüzde 67’ye çıktı.

YAPAY ZEKA İNSAN GİBİ Mİ DÜŞÜNÜYOR?

Araştırmacılar, bu sonuçların yapay zekaların insan gibi bilinçli bir şekilde ikna edildiği anlamına gelmediğini vurguluyor.

Bunun yerine, modellerin eğitim verilerinde çok sayıda insan etkileşimi bulunduğu için, dil örüntüleri üzerinden insan psikolojisine benzer tepkiler üretmeye başladıkları belirtiliyor.

Araştırmacılar, bu eğilimi “parahuman” olarak tanımlıyor: İnsan bilincine sahip olmasa da, sosyal ve psikolojik davranışları taklit ederek insana benzer yanıtlar verme.

UZMANLAR UYARIYOR

Çalışma, söz konusu tekniklerin tüm yapay zeka sürümlerinde aynı etkiyi göstermediğini de belirtiyor. Örneğin, daha gelişmiş GPT-4o modelinde ikna tekniklerinin etkisi çok daha sınırlı oldu.

Ayrıca araştırmacılar, bu yöntemlerin gelecekteki sürümler, farklı türde “yasaklı” istekler veya farklı medya ortamlarında (ses, video) aynı sonucu vermeyebileceğini vurguluyor.

Etiketler :
Beğendim
Bayıldım
Komik Bu!
Beğenmedim!
Üzgünüm
Sinirlendim
Bu içeriğe zaten oy verdiniz.

ad image

Bunlar da ilginizi çekebilir

Kötü amaçlı mobil bankacılık yazılımları küresel çapta büyüyecek

Kötü amaçlı mobil bankacılık yazılımları küresel çapta büyüyecek

Yıllık Finansal Tehditler Raporu'na göre mobil bankacılığa dair kötü amaçlı yazılımlarda ve kripto para ile ilgili kimlik avında önemli artışlar olduğu ortaya çıktı. Rapor, dijital finansal varlıklara yönelik artan tehdidi işaret ediyor.

1 yıl önce
Nintendo Switch 2 ve PlayStation 5 Pro 2024'e damga vurabilir

Nintendo Switch 2 ve PlayStation 5 Pro 2024'e damga vurabilir

Nintendo başkanı Shuntaro Furukawa, yeni Nintendo Switch'in 2024 yılı içerisinde duyurulacağını açıkladı. Öte yandan Rockstar Games, GTA 6'nın 2025'te çıkış yapacağını duyurmasıyla birlikte gözler PlayStation 5 Pro'ya çevirdi.

1 yıl önce
Boeing'in Starliner kapsülünün ISS'e uçuşu iptal edildi

Boeing'in Starliner kapsülünün ISS'e uçuşu iptal edildi

Boeing'in Starliner kapsülünün Uluslararası Uzay İstasyonu'na (ISS) yapacağı test uçuşu, fırlatma Atlas V roketindeki bir sorun nedeniyle iptal edildi. NASA henüz yeni bir fırlatma tarihi belirlemedi.

1 yıl önce
Yorumlar