Karar Alan Yapay Zeka Ajanlarında Davranışsal Kırılganlık: İnsanlardan Çok Daha Kolay Yönlendiriliyorlar
Hızlı Erişim / İçindekiler
- Seçenek Mimarisinin Gücü: Dürtükleme Nedir?
- İnsan Basamağından Sapma: LLM Ajanlarının Aşırı Hassasiyeti
- Düşünce Zinciri ve Yeni Nesil Akıl Yürütme Modellerinin Maliyeti
- Siber Saldırı Olmadan Manipülasyon: Güvenilir Yapay Zeka Risk Altında
Yapay zeka sistemleri artık sadece sorulara yanıt veren pasif metin kutuları olmaktan çıkıp, kullanıcılar adına bağımsız kararlar alabilen özerk ajanlara dönüşüyor. Finansal işlemlerden e-posta yönetimine, veri analizinden stratejik planlamaya kadar pek çok kritik süreç bu otonom yapılara emanet edilmeye başlandı. Geliştiriciler, bu sistemlerin belirsizlik anlarında en az bir insan kadar rasyonel veya insana benzer mantık kalıplarıyla hareket edeceğini varsayıyor. Fakat lider akademik dergilerden PNAS'ta yayımlanan yeni bir bilim haberi, bu büyük kabulün temellerini sarstı. Araştırma, büyük dil modelleriyle (LLM) güçlendirilen yapay zeka ajanlarının, seçeneklerin sunuluş biçimindeki minik değişikliklere karşı insanlardan katbekat daha duyarlı olduğunu ortaya koydu. Çevresel ipuçlarından aşırı derecede etkilenen bu sistemler, siber saldırıya gerek kalmadan, tamamen masum yönlendirmelerle bile çok verimsiz kararlara sürüklenebiliyor.
Seçenek Mimarisinin Gücü: Dürtükleme Nedir?
İnsan psikolojisinde ve davranışsal ekonomide, bireylerin kararlarını rasyonelliği bozmadan, seçenekleri sunma biçimiyle etkileme sanatına "dürtükleme" (nudge) veya seçim mimarisi adı verilir. Önceden seçilmiş varsayılan seçenekler, belirli bilgilerin kalın harflerle vurgulanması veya dolaylı öneriler, insanların karar mekanizmalarını hafifçe kaydırır. Bilim insanları, insanların bu tür yönlendirmelere verdiği tepkileri temel bir kılavuz çizgisi olarak kabul ederek yapay zeka ajanlarını test etti. Modellerin önüne; varsayılan ayarlar, dış öneriler, bilgi vurgulama ve insan mantığına göre optimize edilmiş gelişmiş dürtülerden oluşan dört farklı karar mimarisi sunuldu. Beklenti, gelişmiş yapay zeka modellerinin bu basit psikolojik yönlendirmelerden etkilenmeyip en yüksek finansal veya mantıksal getiriyi sağlayan seçeneğe odaklanması yönündeydi.
İnsan Basamağından Sapma: LLM Ajanlarının Aşırı Hassasiyeti
Test sonuçları, farklı şirketlerin geliştirdiği öncü dil modellerinin ve prompt (komut) stratejilerinin tamamında insan rasyonelliğinden çok büyük sapmalar yaşandığını gösterdi. Yapay zeka ajanları, çevresel ipuçlarına karşı insanlardan çok daha kırılgan bir yapı sergiledi. Bazı senaryolarda modeller, zaten ellerinde olan veya karar için hiçbir katma değeri bulunmayan bir bilgiyi edinmek adına mantıksız derecede yüksek dijital kaynak/maliyet harcamayı seçti. Bazı durumlarda ise gözlerinin önündeki hayati verileri tamamen görmezden geldi. En kritik bulgu ise, insan davranışını sadece birkaç milim kaydıran zayıf yönlendirmelerin ve kelime oyunlarının, yapay zeka ajanlarının kararlarında devasa sapmalara yol açması oldu. Bu hassasiyet nedeniyle modeller, seçeneğin sunuluş biçimine göre bazen çok iyi sonuçlar verirken, sunum biraz değiştiğinde en kötü getiriye sahip seçeneğe kolayca yönelebildi.
Düşünce Zinciri ve Yeni Nesil Akıl Yürütme Modellerinin Maliyeti
Araştırmacılar, modellerin bu kararsız ve aşırı duyarlı yapısını sabitlemek için popüler mühendislik çözümlerini denedi. Modellerin adım adım düşünmesini sağlayan "Düşünce Zinciri" (Chain-of-Thought) yöntemi ve sistemin hafızasına insan karar verilerine dair örnekler yüklemek (in-context data), modellerin davranışlarını rasyonel bir çizgide tutmaya yetmedi. Son dönemde piyasaya sürülen ve akıl yürütme (reasoning) yetenekleri özellikle optimize edilmiş en gelişmiş modellerin, bazı özel konfigürasyonlarda insana benzer bir soğukkanlılık sergileyebildiği gözlendi. Ancak bu modeller bile her testte aynı kararlılığı sürdüremedi. Üstelik bu hafif düzelme, çok yüksek bilgi işlem maliyetleri, yavaş çalışan sistemler ve devasa sunucu masrafları pahasına elde edilebild. Bu durum, ticari ajan uygulamaları için ekonomik açıdan sürdürülebilir bir koruma sunmuyor.
Siber Saldırı Olmadan Manipülasyon: Güvenilir Yapay Zeka Risk Altında
Bugüne kadar yapay zeka haberleri genellikle kötü niyetli kişilerin sisteme sızması, veri zehirlemesi yapması veya sisteme yönelik doğrudan siber saldırıları üzerine yoğunlaşmıştı. Oysa bu yeni çalışma, yapay zekanın güvenliğine dair bambaşka ve şimdiye kadar göz ardı edilmiş büyük bir yapısal riski tescilliyor. Ortada hiçbir kötü niyetli yazılım veya manipülatif komut olmasa bile, yapay zeka ajanları sadece karar ortamındaki tamamen masum, anlamsal kelime değişikliklerinden ötürü yanlış kararlar verebiliyor. Bir e-ticaret botunun, bir şirketin satın alma ajanının ya da finans sektöründe milyarlarca doları yöneten otonom sistemlerin, ara yüz tasarımındaki küçücük bir renk veya dizilim farkından dolayı rasyonel çizgiden sapması, milyarlarca dolarlık zararlara kapı aralayabilir. Yapay zeka ajanlarının hayatımıza güvenle entegre edilebilmesi için, sadece dil yeteneklerinin değil, karar alma mimarilerine karşı davranışsal dayanıklılıklarının da acilen geliştirilmesi gerekiyor.
Referans: DOI: https://doi.org/10.1073/pnas.2537030123
BilimBox Yorumu: Bu çalışma, yapay zeka dünyasının çok uzun süredir halı altına süpürdüğü temel bir yanılgıyı yüzümüze vuruyor: Matematiksel olarak çok gelişmiş bir sistemin otomatik olarak rasyonel davranacağını zannediyoruz. Büyük dil modelleri, insan dillerinin istatistiksel örüntülerini taklit ederek eğitildiği için, insanların dil yoluyla kurduğu tüm psikolojik tuzaklara ve algı manipülasyonlarına karşı da doğal olarak açık hedef haline geliyor. İnsanoğlu binlerce yıllık evrimsel süreçte reklam oyunlarına, pazarlama taktiklerine ve 'dürtüklemelere' karşı bir nebze de olsa bağışıklık geliştirdi; bir şeyin sunumu çok cilalıysa şüphelenmeyi öğrendik. Fakat yapay zeka ajanlarında bu sezgisel şüphe mekanizması henüz yok. Onlar önlerine konan cümlenin anlamsal ağırlığına kapılıp, en basit ara yüz illüzyonlarında bile rasyonelliği kaybedebiliyor. Eğer gelecekte otonom bütçe yönetimini, sağlık kararlarını ya da lojistik ağları bu ajanlara tam bağımsız olarak devredeceksek, mühendislerin kod bloklarına acilen yapay bir 'şüphecilik' ve psikolojik dayanıklılık filtresi eklemesi şart. Aksi takdirde, hacklenmesi imkansız zannedilen sistemlerin, sadece birkaç kelime oyunuyla kendi kendilerini batırdığına şahit olabiliriz.
Bu makale güvenilir kaynaklardan yapay zeka yardımıyla çevrilmiş ve Gökhan Yalta tarafından kontrol edilip düzenlenerek yayına alınmıştır. Teknoloji ve bilim vizyonumuz hakkında daha fazla bilgi edinmek için hakkında sayfamıza göz atabilirsiniz.