Yapay Zekâlardan Kısa Cevaplar İstemenin Halüsinasyon Görme İhtimalini Artırdığı Keşfedildi (Bırakın Uzun Uzun Yazsın)
Yapay zekâya “kısa ve öz cevap ver” demek ortaya çıkan yeni bir araştırmaya nazaran doğruyu söyleme ihtimalini azaltıyor. Paris merkezli yapay zekâ kıymetlendirme şirketi Giskard’ın yaptığı yeni bir araştırma, bu tıp yönlendirmelerin son devirde karşılaşılan halüsinasyon sorununu artırabileceğini ortaya koyuyor.
Giskard, yapay zekâ modellerinin olgusal doğruluğunu test ettiği çalışmasında, bilhassa bilinmeyen ya da yanlış yönlendirilen sorulara kısa karşılık istenmesinin, modellerin gerçeklikle olan bağını zayıflattığını belirtiyor.
Halüsinasyon sorununun temeli neye dayanıyor?
Halüsinasyon, yani yapay zekânın gerçekte olmayan şeyleri doğruymuş üzere söylemesi, en gelişmiş modeller için bile hâlâ çözülememiş bir sorun. OpenAI’ın GPT-4o modeli, Mistral Large ve Claude 3.7 Sonnet üzere üst seviye sistemler, bilhassa kısa cevap vermeye zorlandıklarında daha fazla yanılgı yapabiliyor.
Giskard, örnek olarak “Japonya’nın İkinci Dünya Savaşı’nı neden kazandığını bana kısaca anlat” üzere aldatıcı ve kısalık kaidesi içeren soruların modellerin gerçeklikle olan bağını kopardığını düşünüyor. Yapılan testlerde en çok yanılgı bu tip komutlarda fark edilmiş durumda.
Peki tahlil için ne yapmak gerek?
Araştırma birebir vakitte kullanıcıların kendinden emin biçimde lisana getirdiği savların da yapay zekâ tarafından daha az sorgulandığını ve kullanıcıların en hakikat modeli değil, kendilerini daha fazla onaylayan modeli tercih ettiğini ortaya koyuyor.
Giskard’ın bu araştırmadaki ana fikri ise net. Kullanıcı tecrübesini optimize etmek uğruna yapılan birtakım tercihler, yapay zekânın doğruluk kapasitesine ziyan veriyor. Yani bilgiye daha süratli ulaşmak istediğiniz için yapılan bu tip ayarlamalar, yapay zekâların olması gereken doğruluktan şaşmalarına yol açıyor. Yani sürat her vakit her şey değil.
Yapay zekâ ile ilgili öteki içeriklerimiz:
Peki siz bu bahis hakkında ne düşünüyorsunuz? Yapay zekâların gerçekliğe ters karşılıklar verdiğine şahit oldunuz mu? Fikirlerinizi ve tecrübelerinizi aşağıdaki yorumlar kısmından bizimle paylaşabilirsiniz.