DiCarlo Laboratuvarı; tekrarlayan bir mimarinin, hem yapay zekanın hem de beynimizin nesneleri daha iyi tanıması için yardımcı olduğunu keşfetti.
Beynimizin nesneleri tanıma yeteneği oldukça dikkat çekicidir. Normalinde fazla bir ışık altında veya beklenmedik yönlerden bakılan bir fincan gördüğünde beyin; hassas hesaplamalar yaparak fincanın fincan olduğunu algılar. Bu hassas nesne tanıma, kendi kendini süren otomobil navigasyonunu geliştirenler gibi yapay zeka geliştiricileri için neredeyse ‘kutsal bir kâse’dir.
Görsel kortekste primatlar; nesne tanıma modellemesi yapay görsel tanıma sistemlerinde devrim yaratırken; mevcut derin öğrenme sistemleri sadeleştirilmiş olsa da; insanlar gibi bazı nesnelerin tanınmasında başarısız olmuştur.
Nature Neuroscience‘da yayınlanan bulgularda, McGovern Enstitüsü Araştırmacısı James DiCarlo ve arkadaşları; geri bildirimin primat beynindeki tanınması zor nesnelerin tanınmasını geliştirdiğine ve geri bildirim devresi eklemenin de, görme için kullanılan yapay sinir ağı sistemlerinin performansını artırdığına dair kanıtlar buldu.
Derin Evrimsel Sinir Ağları (DCNN) şu anda hızlı bir zaman ölçeğindeki (100 milisaniyeden daha az) nesneleri doğru bir şekilde tanımak için, en başarılı modellerdir. Kademeli olarak ventral görsel akıştan ilham alan genel bir mimariye sahiptir. Aşamalı olarak erişilebilir ve rafine edilmiş bir temsil inşa eden kortikal bölgeler görüntülenen nesnelerin; primer ventral akıma kıyasla basittir.
MIT Beyin ve Bilişsel Bilimler Bölümü ve Beyin, Zihin ve Makineler Merkezi (CBMM) Araştırmacısı DiCarlo: “Uzun süre boyunca, model tabanlı bir anlayıştan uzaktık. Bu yüzden, alanımız bu arayışa görsel tanımanın besleyici bir süreç olarak modellenmesiyle başlamıştır. Ancak; beyin tanıma ile bağlantılı beyin bölgelerinde tekrarlayan anatomik bağlantılar olduğunu biliyoruz.”
İleri beslemeli DCNN’leri ve görsel sistemin ilk olarak bir dizi istasyondan geçen, bir metro hattına benzer nesneleri yakalamaya çalışan bir kısmı gibidir. Ekstra, tekrarlayan beyin ağları bunun yerine sokaklar gibi, birbirine bağlı ve tek yönlü değil. Beynin bir nesneyi oldukça doğru bir şekilde tanıması sadece 200 ms sürdüğü için; beyindeki bu tekrarlayan bağlantıların, çekirdek nesne tanımada bir rolü olup olmadığı açık değildi. Belki de bu tekrarlayan bağlantılar yalnızca görsel sistemi uzun bir süre boyunca uyum içinde tutmak için yerindedir. DiCarlo ve CBMM Araştırmacı Kohitij Kar ile birlikte, hızlı görsel nesne tanımada tekrarlayan işlemlerin ince bir rolünün gözden kaçırılıp kaçırılmadığını test etmek için çalışmaya başladılar.
Zorlu Tanıma
Araştırmacılar; ilk önce primat beyin tarafından önemsiz bir şekilde çözülen nesneleri tanımlamaya ihtiyaç duyuyordu. Ancak yapay sistemler için bu zorludur. Yazarlar; derin öğrenmenin neden bir nesneyi tanımakta sorun yaşadığını tahmin etmek yerine (Görüntüdeki karışıklık mı? Yanıltıcı bir gölge mi?) eleştirel olduğu düşünülen tarafsız bir yaklaşım benimsemiştir.
Kar: “AI modellerinin bir nesnenin tıkandığı veya karışıklıkta olduğu her görüntüyle ilgili aslında sorun yaşamadığını fark ettik.”
Bunun yerine, araştırmacılar; derin öğrenme sistemini, maymunları ve insanları, primatların bu görüntülerdeki nesneleri kolayca tanıyabildiği, ancak ileriye dönük bir DCNN’nin sorunlara değindiği “challange images” üzerine hologramlı görüntüler sundu. Araştırmacılar; bu DCNN’lere uygun tekrarlayan işlemleri eklediklerinde, “challange images” nesne tanıma bir anda çok kolay hale geldi.
İşlem Süreleri
Kar, bu görüntülerin primatlar açısından çok önemsiz olup olmadığını belirlemek için çok yüksek uzaysal ve zamansal hassasiyetli nöral kayıt yöntemlerini kullandı. Dikkat çekici bir şekilde, “challange images” başlangıçta insan beynine çocuk oyuncağı gibi görünmekle birlikte, aslında tekrarlayan döngülerin beynimizde de çalıştığını öne süren, ekstra sinirsel işlem süresi (yaklaşık 30 ms) içerdiğini bulmuşlardır.
Psikoloji Profesörü ve Beckman Enstitüsü Akıllı Sistemler Teması Eş Başkanı Diane Beck: “Tamamen ileriye doğru beslenen derin ağlar; primat beyin aktivitesini tahmin etmede son derece iyi olduğundan, primat beyindeki geri besleme bağlantılarının rolü hakkında sorular ortaya attı. Bu çalışma; geribildirim bağlantılarının büyük olasılıkla nesne tanımada rol oynadığını gösteriyor. ”
Otonom bir araba için bu ne anlama geliyor? Nesne tanımada yer alan derin öğrenme mimarilerinin; primat beyniyle eşleşmeleri durumunda tekrarlayan bileşenlere ihtiyaç duyduğunu gösterir. Aynı zamanda gelecek nesil akıllı makineler için bu prosedürün nasıl operasyonel hale getirileceğini gösterir.
Kar: “Tekrarlayan modeller sinirsel aktivite ve zaman içindeki davranış tahminlerini sunuyor. Artık daha fazla ilgili görevleri modelleyebiliriz. Belki bir gün, sistemler yalnızca bir kişi gibi bir nesneyi tanımayacak, aynı zamanda insan beyninin diğer insanların duygularını anlama gibi kolayca yönetebileceği bilişsel görevleri de yerine getirebilecek.. ”