Mevcut yapay zeka (AI) sistemlerinin en önemli kısıtlamalarından biri, eğitim almadıkları görevleri yerine getirememeleridir. Yeniden eğitildiklerinde bile, bu sistemlerin çoğunluğu ‘felaketle sonuçlanabilecek unutmalara’ yatkındır. Bu temel olarak, yeni bir öğenin daha önce edinilen bilgileri bozabileceği anlamına gelir.
Örneğin; bir model başlangıçta A görevini tamamlamak için eğitildiyse ve daha sonra B görevinde yeniden eğitilmişse, A görevindeki performansı önemli ölçüde gerileyebilir. Naif bir çözüm, ek görevleri veya eğitilmekte olan öğeleri desteklemek için sonsuz daha fazla sinir katmanı eklemek olacaktır; ancak böyle bir yaklaşım etkili, hatta işlevsel olarak ölçeklendirilemez.
SRI International’daki araştırmacılar, yakın zamanda AI sistemlerine biyolojik bellek transfer mekanizmaları uygulamaya çalıştılar; bunun performanslarını artıracağını ve daha uyumlu hale getirebileceğini düşünmektedirler. arXiv’de yayınlanan çalışmaları; uzun süreli ve kısa süreli hafıza gibi insanlarda hafıza transfer mekanizmalarından ilham almaktadır.
DARPA Yaşam Boyu Öğrenme Makineleri (L2M) projesi araştırmacısı Sek Chai: “Deneyimlerden öğrenebilecek yeni nesil bir AI sistemleri inşa ediyoruz. Bu, deneyimlerini temel alan yeni senaryolara uyum sağlayabilecekleri anlamına gelir. Bugün, AI sistemlerinin başarısız olması, adaptif olmamalarından kaynaklanmaktadır. Dr. Hava Siegelmann liderliğindeki DARPA L2M projesi, AI yeteneklerinde paradigma değişimleri sağlamayı hedefliyor.”
Hafıza transferi: İnsanların gelecekteki olaylar hakkında düşünürken, planlarken, yaratırken veya tahminlerde bulunurken göze çarpan veya ilgili hafızalara kolayca erişmelerini sağlayan karmaşık bir dinamik işlem dizisi gerektirir. Uykunun; hatıraların birleştirilmesinde, özellikle de düş görmenin en sık gerçekleştiği aşama olan REM uykusunda, kritik bir rol oynadığı düşünülür.
Chai ve SRI’daki meslektaşları çalışmalarında; AI sistemlerini gerçek olmayan bir provada eğitmek için kullanılabilecek bir üretici bellek mekanizması geliştirdi. Tekrarlama ve güçlendirme öğrenimini (RL) kullanan bu mekanizma, AI sistemlerinin yaşamları boyunca göze çarpan anılardan ders almasına ve çok sayıda eğitim görevi veya maddesiyle ölçeklendirmesine izin verir. Chai ve meslektaşları tarafından geliştirilen üretken bellek yaklaşımı, gizli alanı ayırmak için bir kodlama yöntemi kullanır. Bu, bir AI sisteminin, görevler iyi tanımlanmadığında veya görev sayısı bilinmediğinde bile öğrenmesini sağlar.
Chai: “AI sistemimiz video, ses vb. ham verileri doğrudan saklamaz. Aksine, daha önce yaşadıklarını üretmek veya hayal etmek için üretici belleği kullanırız. Üretken AI sistemleri; sanat, müzik vb. oluşturmak için kullanıldı. Böyle bir yaklaşım, uzun süreli hafızada güçlendirilen deneyim parçalarını hatırladığımız veya hayal ettiğimiz uyku ve rüyalardaki biyolojik mekanizmalardan ilham alıyor.”
Gelecekte, Chai ve meslektaşları tarafından sunulan yeni üretken bellek yaklaşımı; yapay sinir sistemlerinde yaşam boyu öğrenmeyi mümkün kılan sinirsel ağ tabanlı modellerde felaketle sonuçlanan unutmayı ele almaya yardımcı olabilir. Araştırmacılar şimdi yaklaşımlarını, AI sistemlerini eğitmek ve değerlendirmek için yaygın olarak kullanılan bilgisayar tabanlı strateji oyunları üzerinde test ediyorlar.
Chai: “AI ajanlarımızı adaptasyon, sağlamlık ve güvenlik gibi yaşam boyu öğrenme ölçümleri konusunda eğitmek ve incelemek için StarCraft2 gibi gerçek zamanlı strateji oyunlarını kullanıyoruz. AI ajanlarımız, oyuna yerleştirilen farklı sürprizlerle eğitiliyor (ör. Arazi ve birim yetenek değişikliği).”