Yeni bir algoritma türü, en son teknolojiye sahip AI’den 10 kat daha hızlı Atari video oyunlarında, problem çözme konusuna usta bir yaklaşım getirdi.

Planlama problemlerini tartışabilecek AI tasarımı; özellikle de ödüllerin hemen belli olmadığı durumlarda, alanın ilerlemesinde en önemli araştırma zorluklarından biridir.

2015’te yapılan bir araştırmada, Google DeepMind AI; Video Pinball gibi Atari video oyunlarını insan seviyesine getirmeyi öğrendi. Ancak oyunun karmaşıklığı nedeniyle 1980’lerin video oyunu Montezuma’s Revenge’deki ilk anahtara giden yolu öğrenemedi.

Avustralya’nın Melbourne kentindeki RMIT Üniversitesinde geliştirilen yeni yöntemde; Montezuma’s Revenge oyununu, hatalardan öğrenilen ve alt hedefleri belirleyen bilgisayarlar, oyunu bitirmek için Google DeepMind’den 10 kat daha hızlı oynadı.

RMIT Profesörü John Thangarajah ve Michael Dann ile işbirliği içinde geliştirilen yöntem; “Havuç-çubuk” güçlendirme öğrenimini, AI’yı meraklı ve çevreyi keşfetmek için ödüllendiren özgün bir motivasyon yaklaşımıyla birleştirir.

RMIT Üniversitesi’nden Doç.Dr Fabio Zambetta: “Gerçekten akıllı AI’nin belirsiz ortamlarda otonom bir şekilde görevleri tamamlamayı öğrenebilmesi gerekiyor. Doğru türdeki algoritmaların; çok güçlü bilgisayarlarda bir problemi baştan sona zorlamak yerine, daha akıllıca bir yaklaşım kullanarak, sonuçları iyileştirebileceğini gösterdik. Sonuçlarımız, otonom AI’ye ne kadar yaklaştığımızı ve bu alanda kayda değer ilerleme sağlamaya devam etmek istiyorsak kilit bir sorgulama hattı olabileceğimizi gösteriyor.”

Zambetta’nın yöntemi; daha büyük bir görevi tamamlama bağlamında, bir bilgisayar için açık olmayan “o merdiveni tırman” veya “o çukurun üzerinden atla” gibi faydalı alt hedefleri özerk bir şekilde araştırmak için sistemi ödüllendiriyor.

En son teknolojiye sahip diğer sistemler, bu alt hedefleri tanımlamak için insan girdisine gereksinim duymuş veya daha sonra rastgele ne yapılacağına karar vermiştir.

Zambetta: “Algoritmalarımız yalnızca Montezuma’s Revenge oynarken ilgili görevleri Google DeepMind’den yaklaşık 10 kat daha hızlı bir şekilde özdeş olarak tanımlamakla kalmadı, aynı zamanda bunu yaparken nispeten insan benzeri davranış sergilediler. Örneğin, oyunun ikinci bölümüne gelmeden önce, merdivenleri tırmanmak, düşmanın üzerinden atlamak ve nihayetinde bir anahtarı almak için alt sıraları sıralamak gerekir. Algoritmamız, bu oyunlarda en son teknolojiye sahip ajanlarla gerçekten rekabet edebilen ilk, tamamen özerk ve alt hedef odaklı ajan olmasını sağlıyor. Sistem, ham görsel girdilerle tedarik edildiğinde, video oyunları dışında çok çeşitli görevlerde çalışır. Video oyunlarını tamamlayabilen bir algoritma oluşturmak önemsiz görünebilir, ancak rastgele bir dizi olası eylem arasından seçim yaparken belirsizlikle başa çıkabilecek bir tasarım yaptık, bu kritik bir gelişmedir. Bu, zaman içinde, kendi kendine sürüş otomobillerde veya doğal dil tanıma konusunda kullanışlı robotik asistanlar olarak, gerçek dünyada hedeflere ulaşmak için değerli olacağı anlamına geliyor.”

 

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

You May Also Like

Zihin Kontrol Oyunlarının Sinirbilimi

2016 sonlarında Boston merkezli yeni başlayan Neurable, sinirbilimci Ramses Alcaide’nin ve Michigan…

Çok Oyunculu Oyun Oynamayı, Eğitsel Bir Deneyime Dönüştürmek

Yeni bir video oyun sistemi; işbirliğini ve problem çözmeyi geliştirirken, birden fazla…

Video Oyunları, Tarihsel Araştırma İçin Ciddi Araçlar Olabilir

Bilgisayar modelleme tekniklerinin olağanüstü sonuçlarından biri; gerçek dünyadaki çeşitli fenomenleri fevkalade ayrıntılı…

EXAG: Makine Açıklamalarının Yararlılığını Değerlendirmek İçin Görüntü Tahmin Etme Oyunu

Son yıllarda, araştırmacılar yapay zeka (AI) ‘yı daha şeffaf hale getirmeye çalışıyor.…