Oyun

Atari Ustası: Yeni AI Video Oyunu Mücadelesinde Google Deepmind’i Çökertiyor

Yeni bir algoritma türü, en son teknolojiye sahip AI'dan 10 kat daha hızlı Atari video oyunlarında, problem çözme konusuna usta bir yaklaşım getirdi.

Yeni bir algoritma türü, en son teknolojiye sahip AI’den 10 kat daha hızlı Atari video oyunlarında, problem çözme konusuna usta bir yaklaşım getirdi.

Planlama problemlerini tartışabilecek AI tasarımı; özellikle de ödüllerin hemen belli olmadığı durumlarda, alanın ilerlemesinde en önemli araştırma zorluklarından biridir.

2015’te yapılan bir araştırmada, Google DeepMind AI; Video Pinball gibi Atari video oyunlarını insan seviyesine getirmeyi öğrendi. Ancak oyunun karmaşıklığı nedeniyle 1980’lerin video oyunu Montezuma’s Revenge’deki ilk anahtara giden yolu öğrenemedi.

Avustralya’nın Melbourne kentindeki RMIT Üniversitesinde geliştirilen yeni yöntemde; Montezuma’s Revenge oyununu, hatalardan öğrenilen ve alt hedefleri belirleyen bilgisayarlar, oyunu bitirmek için Google DeepMind’den 10 kat daha hızlı oynadı.

RMIT Profesörü John Thangarajah ve Michael Dann ile işbirliği içinde geliştirilen yöntem; “Havuç-çubuk” güçlendirme öğrenimini, AI’yı meraklı ve çevreyi keşfetmek için ödüllendiren özgün bir motivasyon yaklaşımıyla birleştirir.

RMIT Üniversitesi’nden Doç.Dr Fabio Zambetta: “Gerçekten akıllı AI’nin belirsiz ortamlarda otonom bir şekilde görevleri tamamlamayı öğrenebilmesi gerekiyor. Doğru türdeki algoritmaların; çok güçlü bilgisayarlarda bir problemi baştan sona zorlamak yerine, daha akıllıca bir yaklaşım kullanarak, sonuçları iyileştirebileceğini gösterdik. Sonuçlarımız, otonom AI’ye ne kadar yaklaştığımızı ve bu alanda kayda değer ilerleme sağlamaya devam etmek istiyorsak kilit bir sorgulama hattı olabileceğimizi gösteriyor.”

Zambetta’nın yöntemi; daha büyük bir görevi tamamlama bağlamında, bir bilgisayar için açık olmayan “o merdiveni tırman” veya “o çukurun üzerinden atla” gibi faydalı alt hedefleri özerk bir şekilde araştırmak için sistemi ödüllendiriyor.

En son teknolojiye sahip diğer sistemler, bu alt hedefleri tanımlamak için insan girdisine gereksinim duymuş veya daha sonra rastgele ne yapılacağına karar vermiştir.

Zambetta: “Algoritmalarımız yalnızca Montezuma’s Revenge oynarken ilgili görevleri Google DeepMind’den yaklaşık 10 kat daha hızlı bir şekilde özdeş olarak tanımlamakla kalmadı, aynı zamanda bunu yaparken nispeten insan benzeri davranış sergilediler. Örneğin, oyunun ikinci bölümüne gelmeden önce, merdivenleri tırmanmak, düşmanın üzerinden atlamak ve nihayetinde bir anahtarı almak için alt sıraları sıralamak gerekir. Algoritmamız, bu oyunlarda en son teknolojiye sahip ajanlarla gerçekten rekabet edebilen ilk, tamamen özerk ve alt hedef odaklı ajan olmasını sağlıyor. Sistem, ham görsel girdilerle tedarik edildiğinde, video oyunları dışında çok çeşitli görevlerde çalışır. Video oyunlarını tamamlayabilen bir algoritma oluşturmak önemsiz görünebilir, ancak rastgele bir dizi olası eylem arasından seçim yaparken belirsizlikle başa çıkabilecek bir tasarım yaptık, bu kritik bir gelişmedir. Bu, zaman içinde, kendi kendine sürüş otomobillerde veya doğal dil tanıma konusunda kullanışlı robotik asistanlar olarak, gerçek dünyada hedeflere ulaşmak için değerli olacağı anlamına geliyor.”

 

Kaynak:
Science DailyTechXploreEurekAlert!World News Buz
Etiketler
1 Oy2 Oy3 Oy4 Oy5 Oy (3 oy verildi, Ortalama: 5 üzerinden 5,00 oy )
Loading...

Benzer Makaleler

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgini Çekebilir

Close
Close