Oyun

AI; Video Oyunu Oynamayı Öğreterek, İnsanları Yenebildi

Yeni bir çalışmada, araştırmacılar; popüler bir 3D çok oyunculu oyunda insan performansına ulaşmak için AI algoritmalarını eğitmenin bir yolunu, ayrıntılı olarak açıkladılar.

Sanal satranç ve solitaire ilk günlerinden bu yana, video oyunlarında yapay zeka geliştirmek için bir alan oluşturmuştur. Makinenin insana karşı kazandığı her zafer; algoritmaların daha akıllı ve verimli olmasına yardımcı oldu. Ancak gerçek dünyadaki sorunların üstesinden gelmek için, (sürüş ve pazarlık dahil karmaşık görevleri otomatikleştirmek gibi) bu algoritmalar tahta oyunlarından daha karmaşık ortamlarda gezinmeli ve ekip çalışmasını öğrenmelidir. AI’ye nasıl çalışacağını ve başarılı olmak için diğer oyuncularla nasıl etkileşime geçeceğini öğretmek, bugüne kadar aşılmaz bir görevdi.

Yeni bir çalışmada, araştırmacılar; popüler bir 3D çok oyunculu oyunda insan performansına ulaşmak için AI algoritmalarını eğitmenin bir yolunu, “Bayrak Yakala” modunda Quake III Arena’nın değiştirilmiş bir versiyonunu ayrıntılı olarak açıkladılar.

Bu oyunun görevi basit olsa da; iki rakip takım bir haritada gezinerek birbirlerinin bayraklarını yakalamak için yarışıyor. Kazanan karmaşık karar vermeyi ve diğer oyuncuların eylemlerini tahmin edip bunlara cevap verebilmeyi gerektiriyor.

Bu şekilde, AI ilk kez; birinci şahıs bir video oyununda insan benzeri becerilere sahip oldu.

Robot Öğrenme Eğrisi

2019’da, diğer çok oyunculu strateji oyunlarında AI araştırmalarında birkaç kilometre taşına ulaşıldı. Beş “bot (AI tarafından kontrol edilen oyuncular) DOTA 2 maçında profesyonel bir e-spor takımını mağlup etti. Profesyonel insan oyuncular da bir StarCraft II maçında AI tarafından yere serildi. Her durumda, bir takviye öğrenme şekli geliştirildi. Uygulanan algoritma; deneme yanılma ve ortam ile etkileşime girme yoluyla öğrenir.

DOTA 2’de insanları yere seren beş bot; insanlardan oyun oynamayı öğrenmedi; sadece kendi klonlarına karşı kibrit oynayarak eğitildiler. Profesyonel oyuncuları yenmelerine izin veren gelişme mevcut algoritmaları ölçeklendirmekten geldi. Bilgisayarın hızı nedeniyle, AI birkaç saniye içinde insanların oynaması için dakikalar hatta saatler süren bir oyun oynayabilir. Bu, araştırmacıların AI’lerini, gerçek zamanlı olarak on ay içinde 45.000 yıllık oyunla eğitmelerine izin verdi.

Tepki gecikmeli ajanlara karşı insan oyuncuların kazanma oranlarını gösteren şekil. Bunlar düşüktür, bu da insanlarla karşılaştırılabilir reaksiyon gecikmelerinde bile; ajanların insan oyunculardan daha iyi performans gösterdiğini gösterir. /DeepMind/TechXplore

 

Tepki gecikmeli ajanlara karşı insan oyuncuların kazanma oranlarını gösteren şekil. Bunlar düşüktür, bu da insanlarla karşılaştırılabilir reaksiyon gecikmelerinde bile ajanların insan oyunculardan daha iyi performans gösterdiğini gösterir. /DeepMind/TechXplore

 

 

 

 

 

 

 

Son çalışmadan “Bayrağı Ele Geçir” botu da sıfırdan öğrenmeye başladı. Fakat aynı klonuna karşı oynamak yerine; 30 puanlık bir kohort* yaratıldı ve kendi iç ödül sinyalleriyle paralel olarak eğitildi. Bu popülasyondaki her bot; daha sonra birlikte oynayacak ve birbirlerinden öğrenecektir.

Araştırmacı Bilim İnsanı David Silver: “AI, insan bilgisinin sınırlarını kaldırmaya ve bilginin kendisini yaratmaya başlıyor.”

İnsanlar için öğrenme hızı; hala en gelişmiş derin güçlendirme öğrenme algoritmalarından çok daha hızlıdır. Hem OpenAI’nin botları hem de DeepMind’ın AlphaStar (StarCraft II’yi oynayan bot), insan performans seviyesine ulaşmadan önce binlerce yıllık bir oyun deneyimi yaşadı. Bu eğitimin milyonlarca dolara mal olduğu tahmin ediliyor. Bununla birlikte; insanları kendi oyunlarında yenebilen yetenekli bir AI, makineleri görme biçimimizi değiştirebilecek heyecan verici bir buluş.

İnsanların ve Makinelerin Geleceği

AI genellikle insan yeteneklerini değiştirmekte veya tamamlamaktadır. Ancak nadiren insanlarla aynı görevi yerine getiren tam teşekküllü bir ekip üyesi olarak tasvir edilmektedir. Bu video oyunu deneyleri makine-insan işbirliğini içerdiğinden, geleceğe bir bakış sunar.

Bayrağı ele geçiren insan oyuncular; botları diğer insanlardan daha işbirlikçi olarak değerlendirdiler. Ancak DOTA2 oyuncuları AI takım arkadaşlarına karışık tepki verdi. Bazıları, kendilerini desteklediklerini ve yanlarında oynamayı öğrendiklerini söyleyerek, oldukça hevesliydi. Profesyonel bir DOTA 2 oyuncusu olan Sheever; botlarla bir araya gelerek yaşadığı deneyimlerden bahsetti: “Gerçekten güzel hissettim; (AI takım arkadaşı) bir noktada benim için hayatını verdi. Bana yardım etmeye çalıştı. Ne yaptığını biliyor.”

Diğerleri daha az hevesliydi. Ancak iletişim herhangi bir ilişkinin temelini oluşturduğundan, insan-makine iletişimini geliştirmek gelecekte çok önemli olacaktır. Araştırmacılar; botlara daha insan dostu davranmak için bazı özellikleri zaten uyarladılar; örneğin botların oyuna başlamadan, ekip taslaklarında karakterlerini seçmeden önce yapay olarak beklemelerini sağlamak ve insanlara baskı yapmaktan kaçındılar.

Şimdi araştırmacıların kafalarında; “AI bizden öğrenmeli mi yoksa kendilerine öğretmeye devam etmeli mi?” gibi sorular var. İnsanları taklit etmeden kendi kendine öğrenme AI’ye daha fazla verimlilik ve yaratıcılık öğretebilir, ancak bu, depolama robotları gibi insan ortaklığını içermeyen görevlere daha uygun algoritmalar oluşturabilir.
Öte yandan, insanlardan eğitilmiş bir makineye sahip olmanın daha sezgisel olacağı söylenebilir. Böyle bir AI kullanan insanlar; bir makinenin neden yaptığını anlayabiliyor. AI daha akıllı hale geldikçe, araştırmacılar daha fazla sürprizle karşı karşıya kalıyorlar.

 

*Cohort/Kohort: Aynı yaştaki insanların içerisinde bulunduğu bir grup insanı tanımlar. Aynı şekilde belli özellikleri aynı (yaş, şehir, cinsiyet, ilgi alanları vb.) insanların bir araya geldiği grupta kohort tipi bir gruptur.

Kaynak:
TechXplore
Etiketler
1 Oy2 Oy3 Oy4 Oy5 Oy (1 oy verildi, Ortalama: 5 üzerinden 5,00 oy )
Loading...

Benzer Makaleler

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgini Çekebilir

Close
Close