Robotik

Nesneleri Keşfedip Tanımlayabilen Yeni AI Sistemi

0

UCLA ve Stanford Üniversitesi mühendisleri, insanların kullandıkları aynı görsel öğrenme yöntemine dayalı olarak gördükleri gerçek dünyadaki nesneleri keşfedip, tanımlayabilen bir bilgisayar sistemi geliştirmiştir.

Sistem, bilgisayarların görsel görüntüleri okumalarını ve tanımlamalarını sağlayan “bilgisayar görüşü” olarak adlandırılan bir teknolojideki ilerlemedir. Sistem; genel yapay zeka sistemlerine doğru önemli bir adım olabilir. Kendi başlarına öğrenen bilgisayarlar, sezgiseldir, akıl yürütmeye dayalı kararlar alır ve insanlarla çok daha insan benzeri bir şekilde etkileşim kurar. Mevcut AI bilgisayarlı görme sistemleri giderek daha güçlü ve yetenekli olmasına rağmen, göreve özgüdür, yani gördüklerini tanımlama yetenekleri, insanlar tarafından ne kadar eğitildikleri ve programladıkları ile sınırlıdır.

Günümüzün en iyi bilgisayar görüş sistemleri bile, sadece belirli kısımlarını gördükten sonra bir nesnenin tam bir görüntüsünü oluşturamaz ve sistemler, bilinmeyen bir ortamda nesneyi görüntüleyerek aldanabilir. Mühendisler bilgisayar sistemlerini bu yeteneklere sahip hale getirmeyi amaçlıyorlar: Tıpkı insanların, bir sandalyenin arkasına saklanan ve sadece pençeleri ve kuyruğu görünen bir hayvanın köpek olduğunu anlaması gibi… İnsanlar, elbette, köpeğin kafasının ve vücudunun geri kalanının nerede olduğunu kolayca belirleyebilirler. Ancak bu yetenek çoğu yapay zeka sistemleri tarafından anlaşılamıyor.

Mevcut bilgisayar görme sistemleri kendi başlarına öğrenmek için tasarlanmamıştır. Tam olarak neyin öğrenilmesi gerektiği konusunda, genellikle tanımlamaya çalıştıkları nesnelerin kendileri için etiketlendiği binlerce görüntü incelenerek, eğitilmelidir. Bilgisayarlar, elbette, bir fotoğraftaki nesnenin neyi temsil ettiğini belirleme mantığını açıklayamaz: AI tabanlı sistemler, insanların yaptıkları gibi içten bir resim ya da öğrenilmiş nesnelerin ortak-anlam modelini oluşturamazlar. Mühendislerin yeni yöntemi, bu eksiklere yol göstermektedir.

Yeni AI sistemi, insanların nesneleri nasıl görselleştirdiğini ve tanımladığını taklit eder
 Sistem, gereksiz arka plan nesnelerini göz ardı eder.

Yaklaşım üç geniş adımdan oluşur: İlk olarak, sistem; bir görüntüyü, araştırmacıların “görüntüleyicileri” olarak adlandırdığı küçük parçalara ayırır. İkincisi, bilgisayar; bu görüntüleyicilerin söz konusu nesneyi oluşturmak için nasıl birbirine uyduğunu öğrenir. Son olarak, çevrede başka hangi nesnelerin bulunduğuna ve bu nesnelerle ilgili bilgilerin, birincil nesneyi tanımlamakla ilgili olup olmadığı incelenir.

Mühendisler, yeni sistemin insanlar gibi daha çok “öğrenmesine” yardımcı olmak için, onu insanların yaşadığı ortamın bir internet kopyası içerisine dahil etmeye karar verdiler.

UCLA Elektrik ve Bilgisayar Mühendisliği Profesörü olan Vwani Roychowdhury: “Neyse ki internet, beyin kaynaklı bilgisayar görme sisteminin insanlarda olduğu gibi öğrenmesine yardımcı olan iki şey sağlıyor. Biri, aynı tür nesneleri tasvir eden bir görüntü ve video zenginliğidir. İkincisi, bu nesnelerin birçok perspektiften (gizlenmiş, kuş gözü, yukarı-yakın) gösterilmesi ve her türlü farklı ortama yerleştirilmeleridir.”

Araştırmacılar, çerçeveyi geliştirmek için bilişsel psikoloji ve nörobilimden yeni kavrayışlar üretti.

Roychowdhury: “Bebeklikten başlayarak, bir şeyin ne olduğunu öğreniyoruz. Bu bağlamsal öğrenme, beyinlerimizin temel bir özelliğidir ve her şeyin işlevsel olarak bağlandığı entegre bir dünya görüşünün parçası olan güçlü nesnel modelleri oluşturmamıza yardımcı olur.”

Yeni AI sistemi, insanların nesneleri nasıl görselleştirdiğini ve tanımladığını taklit eder
Şekildeki renkli noktalar, motosiklet SUVM’mizdeki bazı görüntüleyicilerin merkezlerinin tahmini koordinatlarını göstermektedir. Her bir görüntüleyici temsili, benzer görünüşlere sahip olan bir örnek görünüm/yamanın bir kompozitidir.

Araştırmacılar sistemi, her biri insanları ve diğer nesneleri gösteren yaklaşık 9.000 görüntüyle test ettiler. Platform, dış rehberlik olmadan ve görüntüler etiketlenmeden insan vücudunun ayrıntılı bir modelini oluşturabildi. Mühendisler; motosiklet, araba ve uçak görüntülerini kullanarak, benzer testleri yürüttüler. Her durumda, onların sistemi, uzun yıllar eğitim ile geliştirilmiş olanlardan daha iyi ya da en az geleneksel bilgisayar görme sistemleri kadar iyi performans göstermiştir…

Spread the love

AI Algoritmaları, Depresyonu Teşhis Edebilir

Previous article

Materyallerin Hızlı Keşfi İçin Yeni Megalibrary Yaklaşım

Next article

Comments

Leave a reply

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Login/Sign up