Akıllı Sistemler

Negatif Veriler Olmadan Makine Öğrenimi

RIKEN Gelişmiş İstihbarat Merkezi Projesi’nden (AIP) bir araştırma ekibi, makine öğrenimi için, bir AI’nın, “negatif veri” olarak bilinen, çeşitli sınıflandırma görevlerine daha geniş uygulama alanı açabilecek bir sınıflandırma yapmasına izin veren yeni bir yöntem geliştirdi.

Günlük hayatlarımızda şeyleri sınıflandırmak önemlidir. Örneğin, spam postaları, sahte politik haberleri ve nesneler veya yüzler gibi daha sıradan şeyleri tespit etmeliyiz. Yapay zeka kullanırken, bu tür görevler, makine öğrenmede sınırlama olan pozitif ve negatif verileri kullanmayı öğrenen “sınıflandırma teknolojisi” ne dayanmaktadır. Örneğin, görünüşte, mutlu bir yüz içeren fotoğraflar “pozitif” ve üzücü bir yüz içeren fotoğraflar da “negatif” veri fotoğrafları olacaktır. Bir sınıflandırma sınırı öğrenildikten sonra, bilgisayar belirli bir verinin pozitif mi yoksa negatif mi olduğunu belirleyebilir. Bu teknoloji ile ilgili zorluk, öğrenme süreci için hem pozitif hem de negatif veriler gerektirmesi ve birçok durumda negatif verilerin mevcut olmamasıdır (Örneğin, çoğu insan bir fotoğraf makinesinin önünde gülümsediği için “bu fotoğraf üzgün bir yüz içerir.” etiketiyle fotoğraf çekmesi zordur.)

Gerçek yaşam programları açısından, bir perakendeci kimin bir satın alma işlemi yapacağını tahmin etmeye çalıştığı zaman, onlardan satın alan müşterilerle ilgili verileri kolayca bulabilir (pozitif veriler) ama rakiplerinin verilerine erişemedikleri için onlardan satın almayan müşteriler hakkında veri elde etmek temelde imkansızdır (negatif veri).  Başka bir örnek, uygulama geliştiricileri için ortak bir görevdir: hangi kullanıcıların uygulamayı kullanmaya devam edeceklerini (pozitif) veya etmeyeceklerini (negatif) tahmin etmeleri gerekir. Ancak, bir kullanıcı aboneliği iptal ettiğinde, geliştiriciler kullanıcının verilerini kaybederler. Çünkü kişisel bilgileri korumak için gizlilik politikasına uygun olarak bu kullanıcıyla ilgili verileri tamamen silmeleri gerekir.

RIKEN AIP’de başyazar Takashi Ishida; “Önceki sınıflandırma yöntemleri, olumsuz verinin bulunmadığı durumlarla başarılı olamadı. Ancak bilgisayarların sadece olumlu verilerle öğrenmesini mümkün kıldık. Olumlu verilerimiz için bir güven puanımız olduğu sürece, satın alma niyeti ya da uygulama, kullanıcılarının aktif oranı gibi bilgilerden oluşturuldu. Yeni yöntemi kullanarak, bilgisayarların bir sınıflandırıcı ile yalnızca güvenle donatılmış olumlu verilerden öğrenmesi sağlayabiliriz.”

Ishida, takım lideri Masashi Sugiyama ve araştırmacı Niu Gang ile birlikte, bilgisayarların pozitif bir sınıfa ait olup olmadığına olasılıkla matematiksel olarak karşılık gelen güven puanını ekleyerek iyi bir şekilde öğrenmelerine izin vermelerini önerdi. Verileri, pozitif ve negatif olarak ayıran, makine öğreniminin sınıflandırma problemlerine karşı, sadece pozitif verilerden ve güvenilirliklerinden (olumlu güvenilirlik) gelen bir sınıflandırma sınırını öğrenmelerini sağlayan bir yöntem geliştirmeyi başardılar.

Sistemin ne kadar iyi çalıştığını görmek için, çeşitli moda öğelerini içeren bir dizi fotoğraf kullandılar. Örneğin, pozitif sınıf olarak “T-shirt” ve negatif sınıf olarak “sandal” gibi farklı öğeler seçtiler. Daha sonra “T-shirt” fotoğraflarına bir güven puanı eklediler. Bazı durumlarda, negatif verilere (ör. “Sandal” fotoğraflar) erişmeden,  bazı durumlarda, yöntemlerinin, olumlu ve olumsuz veriyi içeren bir yöntem kadar iyi olduğunu bulmuşlardır.

Ishida; “Bu keşif, sınıflandırma teknolojisinin kullanılabileceği uygulama aralığını genişletebilir. Makine öğreniminin aktif olarak kullanıldığı alanlarda bile, sınıflandırma teknolojimiz, veri düzenlemeleri veya iş kısıtlamaları nedeniyle sadece olumlu verilerin toplanabileceği yeni durumlarda kullanılabilir. Yakın gelecekte, teknolojimizi doğal dil işleme, bilgisayar görüşü, robotik ve biyoinformatik gibi çeşitli araştırma alanlarında kullanmak istiyoruz…”

Kaynak:
Science Dailyphys.orgEurekAlert!
Etiketler
1 Oy2 Oy3 Oy4 Oy5 Oy (2 oy verildi, Ortalama: 5 üzerinden 4,50 oy )
Loading...

Benzer Makaleler

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Close