Teknoloji

Cep Telefonları için Gerçek Zamanlı Dil Çevirisi

Nokia araştırmacılarından; gerçek zamanlı konuşma çevirisi hizmeti...

Çoğu insan, birkaç yabancı dille ya da sadece mimik ve jestlerle yabancı bir ülkede dolaşabilir. Ancak bu her zaman yeterli olmaz. Acil bir durumda, yardım çağırılması gerektiğinde; örneğin arabası bozulan bir turistin hiçbir dil bilmeden müşteri hizmetlerini arayıp, onunla anlaşması için, dil engellerinin üstesinden gelmesi gerekir.

Nokia’daki araştırmacılar; bu sorunu gerçek zamanlı bir konuşma çevirisi hizmeti ile çözdüler. Çözüm; çağrılar sırasında basit ses servislerine entegre edilir ve İngilizce-Rusça gibi belirli bir dil çiftinin seçilmesinden sonra, konuşanlar taraflar arasında çevrilir ve arayanların önce orijinal konuşmayı duymalarını ve ardından çevirilerini dinlemelerini sağlar.

Nokia Araştırmacı, Máté Ákos Tündik: “Pek çok çeviri hizmetinin yalnızca kabul edilen kişiler arasında ve belirli cihazlarda çalışabileceği durumlarda, çözümümüz sesli arama yapabilen herhangi bir cihazla çalışıyor.”

Nokia araştırmacıları; konseptlerini kanıtlamak için, gerçek zamanlı çeviri hizmetlerini doğal olarak birleştirilmiş veya zincirleme iletişim ve Google, Facebook ve Skype gibi Çeviri Üstü Sağlayıcılar (OTT) ile karşılaştırdılar. Bu OTT çözümlerinin birçoğunun sadece birbirlerini tanıyan kişiler arasında kullanılabileceğini buldular ve bunların çoğu da her bir tarafın aynı uygulamayı indirmesini gerektiriyor. Ayrıca OTT çeviri hizmetlerinin; çoğunlukla 4G gerektiren belirli bant genişliği gereksinimlerine sahip olduğunu buldular.

Müşteri hizmetlerinin bu konudaki aciliyetini anlayan araştırmacılar; çözümlerinin gerçek zamanlı olarak herhangi bir uygulama yüklemesi olmadan herhangi bir cihaz ve bant genişliği ile çalışması gerektiğini kabul ettiler.
Bunu başarmak için; Nokia Mobile Speech Translation (NMST) çözümü, kullanıcılar karşı tarafın kendi dillerini konuşmadığını fark ettiklerinde “anında” uygulanır. Bu uygulama da, belirli bir Çift Tonlu Çoklu Frekansın (DTMF) tanınmasıyla etkinleştirilir.

Birçok temel sesli arama, veri erişimini (4G’de kullanıldığı gibi) kısıtlayan Devre Anahtarlamalı (CS) erişim ağını kullandığından, NMST; çeviri hizmetleri için Nokia Veri Merkezine gömülü olan Microsoft Azure Cognitive API’sini kullanır. Veri merkezindeki çeviri servisine erişmek için; ana teknik gereklilik, operatörün mobil ağı ile basit bir sesli arama bağlantısı kurmaktır.

Şekil 1: Çekirdek Ağ seviye mimarisi/IEEEXplore

‘Kaynak’ konuşmasını bir dilden diğerine çevirmek için; Microsoft’un çağrılan konuşma çevirisi dört adımdan geçiyor:

İlk aşama: Normal konuşmalar için eğitilmiş ve optimize edilmiş derin bir sinir ağı kullanarak, konuşmayı metne dönüştüren otomatik konuşma tanımayı içerir.

İkinci aşama: Konuşma aksaklıklarını silerek; çeviri için daha uygun hale getirmek için metni normalleştiren bir teknoloji olan TrueText’i uygular.

Üçüncü aşama: Metin daha sonra sözlü konuşma için geliştirilen modellerle çevrilir.
Son aşama: Metin konuşmaya dönüştürülür ve çevrilen ses arayanlara sağlanır.

Şekil 2: Konuşma çevirisi/IEEEXplore

Başarılı bir “İspat” gösterisinin ardından; hizmet İsveçli bir operatörün şebekesinde pilot olarak uygulandı. Çözümü daha da geliştirmek için; araştırmacılar daha fazla çeviri motorunu bir araya getirerek, Nokia Veri Merkezi’nin kullanıcıların ihtiyaçlarına en iyi şekilde cevap verebilmek için ek çeviri kaynakları almalarını istiyor.

Máté Ákos Tündik: “Bu teknoloji daha da geliştikçe, çok uluslu şirketler için benzer çeviri entegrasyonları kullanılabilir. Bu, farklı ülkelerdeki iş arkadaşlarının birbirleriyle iletişim kurmasına ve işyerline daha fazla ortaklık olanağı sağlayacaktır.”

Kaynak:
IEEE Xplore
Etiketler
1 Oy2 Oy3 Oy4 Oy5 Oy (1 oy verildi, Ortalama: 5 üzerinden 5,00 oy )
Loading...

Benzer Makaleler

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Close