Basit, doğru ve verimli: Bilgisayarların el hareketlerini tanıma şeklini iyileştirme

Çalışmadaki dokuz etkileşimli el hareketinin görüntüleri. Kredi: Zhang ve diğerleri, doi: 10.1117/1.JEI.30.6.063026.

2002’de gişe rekorları kıran bilim kurgu filmi “Azınlık Raporu”nda, Tom Cruise’un karakteri John Anderton, duvar boyutundaki şeffaf bilgisayar ekranıyla arayüz oluşturmak için özel eldivenlerle kaplı ellerini kullanıyor. Bilgisayar, onun büyütme, yakınlaştırma ve kaydırma hareketlerini tanır. Bilgisayar-insan etkileşimi için bu fütürist vizyon şimdi 20 yaşında olmasına rağmen, günümüz insanları hala bir fare, klavye, uzaktan kumanda veya küçük dokunmatik ekran kullanarak bilgisayarlarla arayüz oluşturuyor. Bununla birlikte, araştırmacılar, kullanıcı ve cihaz arasında temas gerektirmeden daha doğal iletişim biçimlerinin kilidini açmak için çok çaba sarf ettiler. Sesli komutlar, modern akıllı telefonlarda ve sanal asistanlarda yolunu bulan, konuşma yoluyla cihazlarla etkileşime girmemizi ve cihazları kontrol etmemizi sağlayan önemli bir örnektir.

El hareketleri, insan-bilgisayar etkileşimleri için benimsenebilecek bir diğer önemli insan iletişim modunu oluşturur. Kamera sistemlerindeki son gelişmeler, görüntü analizi ve makine öğrenimi, optik tabanlı jest tanımayı çoğu bağlamda Anderton tarafından “Azınlık Raporu”nda kullanıldığı gibi giyilebilir sensörlere veya veri eldivenlerine dayanan yaklaşımlardan daha çekici bir seçenek haline getirdi. Bununla birlikte, mevcut yöntemler, yüksek hesaplama karmaşıklığı, düşük hız, zayıf doğruluk veya düşük sayıda tanınabilir hareket dahil olmak üzere çeşitli sınırlamalar tarafından engellenmektedir. Çin’deki Sun Yat-sen Üniversitesi’nden Zhiyi Yu liderliğindeki bir ekip, bu sorunları çözmek için yakın zamanda karmaşıklık, doğruluk ve uygulanabilirlik arasında iyi bir denge sağlayan yeni bir el hareketi tanıma algoritması geliştirdi. Dergide yayınlanan makalelerinde ayrıntılı olarak açıklandığı gibi Elektronik Görüntüleme Dergisi, ekip, temel zorlukların üstesinden gelmek ve tüketici düzeyindeki cihazlarda kolayca uygulanabilecek bir algoritma gerçekleştirmek için yenilikçi stratejiler benimsedi.

Algoritmanın temel özelliklerinden biri farklı el tiplerine uyarlanabilir olmasıdır. Algoritma önce avuç içi genişliği, avuç içi uzunluğu ve parmak uzunluğu arasındaki ilişkileri hesaba katan üç ölçüme dayalı olarak kullanıcının el tipini ince, normal veya geniş olarak sınıflandırmaya çalışır. Bu sınıflandırma başarılı olursa, el hareketi tanıma sürecindeki sonraki adımlar, yalnızca giriş hareketini aynı el tipinde saklanan örneklerle karşılaştırır. “Geleneksel basit algoritmalar, farklı el türleriyle başa çıkamadıkları için düşük tanıma oranlarından muzdarip olma eğilimindedir. Önce giriş hareketini el türüne göre sınıflandırarak ve ardından bu türle eşleşen örnek kitaplıkları kullanarak, neredeyse ihmal edilebilir bir kaynakla genel tanıma oranını iyileştirebiliriz. tüketimi,” diye açıklıyor Yu.

Ekibin yönteminin bir diğer önemli yönü, bir ön tanıma adımını gerçekleştirmek için bir “kısayol özelliğinin” kullanılmasıdır. Tanıma algoritması, olası dokuz hareketten bir giriş hareketini belirleme yeteneğine sahip olsa da, giriş hareketinin tüm özelliklerini, tüm olası hareketler için saklanan örneklerin özellikleriyle karşılaştırmak çok zaman alıcı olacaktır. Bu sorunu çözmek için, ön tanıma adımı, olası dokuz hareketten en olası üç hareketi seçmek için elin alanının bir oranını hesaplar. Bu basit özellik, aday hareketlerin sayısını üçe indirmek için yeterlidir; bunların arasından son harekete “Hu değişmez anları”na dayalı çok daha karmaşık ve yüksek hassasiyetli bir özellik çıkarımı kullanılarak karar verilir. Yu, “Hareket ön tanıma adımı yalnızca gereken hesaplama ve donanım kaynaklarının sayısını azaltmakla kalmıyor, aynı zamanda doğruluktan ödün vermeden tanıma hızını da artırıyor” diyor.

Ekip, algoritmasını hem ticari bir PC işlemcisinde hem de bir USB kamera kullanarak bir FPGA platformunda test etti. Örnek kitaplığı oluşturmak için dokuz el hareketini birden çok kez yapan 40 gönüllü ve sistemin doğruluğunu belirlemek için başka bir 40 gönüllü vardı. Genel olarak, sonuçlar, önerilen yaklaşımın, giriş hareketi görüntüleri döndürülse, çevrilse veya ölçeklense bile, el hareketlerini gerçek zamanlı olarak %93’ü aşan bir doğrulukla tanıyabildiğini gösterdi. Araştırmacılara göre, gelecekteki çalışmalar, zayıf yıldırım koşullarında algoritmanın performansını iyileştirmeye ve olası hareketlerin sayısını artırmaya odaklanacak.

Hareket tanıma, umut verici birçok uygulama alanına sahiptir ve elektronik cihazları kontrol etmenin yeni yollarının önünü açabilir. İnsan-bilgisayar etkileşiminde bir devrim çok yakın olabilir!


WaveGlove: El hareketi tanıma için beş atalet sensörlü bir eldiven


Daha fazla bilgi:
Qiang Zhang ve diğerleri, verimli kenar hesaplama için el tipi uyarlamalı algoritmayı ve etkin alan oranını birleştiren El hareketi tanıma algoritması, Elektronik Görüntüleme Dergisi (2021). DOI: 10.1117 / 1.JEI.30.6.063026

Alıntı: Basit, doğru ve verimli: Bilgisayarların el hareketlerini tanıma biçimini iyileştirme (2021, 28 Aralık), 28 Aralık 2021’de https://techxplore.com/news/2021-12-simple-accurate-effect-gestures.html adresinden alındı.

Bu belge telif haklarına tabidir. Özel çalışma veya araştırma amaçlı herhangi bir adil işlem dışında, yazılı izin alınmadan hiçbir bölüm çoğaltılamaz. İçerik yalnızca bilgi amaçlı sağlanmıştır.





#Bilgisayarların #hareketlerini #tanıma #şeklini #iyileştirme