Otomatik konuşma tanımayı kullanarak yerli dilleri kurtarma yarışı

Kuzeydoğu klinik eğitmeni Michael Running Wolf tarafından yazılmış Kwak’wala metninin fotoğraflı illüstrasyonu. Kredi: Alyssa Stone/Kuzeydoğu Üniversitesi

Michael Running Wolf, lisede kullandığı ve teknolojiye olan ilgisinin artmasına yardımcı olan eski TI-89 grafik hesap makinesine sahip.

Northeastern Üniversitesi’nde bilgisayar bilimi klinik eğitmeni olan Running Wolf, “O zamanlar öğretmenlerim bununla gerçekten ilgilendiğimi gördü” diyor. “Aslında birkaçı benim için nasıl kodlanacağına dair yüzlerce sayfalık talimat yazdırdı”, böylece oyun oynayabilsin.

Montana, Birney’de uzak bir Cheyenne köyünde büyüyen Running Wolf’un o sırada, gaz lambasının ışığında evde çıktı yığınını incelerken fark etmediği şey, aslında kendi kendine temel programlamayı öğrettiğiydi.

“Bilgisayar oyunlarını hesap makineme nasıl koyacağımı öğrendiğimi sanıyordum,” diyor Running Wolf gülerek.

Ama teknolojiyle ilk karşılaşması değildi. Kuzey Cheyenne Kızılderili Koruma Alanı yakınlarındaki rüzgarlı ovalarda büyüyen Running Wolf, ailesinin – kısmen Cheyenne, kısmen Lakota – günlük olarak akan suya veya elektriğe erişimi olmamasına rağmen, bazen rüzgarlar dindiğinde, güç yanıp sönecek ve Atari konsolunu takacak ve kız kardeşleriyle oyun oynayacaktı.

Bu erken deneyimler, Running Wolf’un şu anda Kuzey ve Güney Amerika’da nesli tükenme tehlikesiyle karşı karşıya olan yerli dilleri yeniden uyandırmaya yardımcı olmak için kullandığı bilgisayarlara, yapay zekaya ve yazılım mühendisliğine ömür boyu sürecek bir ilgiyi teşvik edecektir. yaşayan anadili konuşanlar tek haneli rakamlara düştü.

Running Wolf’un amacı, bu ilk dilleri otomatik konuşma tanıma yazılımı aracılığıyla belgelemek ve sürdürmek için yöntemler geliştirmek, onları “canlı” ve iyi belgelenmiş halde tutmaya yardımcı olmaktır. Kabile ve yerli toplulukların, dillerin karşı karşıya olduğu tehditler arasında son yıllarda yoğunlaşan kendi dil ıslah çabalarını desteklemek için kullanabilecekleri bir süreç olacağını söylüyor.

Northeastern’ın Vancouver kampüsünde bilgisayar bilimi dersi veren Running Wolf, “Gösterişli plan, uzaklardaki hayal, teknolojiyi yalnızca dilleri korumakla kalmayıp aynı zamanda geri kazanmak için de yaratabilmemizdir” diyor. “Bizim istediğimiz koruma değil. Bu, bir şeyi alıp mumyalayıp müzeye koymak gibi bir şey. Diller canlı varlıklardır.”

Söylenecek en iyi şey, onların “uyumaya gittikleri”dir, diyor Running Wolf.

Ve yerli dillere yönelik tehditler gerçektir. UNESCO Tehlikedeki Diller Atlası’na göre, dünyada konuşulan yaklaşık 6.700 dilin yaklaşık yüzde 40’ı sonsuza dek körelme tehlikesiyle karşı karşıya. Bu dillerin kaybı aynı zamanda bir kültüre özgü tüm bilgi sistemlerinin ve bu bilgiyi nesiller boyunca aktarma yeteneğinin kaybını temsil eder.

Durum korkunç görünse de – ve çoğu durumda öyledir – Running Wolf, neredeyse her Kızılderili kabilesinin dil ıslahı çabalarıyla meşgul olduğunu söylüyor. New England’da, bunu yapan kayda değer bir kabile, ana dili şu anda Cape Cod, Massachusetts’teki devlet okullarında öğretilen Mashpee Wampanoag Kabilesidir.

Ancak sorun, sürekli gelişen hesaplamalı dilbilim alanında, Yerli Amerikan dillerine çok az araştırma yapıldığını söylüyor. Bu kısmen dilbilimsel veri eksikliğinden kaynaklanıyor, ancak aynı zamanda birçok ana dilin “polisentetik” olması, yani dildeki en küçük anlam birimleri olan birçok morfem içeren sözcükleri içermesi nedeniyle, diyor Running Wolf.

Polisentetik diller genellikle çok uzun kelimelere sahiptir – tüm bir cümleyi ifade edebilen veya bir cümlenin anlam değerini ifade edebilen kelimeler.

Pek çok Kızılderili dilinin bir imla veya alfabeye sahip olmaması, bu çabayı daha da karmaşık hale getiriyor, diyor. Running Wolf, dilleri ayakta tutmak için hangi dillerin gerekli olduğu konusunda imlaların hayati olmadığını savunuyor. Birçok yerli dil, sağlam yazılı bir dil yerine güçlü bir sözlü gelenek yoluyla hayatta kaldı.

Ancak, Running Wolf gibi veri tabanları ve transkripsiyon yöntemleri oluşturmak isteyen bilim adamları için, boşlukları doldurmak için yazılı metinler önemlidir. Araştırmacıları yerli diller için otomatik konuşma tanıma geliştirmekten alıkoyan şey, tam olarak onlar için mevcut olan ses ve metinsel verilerin eksikliğidir.

Çeşitli kabilelerden yüzlerce saatlik ses kullanan Running Wolf, bazı ilkel sonuçlar üretmeyi başardı. Şimdiye kadar, kendisi ve ekibinin geliştirdiği otomatik konuşma tanıma yazılımı, veriye sahip oldukları bazı yerel dillerdeki tek, basit kelimeleri tanıyabilir.

Running Wolf, “Şu anda, erken sonuçları göstermeye başlamak için bir ses ve metin topluluğu oluşturuyoruz” diyor.

Daha da önemlisi, “Bence bilimsel olarak sağlam bir yaklaşımımız var” diyor.

Sonunda, Running Wolf, kabilelerin gençlerine bu eski dilleri teknolojik daldırma yoluyla – artırılmış veya sanal gerçeklik gibi şeyler aracılığıyla öğrenmeleri için araçlar sağlamaları için bir yol yaratmayı umduğunu söylüyor.

Bu teknolojilerin bazıları, diğerlerinin yanı sıra bir dilbilimci, bir veri bilimcisi, bir makine öğrenimi mühendisi ve bir zamanlar program yöneticisi olan eşinden oluşan Running Wolf ve ekibi tarafından halihazırda geliştirilmektedir. Running Wolf, devam eden tüm araştırma ve geliştirmelerin çok sayıda kabile topluluğuyla istişare içinde yapıldığını söylüyor.

“Her şey insanlardan geliyor” diyor. “Bizimle çalışmak istiyorlar ve onların bilgi sistemlerine saygı göstermek için elimizden gelenin en iyisini yapıyoruz.”


Dil neslinin tükenmesi, benzersiz tıbbi bilgi kaybını tetikler


Northeastern Üniversitesi tarafından sağlanan

Alıntı: Otomatik konuşma tanımayı kullanarak yerli dilleri kurtarma yarışı (2021, 11 Ekim), 19 Kasım 2021’de https://techxplore.com/news/2021-10-indigenous-languages-automatic-speech-recognition.html adresinden alındı.

Bu belge telif haklarına tabidir. Özel çalışma veya araştırma amaçlı herhangi bir adil işlem dışında, yazılı izin alınmadan hiçbir bölüm çoğaltılamaz. İçerik yalnızca bilgi amaçlı sağlanmıştır.





#Otomatik #konuşma #tanımayı #kullanarak #yerli #dilleri #kurtarma #yarışı