Günlük insan aktivitelerini somutlaştırılmış bir yapay ajan için becerilere dönüştüren bir model

Araştırmacıların makalesinin arkasındaki ana fikir. Sol ve orta panel: Ekip, doğrudan insan etkinliğinin benmerkezci videosundan nesneler için etkinlik bağlamları keşfetti. Belirli bir nesnenin etkinlik bağlamı, ortamdaki diğer nesnelerin kendisini içeren etkinliklere katılma olasılığını yakalamak için “hangi nesnelerin birlikte bulunduğunun” ötesine geçer (yani, “hangi nesneler birlikte eylemi mümkün kılar”) Sağ panel: Takımın yaklaşımı kılavuzluk eder aracıların uyumlu nesneleri (olasılığı yüksek nesneleri) bir araya getirerek etkinlikleri etkinleştirmelerini sağlar.Örneğin, lavaboya bir tava getirmek musluk etkileşimlerinin değerini artırır, ancak masaya getirmenin bir kitapla etkileşimler üzerinde çok az etkisi vardır.Kredi: Nagarajan & Grauman.

Son on yılda, birçok robot ve bilgisayar bilimcisi, insanların yaşadığı alanlarda görevleri tamamlayabilen robotlar geliştirmeye çalışıyor; örneğin, kullanıcıların yemek pişirmelerine, temizlemelerine ve toplamalarına yardımcı olmak. Ev işleri ve diğer manuel görevlerin üstesinden gelmek için robotlar, belirli sıraları izleyerek ortamlarda gezinmeyi ve nesnelerle etkileşimi içeren karmaşık planlama görevlerini çözebilmelidir.

Bu karmaşık planlama görevlerini çözmeye yönelik bazı teknikler umut verici sonuçlar elde etmiş olsa da, çoğu bunlarla başa çıkmak için tam donanımlı değildir. Sonuç olarak, robotlar henüz bu görevleri insan aracılar kadar iyi tamamlayamıyor.

UT Austin ve Facebook AI Research’teki araştırmacılar, yakın zamanda, günlük görevleri tamamlayan insanların ben-merkezli videolarını kullanarak, somutlaşmış ajanların davranışlarını daha etkili bir şekilde şekillendirebilecek yeni bir çerçeve geliştirdiler. ArXiv’de önceden yayınlanan ve Aralık’taki Nöral Bilgi İşleme Sistemleri (NeurIPS) Konferansında sunulmak üzere hazırlanan makaleleri, robotların ev işlerini ve diğer etkileşim-ağır görevleri tamamlamaları için daha verimli bir yaklaşım sunuyor.

Araştırmayı yürüten araştırmacılardan biri olan Tushar Nagarajan TechXplore’a verdiği demeçte, “Bu projenin aşırıya kaçan hedefi, insanları çevreleriyle etkileşime girerek öğrenebilecek, somutlaştırılmış robotik ajanlar oluşturmaktı.” Taklit öğrenme (IL) yaklaşımları, uzmanların toplaması maliyetli ve ekstra donanım gerektiren ideal aracı davranışını kontrol etmesini ve göstermesini gerektirirken, pekiştirici öğrenme (RL) yaklaşımları, ajanlar rastgele eylemler yapmaya başladığından akıllı davranışı öğrenmek için milyonlarca girişim gerektirir. “

Robotik sistemlerin aksine, insanlar yeni bir ortama girerken farklı nesneleri içeren görevleri zahmetsizce tamamlayabilirler. Nagarajan ve meslektaşı Kristen Grauman, böylece, cisimleşmiş ajanların, sadece insanların nasıl davrandığını gözlemleyerek benzer ortamlarda görevleri tamamlamayı öğrenip öğrenemeyeceğini araştırmaya koyuldular.

Araştırmacılar, toplaması genellikle pahalı olan, insanlar tarafından etiketlenmiş video gösterileri kullanarak ajanları eğitmek yerine, yemek pişirmek veya bulaşık yıkamak gibi günlük aktiviteleri gerçekleştiren insanları gösteren benmerkezci (birinci şahıs) video görüntülerinden yararlanmak istediler. Bu videoların toplanması daha kolaydır ve açıklamalı gösterimlerden daha kolay erişilebilir.

Nagarajan, “Çalışmamız, nesne etkileşimlerinin önceliklerini öğrenmek için gerçek dünyada yakalanan serbest biçimli insan tarafından oluşturulan videoyu kullanan ilk çalışmadır.” Dedi. “Yaklaşımımız, çevreleriyle etkileşime giren insanların benmerkezci videosunu, hangi nesnelerin bir araya getirildiklerinde etkinliklere olanak tanıdığını gösteren ‘etkinlik-bağlam’ önceliklerine dönüştürüyor. Örneğin, insanların bulaşıkları yıkamasını izlemek, mutfak eşyaları, bulaşık sabunu ve süngerin lavabodaki musluğu açmadan önce sahip olunması gereken iyi nesneler.”

Bu ‘önceleri’ elde etmek için (örneğin, bir görevi tamamlamadan önce hangi nesnelerin toplanacağı hakkında faydalı bilgiler), Nagarajan ve Grauman tarafından oluşturulan model, insanların belirli faaliyetler sırasında kullanma eğiliminde olduğu nesne çiftleri hakkında istatistikler toplar. Modelleri, bu nesneleri, araştırmacılar tarafından kullanılan büyük veri setinden ego merkezli videolarda doğrudan tespit etti.

Daha sonra model, bir pekiştirmeli öğrenme çerçevesinde ödül olarak edindiği öncelikleri kodladı. Esasen bu, bir aracının belirli bir görevi tamamlamak için seçtiği nesnelere göre ödüllendirildiği anlamına gelir.







Kredi bilgileri: utexas.edu

Nagarajan, “Örneğin, musluğu açmak, lavabonun yanına bir tava getirildiğinde yüksek bir ödül (ve diyelim ki yanına bir kitap getirildiğinde düşük bir ödül) veriliyor” dedi. “Sonuç olarak, bir aracı, ödüllerini en üst düzeye çıkarmak için nesnelerle etkileşime girmeden önce doğru nesneler kümesini akıllıca doğru konumlara getirmelidir. Bu, öğrenmeyi hızlandıran etkinliklere yol açan durumlara ulaşmalarına yardımcı olur.”

Önceki çalışmalar, benzer ödül işlevlerini kullanarak robot politikası öğrenimini hızlandırmaya çalışmıştı. Bununla birlikte, tipik olarak bunlar, aracıları özellikle tamamlamayı öğrendikleri insan görevlerini dikkate almadan yeni yerleri keşfetmeye veya yeni etkileşimler gerçekleştirmeye teşvik eden keşif ödülleridir.

Nagarajan, “Formülasyonumuz, ödülleri insan faaliyetleriyle hizalayarak, ajanların daha alakalı nesne etkileşimlerini keşfetmesine yardımcı olarak bu önceki yaklaşımları geliştiriyor.” Dedi. “Çalışmamız, belirli hedeflere bağlı videodan (davranış klonlamada olduğu gibi) ziyade serbest biçimli videodan nesne etkileşimleri hakkındaki öncelikleri öğrenmesi bakımından da benzersizdir. Sonuç, verimli RL’yi teşvik etmek için genel amaçlı bir yardımcı ödüldür.”

Daha önce geliştirilmiş yaklaşımlar tarafından ele alınan önceliklerin aksine, araştırmacının modeli tarafından dikkate alınan öncelikler, nesnelerin yalnızca fiziksel birlikte oluşlarından ziyade (örn. bıçakların yakınında bulunabilir) veya anlamsal benzerlik (örneğin, patates ve domates benzer nesnelerdir).

Araştırmacılar, mutfakta günlük işleri ve görevleri yerine getirirken insanları gösteren ben merkezli videolardan oluşan bir veri seti kullanarak modellerini değerlendirdi. Elde ettikleri sonuçlar umut vericiydi ve modellerinin daha önce geliştirilmiş diğer tekniklerden daha etkili bir şekilde ev robotlarını eğitmek için kullanılabileceğini düşündürdü.

Nagarajan, “Çalışmamız, günlük aktiviteleri gerçekleştiren insanların pasif videolarının somutlaştırılmış etkileşim politikalarını öğrenmek için kullanılabileceğini gösteren ilk çalışmadır.” Dedi. “Bu önemli bir başarı, çünkü benmerkezci video, son veri kümelerinden büyük miktarlarda kolayca elde edilebiliyor. Çalışmamız, insanların faaliyetleri nasıl gerçekleştirdiğini öğrenebilen (maliyetli gösterimlere ihtiyaç duymadan) ve daha sonra yardım sunabilen uygulamaları etkinleştirmeye yönelik ilk adımdır. ev robotu ayarı.”

Gelecekte, bu araştırmacılar ekibi tarafından geliştirilen yeni çerçeve, çeşitli basit günlük görevleri tamamlamak için çeşitli fiziksel robotları eğitmek için kullanılabilir. Ek olarak, örneğin bir insanın belirli bir yemeği nasıl pişirdiğini gözlemleyebilen ve ardından yeni kullanıcılara onu hazırlamayı öğretebilen artırılmış gerçeklik (AR) asistanlarını eğitmek ve artırmak için kullanılabilir.

Nagarajan, “Araştırmamız, faaliyetlere dahil olan nesneler hakkında basit ama güçlü öncelikleri yakaladığı için insanları izleyerek öğrenmeye yönelik önemli bir adımdır.” “Ancak, öğrenilecek başka anlamlı şeyler de var, örneğin: Çevrenin hangi bölümleri etkinlikleri destekliyor (sahne sağlamaları)? Bunları kullanmak için nesneler nasıl manipüle edilmeli veya kavranmalı? Öğrenilebilecek ve öğrenilebilecek önemli eylem dizileri (rutinler) var mı? Son olarak, simüle edilmiş ortamlarda öğrenilen politikaların nasıl alınacağı ve gerçek dünyada insanlarla işbirliği yapabilen ajanlar oluşturmak için mobil robot platformlarına veya AR gözlüklerine nasıl yerleştirileceği, izlenecek önemli bir gelecek araştırma yönüdür.”


Belirli görevleri tamamlama konusunda insanlara ve robotlara ne kadar güvenilebileceğini tahmin eden bir model


Daha fazla bilgi:
Tushar Nagarajan, Kristen Grauman, Shaping, benmerkezci videodan etkinlik bağlamı öncelikleri ile somutlaştırılmış ajan davranışını. arXiv:2110.07692v1 [cs.CV], arxiv.org/abs/2110.07692

vision.cs.utexas.edu/projects/ego-rewards/

© 2021 Bilim X Ağı

Alıntı: 20 Kasım 2021’de https://techxplore.com/news/2021-11-everyday-human-skills-embodied-artificial adresinden alınan, günlük insan faaliyetlerini somutlaştırılmış bir yapay ajan (2021, 3 Kasım) için becerilere dönüştüren bir model. html

Bu belge telif haklarına tabidir. Özel çalışma veya araştırma amaçlı herhangi bir adil işlem dışında, yazılı izin alınmadan hiçbir bölüm çoğaltılamaz. İçerik yalnızca bilgi amaçlı sağlanmıştır.





#Günlük #insan #aktivitelerini #somutlaştırılmış #bir #yapay #ajan #için #becerilere #dönüştüren #bir #model