Makine öğrenimi için büyük veri gizliliği 100 kat daha ucuza geldi

Rice Üniversitesi bilgisayar bilimcisi Ashumali Shrivastava (solda) ve yüksek lisans öğrencisi Ben Coleman, makine öğrenimi için büyük veritabanlarını kullanırken veya paylaşırken titiz kişisel veri gizliliğini uygulamanın ucuz bir yolunu keşfetti. Kredi: Jeff Fitlow/Rice Üniversitesi

Rice Üniversitesi bilgisayar bilimcileri, teknoloji şirketlerinin makine öğrenimi için büyük veritabanlarını kullanırken veya paylaşırken sıkı bir kişisel veri gizliliği biçimini uygulamalarının ucuz bir yolunu keşfetti.

Rice’da bilgisayar bilimi doçenti olan Anshumali Shrivastava, “Veri gizliliği sağlanabiliyorsa, makine öğreniminin topluma fayda sağlayabileceği birçok durum var” dedi. “Örneğin, büyük tıbbi veya finansal kayıt veritabanlarında kalıpları aramak için makine öğrenimi sistemlerini eğitebilirsek, tıbbi tedavileri iyileştirmek veya ayrımcılık kalıplarını bulmak için büyük bir potansiyel var. Veri gizliliği yöntemleri ölçeklenmiyor çünkü bugün bu esasen imkansız. “

Shrivastava ve Rice yüksek lisans öğrencisi Ben Coleman, bu hafta Bilgisayar ve İletişim Güvenliği Derneği’nin yıllık amiral gemisi olan CCS 2021’de sunacakları yeni bir yöntemle bunu değiştirmeyi umuyor. Shirvastava ve Coleman, yerelliğe duyarlı karma adı verilen bir teknik kullanarak, çok büyük bir hassas kayıt veritabanının küçük bir özetini oluşturabileceklerini keşfettiler. RACE olarak adlandırılan yöntemleri, adını bu özetlerden veya “tekrarlanan sayı tahmin edicileri dizisi” eskizlerinden alır.

Coleman, RACE eskizlerinin hem kamuya açık hale getirilmesinin güvenli olduğunu hem de makine öğreniminin temel yapı taşlarından biri olan çekirdek toplamlarını kullanan algoritmalar için ve sınıflandırma, sıralama ve regresyon analizi gibi ortak görevleri gerçekleştiren makine öğrenimi programları için yararlı olduğunu söyledi. RACE’in şirketlerin hem büyük ölçekli, dağıtılmış makine öğreniminin avantajlarından yararlanmalarına hem de farklı gizlilik adı verilen sıkı bir veri gizliliği biçimini desteklemelerine izin verebileceğini söyledi.

Birden fazla teknoloji devi tarafından kullanılan diferansiyel gizlilik, bireysel bilgileri gizlemek için rastgele gürültü ekleme fikrine dayanmaktadır.

Coleman, “Bugün farklı gizlilik standartlarını karşılamak için zarif ve güçlü teknikler var, ancak hiçbiri ölçeklenmiyor” dedi. “Veriler daha boyutlu hale geldikçe, hesaplama yükü ve bellek gereksinimleri katlanarak büyüyor.”

Veriler giderek daha yüksek boyutlu hale geliyor, yani hem birçok gözlem hem de her bir gözlemle ilgili birçok bireysel özellik içeriyor.

Yüksek boyutlu veriler için RACE eskiz ölçekleri, dedi. Eskizler küçüktür ve bunları oluşturmak için hesaplama ve bellek gereksinimlerinin dağıtılması da kolaydır.

Shrivastava, “Bugün mühendisler, çekirdek toplamlarını kullanmak istiyorlarsa, ya bütçelerini ya da kullanıcılarının mahremiyetini feda etmelidir.” Dedi. “RACE, yüksek boyutlu bilgileri farklı mahremiyetle serbest bırakmanın ekonomisini değiştiriyor. Basit, hızlı ve mevcut yöntemlerden 100 kat daha az maliyetli.”

Bu, makine öğrenimini ve veri bilimini daha hızlı ve daha ölçeklenebilir hale getirmek için çok sayıda algoritmik strateji geliştiren Shrivasta ve öğrencilerinin en son yeniliğidir. Onlar ve işbirlikçileri: sosyal medya şirketlerinin yanlış bilgilerin çevrimiçi yayılmasını engellemesi için daha etkili bir yol buldular, “aşırı sınıflandırma” sorunları için büyük ölçekli derin öğrenme sistemlerinin nasıl 10 kata kadar daha hızlı eğitileceğini keşfettiler, daha doğru bir şekilde için bir yol buldular. ve Suriye iç savaşında öldürülen tespit edilen kurbanların sayısını verimli bir şekilde tahmin ederek, derin sinir ağlarını genel amaçlı CPU’larda (merkezi işlem birimleri) GPU’lardan (grafik işlem birimleri) 15 kata kadar daha hızlı eğitmenin mümkün olduğunu gösterdi ve miktarı azalttı. büyük metagenomik veritabanlarını aramak için gereken süre.


Kullanıcıların gizliliğini korurken finansal metinleri sınıflandırmak için bir model


Daha fazla bilgi:
Benjamin Coleman ve diğerleri, Çoğu Makine Öğrenimi Görevi için Tek Geçişli Özel Eskiz, arXiv:2006.09352 [cs.DS], arxiv.org/abs/2006.09352

Rice Üniversitesi tarafından sağlanan

Alıntı: Makine öğrenimi için büyük veri gizliliği 100 kat daha ucuza geldi (2021, 16 Kasım) 19 Kasım 2021’de https://techxplore.com/news/2021-11-big-privacy-machine-cheaper.html adresinden alındı

Bu belge telif haklarına tabidir. Özel çalışma veya araştırma amaçlı herhangi bir adil işlem dışında, yazılı izin alınmadan hiçbir bölüm çoğaltılamaz. İçerik yalnızca bilgi amaçlı sağlanmıştır.





#Makine #öğrenimi #için #büyük #veri #gizliliği #kat #daha #ucuza #geldi