Awal minggu lalu, Microsoft menghapus basis data lebih dari 10 juta wajah, yang dimaksudkan sebagai dataset untuk menguji dan melatih algoritma pengenalan wajah mereka. hal tersebut mereka lakukan setelah adanya laporan oleh Financial Times. Database tersebut dikenal sebagai MS Celeb, yang berisi berisi lebih dari 10 juta foto dari sekitar 100.000 orang, sebagian besar diambil dari sumber online yang tersedia untuk umum. Meskipun tidak sulit untuk menemukan foto individu dalam dataset, volume foto dan data terstruktur yang menyertainya membuat dataset tersebut sangat berguna dalam program pelatihan untuk mengenali wajah seseorang di berbagai foto.
Penghapusan dataset tersebut terjadi setelah penyelidikan Financial Times yang sebelumnya menemukan bahwa banyak orang yang diwakili dalam dataset tidak menyadarinya dan tidak setuju foto mereka digunakan. Sejumlah ahli berspekulasi bahwa dataset mungkin menghadapi masalah hukum di bawah Peraturan Perlindungan Data Umum (GDPR) yang memaksakan persyaratan signifikan untuk penyimpanan dan transfer data pribadi subjek.
Khususnya, Microsoft tidak mengumumkan penghapusan dataset dan menganggap remeh signifikansinya dalam komentar kepada FT. Menurut mereka Situs itu dimaksudkan untuk tujuan akademik DAN dijalankan oleh karyawan yang tidak lagi menggunakan Microsoft dan sejak itu dihapus. Dua dataset serupa yang dijalankan oleh Duke University dan Stanford juga diturunkan setelah pelaporan FT.
Sumber: The Verge
Sumber Foto: The Guardian