Beberapa karyawan Amazon yang mendengarkan permintaan Alexa memiliki akses ke alamat rumah pengguna

Bloomberg baru-baru ini melaporkan bahwa Amazon memiliki proyek dengan beberapa karyawannya mendengarkan beberapa rekaman audio yang dibuat oleh pembicara Alexa ketika pengguna berinteraksi dengan mereka, tetapi sekarang tampaknya orang-orang itu juga memiliki akses ke alamat rumah pelanggan..

Laporan Bloomberg baru dari pagi ini mengutip lima karyawan anonim di tim Alexa Data Services Amazon sebagai konfirmasi bahwa mereka dapat dengan mudah menemukan alamat rumah pelanggan dengan mengetikkan informasi lintang dan bujur ke dalam perangkat lunak pemetaan seperti Google Maps.

Sementara tidak ada indikasi karyawan Amazon dengan akses ke data telah berusaha melacak pengguna individu, dua anggota tim Alexa menyatakan keprihatinan kepada Bloomberg bahwa Amazon memberikan akses luas yang tidak perlu ke data pelanggan yang akan membuatnya mudah untuk mengidentifikasi pemilik perangkat..

Yah, itu jelas tidak terdengar menjanjikan.

Beberapa pekerja yang ditugasi menganalisis rekaman pelanggan Alexa menggunakan alat Amazon yang menampilkan klip audio bersama data tentang perangkat yang menangkap rekaman itu. Banyak informasi yang disimpan oleh perangkat lunak, termasuk ID perangkat dan nomor identifikasi pelanggan, tidak dapat dengan mudah dihubungkan kembali ke pengguna.

Begitulah seharusnya.

Namun, Amazon juga mengumpulkan data lokasi sehingga Alexa dapat lebih akurat menjawab permintaan, misalnya menyarankan restoran lokal atau memberikan cuaca di Ashland, Oregon, bukannya Ashland, Michigan yang jauh..

Tidak ada yang salah dengan Alexa yang mengumpulkan data lokasi dari pengguna untuk meningkatkan layanannya seandainya bukan karena beberapa karyawannya diizinkan untuk melihatnya di tempat pertama.

Dalam demonstrasi yang dilihat oleh Bloomberg, seorang anggota tim Amazon menempelkan koordinat pengguna, yang disimpan dalam sistem sebagai garis lintang dan bujur, ke Google Maps. Dalam waktu kurang dari satu menit, karyawan itu melompat dari rekaman perintah Alexa seseorang ke apa yang tampak seperti gambar rumah mereka dan alamat yang sesuai..

Yah, itu tentu saja mengganggu tetapi siapa pun dapat mencari lokasi seseorang di Google Maps selama mereka memiliki garis lintang dan bujur, tidak ada yang istimewa dari itu. Yang mengganggu adalah kenyataan bahwa koordinat pengguna tersedia untuk beberapa karyawan Amazon.

Alat internal lain yang mereka gunakan menyimpan lebih banyak data pribadi.

Setelah memasukkan nomor ID pelanggan, para pekerja yang disebut annotator dan verifier - dapat melihat alamat rumah dan kantor serta nomor telepon yang dimasukkan oleh pelanggan ke aplikasi Alexa ketika mereka memasang perangkat, kata karyawan itu. Jika pengguna memilih untuk berbagi kontak dengan Alexa, nama, nomor, dan alamat email mereka juga muncul di dasbor.

Ya, tapi mengapa tunjukkan semua info itu di dasbor?

Data itu ada di sistem sehingga jika pelanggan mengatakan 'Kirim pesan ke Laura,' pengulas manusia dapat memastikan transkrip menulis nama dengan benar sehingga perangkat lunak belajar untuk memasangkan permintaan itu dengan Laura dalam daftar kontak.

Tidak jelas dari laporan berapa banyak karyawan dan kontraktor mungkin memiliki akses ke fitur-fitur ini. Dua karyawan Amazon mengatakan mereka percaya sebagian besar pekerja di kelompok Layanan Data Alexa dapat menggunakan perangkat lunak itu sekitar setahun yang lalu.

Karyawan lain mengatakan bahwa, "hingga baru-baru ini", sistem menampilkan nomor telepon lengkap dengan beberapa angka dikaburkan. "Sampai baru-baru ini," artinya setelah Bloomberg melaporkan ini, benar?

Amazon selanjutnya membatasi akses ke data setelah laporan Bloomberg 10 April, dua karyawan mengatakan. Beberapa rekan data, yang menyalin, membuat catatan, dan memverifikasi rekaman audio, tiba di tempat kerja untuk mengetahui bahwa mereka tidak lagi memiliki akses ke perangkat lunak yang sebelumnya mereka gunakan dalam pekerjaan mereka, kata orang-orang ini.

Pada waktu pers, akses mereka belum dipulihkan.

Yang mengkhawatirkan, laporan asli termasuk pernyataan yang dikaitkan dengan juru bicara Amazon yang menyangkal bahwa orang-orang yang mendengarkan rekaman Alexa memiliki akses ke informasi lain..

Karyawan tidak memiliki akses langsung ke informasi yang dapat mengidentifikasi orang atau akun sebagai bagian dari alur kerja ini. Semua informasi diperlakukan dengan kerahasiaan tinggi dan kami menggunakan otentikasi multi-faktor untuk membatasi akses, enkripsi layanan, dan audit lingkungan kontrol kami untuk melindunginya.

Namun, dalam sebuah pernyataan baru yang menanggapi cerita tersebut, Amazon telah mengubah posisinya dan sekarang menyebut akses ke alat-alat internal "sangat terkontrol":

Akses ke alat-alat internal sangat terkontrol dan hanya diberikan kepada sejumlah kecil karyawan yang memerlukan alat-alat ini untuk melatih dan meningkatkan layanan dengan memproses sampel interaksi yang sangat kecil..

Kebijakan kami melarang keras karyawan mengakses atau menggunakan data pelanggan karena alasan lain dan kami memiliki kebijakan tanpa toleransi untuk penyalahgunaan sistem kami. Kami secara berkala mengaudit akses karyawan ke alat internal dan membatasi akses kapan pun dan di mana pun memungkinkan.

Sebelum kita melompat ke kesimpulan prematur, perlu diulang bahwa ini bukan semacam proyek rahasia-Amazon tidak menyembunyikan fakta bahwa itu membayar orang untuk mendengarkan percakapan pelanggan. Seperti Apple dan perusahaan teknologi lainnya, Amazon menyimpan cuplikan rekaman audio yang dianonimkan di server-servernya untuk jangka waktu tertentu untuk membantu meningkatkan pengenalan suaranya dan AI.

"Kami menggunakan permintaan Anda untuk Alexa untuk melatih pengenalan suara dan sistem pemahaman bahasa alami kami," kata perusahaan itu dalam daftar pertanyaan yang sering diajukan.


Ini adalah fakta kehidupan di dunia teknologi bahwa sistem kecerdasan buatan yang membantu mesin memahami makna di balik kata-kata yang diucapkan harus dilatih secara teratur menggunakan rekaman nyata, yang merupakan satu-satunya cara yang dapat diandalkan untuk meningkatkan akurasi mereka..

Seperti yang dijelaskan juru bicara Amazon kepada Bloomberg:

Kami hanya memberi anotasi sampel rekaman suara Alexa yang sangat kecil untuk meningkatkan pengalaman pelanggan. Informasi ini membantu kami melatih pengenalan suara dan sistem pemahaman bahasa alami kami sehingga Alexa dapat lebih memahami permintaan Anda dan memastikan layanan bekerja dengan baik untuk semua orang.

Apple melakukan hal yang persis sama-Siri memiliki pembantu manusia yang mendengarkan beberapa klip, diikat ke pengidentifikasi acak dan disimpan di server selama enam bulan.

Setelah itu, pengenal acak benar-benar dihapus tetapi data disimpan untuk waktu yang lebih lama untuk meningkatkan pengenalan suara Siri. Ya, Google juga memiliki pengulas yang bertugas mendengarkan beberapa cuplikan Asisten untuk membantu melatih dan meningkatkan layanan. Rekaman Google dilucuti dari setiap informasi pengidentifikasi pribadi dan audio itu sendiri terdistorsi.

Seperti Florian Schaub, seorang profesor di University of Michigan yang telah meneliti masalah privasi terkait dengan speaker pintar, dengan baik mengatakan:

Anda tidak perlu memikirkan manusia lain mendengarkan apa yang Anda katakan kepada pembicara cerdas Anda dalam keintiman rumah Anda. Saya pikir kami telah dikondisikan dengan asumsi bahwa mesin ini hanya melakukan pembelajaran mesin ajaib.

Namun kenyataannya masih ada proses manual yang terlibat.

Apakah itu masalah privasi atau tidak, tergantung pada seberapa hati-hati Amazon dan perusahaan lain dalam jenis informasi apa yang telah mereka anotasi secara manual, dan bagaimana mereka menyajikan informasi itu kepada seseorang..

Untuk konteks, ini kutipan dari cerita aslinya:

Beberapa pengulas Alexa ditugaskan untuk menyalin perintah pengguna, membandingkan rekaman dengan transkrip otomatis Alexa, mengatakan, atau membuat anotasi interaksi antara pengguna dan mesin. Apa yang diminta orang itu? Apakah Alexa memberikan respons yang efektif?

Yang lain mencatat semua yang diangkat pembicara, termasuk percakapan latar belakang - bahkan ketika anak-anak berbicara. Terkadang pendengar mendengar pengguna mendiskusikan detail pribadi seperti nama atau detail bank; dalam kasus seperti itu, mereka seharusnya mencentang kotak dialog yang menunjukkan 'data penting. Mereka kemudian beralih ke file audio berikutnya.

Menurut situs web Amazon, tidak ada audio yang disimpan kecuali Echo mendeteksi kata bangun atau diaktifkan dengan menekan tombol. Tetapi kadang-kadang Alexa tampaknya mulai merekam tanpa prompt sama sekali, dan file audio mulai dengan televisi yang menggelegar atau kebisingan yang tidak dapat dipahami. Apakah aktivasi salah, pengulas diminta untuk menuliskannya. Salah satu orang mengatakan auditor masing-masing menuliskan sebanyak 100 rekaman sehari ketika Alexa tidak menerima perintah bangun atau dipicu oleh kecelakaan..

Pelaporan asli Bloomberg mengklaim bahwa "ribuan karyawan" yang bekerja pada proyek ini kadang-kadang juga harus meninjau klip yang bisa sangat menyusahkan - dan bahkan beberapa yang berpotensi kriminal. Dalam satu kasus yang dilaporkan, dua karyawan Amazon mendengar apa yang mereka pikir sebagai pelecehan seksual tetapi diperintahkan oleh majikan mereka untuk tidak melaporkan kejadian itu karena “bukan pekerjaan Amazon untuk ikut campur.”

Dalam kasus ekstrem seperti itu, sangat banyak tugas Amazon untuk ikut campur.

Mengapa perusahaan tidak mengizinkan karyawan yang mendengarkan rekaman Alexa untuk melaporkan insiden ini ke penegak hukum dan berpotensi menyelamatkan nyawa? Jika seseorang mendobrak masuk ke rumah saya dan menahan saya di bawah todongan senjata, saya ingin siapa pun yang mendengarkan dapat diizinkan untuk melihat alamat rumah saya dan bahkan memperingatkan polisi, jika perlu.

Pikiran?