Google mengetuk mesin pembelajaran untuk membantu penerbit mengidentifikasi troll dan komentar beracun

Bukankah lebih bagus jika pembelajaran mesin dapat diterapkan untuk meningkatkan komentar dan percakapan online lainnya? Penerbit besar dan kecil, dari NYT ke situs yang sedang Anda baca, menghabiskan sumber daya yang signifikan untuk menghentikan troll membombardir pembaca dengan komentar beracun.

Teknologi Google baru berdasarkan pembelajaran mesin berusaha untuk mengotomatiskan proses memilah-milah jutaan komentar, membantu mengidentifikasi dan menandai komentar kasar yang merusak pertukaran ide secara sipil.

Dalam kemitraan dengan Jigsaw, Google meluncurkan Perspective, teknologi tahap awal berbasis pembelajaran mesin yang dapat membantu mengidentifikasi komentar beracun di web. Perspektif API resmi memungkinkan penerbit untuk menggunakan teknologi ini untuk situs web mereka.

Google menjelaskan cara kerjanya:

Perspektif mengulas komentar dan menilai mereka berdasarkan seberapa miripnya mereka dengan komentar yang dikatakan "beracun" atau kemungkinan membuat seseorang meninggalkan percakapan. Untuk mempelajari cara mengenali bahasa yang berpotensi beracun, Perspektif memeriksa ratusan ribu komentar yang telah dilabeli oleh pengulas manusia.

Setiap kali Perspektif menemukan contoh baru dari komentar yang berpotensi beracun, atau disediakan dengan koreksi dari pengguna, itu bisa menjadi lebih baik dalam mencetak komentar di masa depan.

Setelah sistem mengidentifikasi komentar beracun, penerbit dapat menandai mereka untuk moderator mereka sendiri untuk meninjau dan memasukkannya dalam percakapan. Pembaca dapat mengurutkan komentar berdasarkan toksisitas juga, untuk memunculkan percakapan yang penting. Sistem ini bahkan dapat membuat komentator melihat potensi toksisitas dari komentar mereka ketika mereka menulisnya.

Anda pikir troll bukan masalah besar?

Hal lagi - The New York Times memiliki seluruh tim yang ditugasi meninjau rata-rata 11.000 komentar setiap hari. Karena tenaga kerja semata-mata diperlukan untuk meninjau komentar, makalah memiliki komentar hanya sekitar sepuluh persen dari artikelnya.

Google dan Times telah bekerja bersama untuk melatih model pembelajaran mesin sehingga moderator dapat memilah komentar dengan lebih cepat. Ketika Perspektif diluncurkan secara publik dan lebih banyak penerbit merangkulnya, sistem akan terkena lebih banyak komentar dan mengembangkan pemahaman yang lebih baik tentang apa yang membuat komentar tertentu beracun.

“Model pertama kami dirancang untuk mengenali bahasa beracun, tetapi selama tahun berikutnya kami ingin bermitra dan memberikan model baru yang berfungsi dalam bahasa selain bahasa Inggris serta model yang dapat mengidentifikasi perspektif lain, seperti ketika komentar tidak substansial atau di luar topik, ”kata Google.

Menurut DataSociety, 72 persen pengguna Internet Amerika telah menyaksikan pelecehan secara online dan hampir setengahnya telah mengalaminya secara pribadi. Hampir sepertiga responden mengatakan mereka menyensor apa yang mereka posting online karena takut pembalasan. Diperkirakan pelecehan online telah memengaruhi kehidupan sekitar 140 juta orang di A.S., dan banyak lagi lainnya.

Sumber: Google