Apple menyimpan rahasia penelitian self-driving-nya selama bertahun-tahun, tetapi sekarang perusahaan telah mempublikasikan beberapa teknik perangkat lunak mengemudi mandiri yang meningkatkan deteksi hambatan.
Diterbitkan pada 17 November di repositori ilmiah pra-cetak moderat arXiv oleh kecerdasan buatan Apple dan pakar pembelajaran mesin Yin Zhou dan Oncel Tuzel, makalah ini menguraikan mendeteksi hambatan kecil menggunakan metode penginderaan Light Detection and Ranging (LiDAR).
Daripada mengandalkan representasi fitur kerajinan tangan (misalnya, proyeksi pandangan mata burung), para ilmuwan Apple mengusulkan arsitektur mendalam yang ujung-ujungnya dapat dilatih untuk deteksi 3D berbasis cloud point. Disebut VoxelNet, ia dapat beroperasi langsung pada titik 3D yang jarang dan menangkap informasi bentuk 3D secara efektif.
Eksperimen awal dengan teknologi VoxelNet telah menunjukkan bahwa ia mengungguli metode deteksi 3D berbasis LiDAR yang canggih dengan selisih yang besar. Pada tugas-tugas yang lebih menantang, seperti deteksi 3D pejalan kaki dan pengendara sepeda, pendekatan VoxelNet menunjukkan hasil yang menggembirakan, menunjukkan bahwa itu memberikan representasi dan deteksi 3D yang lebih baik.
Kotak 3D hijau menunjukkan potensi hambatan yang terdeteksi menggunakan LiDAR
Kemampuan untuk mendeteksi objek secara akurat dalam awan titik 3D sangat penting dalam penghindaran kendala.
Dari kertas:
VoxelNet membagi cloud titik menjadi voxel 3D dengan spasi yang sama dan mengubah sekelompok titik dalam setiap voxel menjadi representasi fitur terpadu melalui lapisan pengkodean fitur voxel yang baru diperkenalkan. Dengan cara ini, cloud titik dikodekan sebagai representasi volumetrik deskriptif, yang kemudian dihubungkan ke RPN untuk menghasilkan deteksi.
Eksperimen pada tolok ukur deteksi mobil KITTI menunjukkan bahwa VoxelNet mengungguli metode deteksi 3D LiDAR yang canggih dengan selisih yang besar. Selanjutnya, jaringan kami mempelajari representasi diskriminatif yang efektif dari objek dengan berbagai geometri, yang mengarah ke hasil yang menggembirakan dalam deteksi 3D pejalan kaki dan pengendara sepeda, berdasarkan hanya pada LiDAR.
Arsitektur VoxelNet, diilustrasikan di atas pos, menampilkan jaringan pembelajaran yang menggunakan cloud titik mentah sebagai input, lalu mem-partisi ruang menjadi voxel dan mengubah titik di dalam setiap voxel ke representasi vektor yang mengkarakterisasi informasi bentuk..
Sangat bagus bahwa Apple mulai membuka diri ketika datang ke penelitian mengemudi otonom, dikatakan ditujukan untuk naik pasar yang memanggil dan layanan antar-jemput kampus di perusahaan perusahaan.
Pembuat iPhone tampaknya telah melakukan investasi besar dalam mengemudi otonom dan memiliki "proyek besar berjalan" di ruang itu, menurut CEO Tim Cook.