Minggu Ini di AI: Teknologi Besar Bertaruh Miliaran pada Alat Pembelajaran Mesin

Kredit gambar: Andrei Onofrinko / Getty Images

Mengikuti industri yang bergerak cepat seperti kecerdasan buatan adalah tugas yang sulit. Jadi, agar AI dapat melakukannya untuk Anda, inilah rangkuman praktis dari cerita minggu lalu di dunia pembelajaran mesin, bersama dengan penelitian dan eksperimen penting yang tidak akan kami bahas sendiri.

Jika belum jelas, lanskap persaingan di AI—khususnya sub-bidang yang dikenal sebagai AI generatif—sangat panas. Dan semakin panas. Minggu ini, Dropbox meluncurkan dana ventura institusional pertamanya, Dropbox Ventures, yang menurut perusahaan akan berfokus pada perusahaan rintisan yang membangun produk bertenaga AI yang “membentuk masa depan pekerjaan”. Tidak ketinggalan, AWS telah meluncurkan program senilai $100 juta untuk mendanai inisiatif AI generatif yang dipimpin oleh mitra dan pelanggannya.

Pastinya ada banyak uang yang dilemparkan ke ruang AI. Salesforce Ventures, divisi modal ventura dari Salesforce, berencana menggelontorkan $500 juta ke perusahaan rintisan yang mengembangkan teknologi AI generatif. hari kerja baru saja Itu menambahkan $ 250 juta ke dana modal ventura yang ada untuk mendukung AI dan startup pembelajaran mesin. Dan Accenture dan PwC mengumumkan bahwa mereka berencana untuk menginvestasikan masing-masing $3 miliar dan $1 miliar, dalam kecerdasan buatan.

Tetapi orang bertanya-tanya apakah uang adalah jawaban atas tantangan luar biasa dalam kecerdasan buatan.

Dalam panel informasi selama konferensi Bloomberg di San Francisco minggu ini, Meredith Whitaker, kepala aplikasi perpesanan aman Signal, menjelaskan bahwa teknologi yang mendukung beberapa aplikasi AI paling ramai saat ini telah menjadi sangat buram. Dia mencontohkan seseorang yang masuk ke bank dan meminta pinjaman.

Orang ini dapat ditolak untuk pinjaman dan tidak tahu ada sistem [the] “Kemungkinan didukung oleh beberapa Microsoft API yang telah ditentukan, berdasarkan media sosial saya yang rusak, bahwa saya tidak layak kredit,” kata Whittaker. “saya tidak akan pernah tahu [because] Tidak ada mekanisme bagi saya untuk mencari tahu.”

Masalahnya bukan modal. Sebaliknya, kata Whitaker, itu adalah hierarki kekuasaan saat ini.

“Saya sudah di atas meja selama 15 tahun, 20 tahun. Saya pernah Dia Di atas meja. Berada di meja tanpa listrik bukanlah apa-apa.”

Tentu saja, mencapai perubahan struktural jauh lebih sulit daripada berburu uang—terutama ketika perubahan struktural belum tentu sesuai dengan kepentingan kekuatan yang ada. Whitaker memperingatkan apa yang mungkin terjadi jika tidak ada cukup oposisi.

Saat kemajuan dalam AI dipercepat, begitu pula efek sosial, dan kita akan melanjutkan “jalan yang bising menuju AI,” katanya, “di mana kekuatan itu disemen dan dinaturalisasi dengan kedok kecerdasan dan kita diawasi untuk intinya.” [of having] Terlalu sedikit hak pilihan atas kehidupan individu dan kolektif kita.”

itu Dia seharusnya Industri berhenti. baik itu dalam kenyataan akan adalah masalah lain. Ini kemungkinan akan menjadi sesuatu yang akan kami dengar diskusikan saat Anda tampil di Disrupt pada bulan September.

Berikut adalah berita utama AI lainnya yang diperhatikan dari beberapa hari terakhir:

AI DeepMind mengontrol bot: DeepMind mengatakan telah mengembangkan model AI, yang disebut RoboCat, yang dapat melakukan berbagai tugas melalui model lengan robot yang berbeda. Itu saja tidak terlalu baru. Tapi DeepMind mengklaim model tersebut adalah yang pertama mampu menyelesaikan dan beradaptasi dengan banyak tugas dan melakukannya dengan bot yang berbeda di dunia nyata.
Pelajari robotika dari YouTube: Berbicara tentang robotika, Profesor Asosiasi Robotika CMU Deepak Pathak minggu ini VRB ditampilkan (Vision-Robotics Bridge), sistem kecerdasan buatan yang dirancang untuk melatih sistem robotik dengan menonton rekaman manusia. Bot memantau beberapa informasi dasar, termasuk titik sentuh dan jalur, lalu berupaya menjalankan tugas tersebut.
Otter masuk ke game chatbot: Layanan transkripsi otomatis berang-berang Mengumumkan chatbot AI baru minggu ini yang memungkinkan peserta mengajukan pertanyaan selama dan setelah rapat serta membantu mereka berkolaborasi dengan rekan satu tim.
Uni Eropa menyerukan regulasi kecerdasan buatan: Regulator Eropa berada di persimpangan tentang bagaimana AI harus diatur — dan pada akhirnya digunakan secara komersial dan nonkomersial — di wilayah tersebut. Minggu ini, kelompok konsumen terbesar UE, Organisasi Konsumen Eropa (BEUC), menimbang dengan dudukannya sendiri: Berhentilah menunda-nunda, dan “mulai penyelidikan mendesak terhadap risiko AI generatif” sekarang, katanya.
Vimeo meluncurkan fitur bertenaga AI: Minggu ini, Vimeo mengumumkan seperangkat alat bertenaga AI yang dirancang untuk membantu pengguna membuat skrip dan merekam snapshot dengan perangkat pemutaran bawaan dan menghapus jeda panjang dan omong kosong yang tidak diinginkan seperti “ahs” dan “ums” dari rekaman.
Modal untuk Suara Sintetis: Sebelas laboratorium, platform bertenaga AI viral untuk menciptakan suara sintetik, telah mengumpulkan $19 juta dalam putaran pendanaan baru. ElevenLabs mendapatkan momentum dengan cukup cepat setelah diluncurkan pada akhir Januari. Tapi publisitasnya tidak selalu positif—apalagi sekali aktor yang buruk Mereka mulai mengeksploitasi platform untuk tujuan mereka sendiri.
Mengonversi audio menjadi teks: Gladia, startup AI Prancis, telah meluncurkan platform yang memanfaatkan model transkripsi Whisper OpenAI untuk – melalui API – mengonversi audio apa pun menjadi teks hampir secara real time. Gladia berjanji dapat menyalin satu jam audio seharga $0,61, dan proses transkripsi memakan waktu sekitar 60 detik.
Memanfaatkan AI Generatif: memanfaatkan, sebuah startup yang membuat toolkit untuk membantu pengembang bekerja lebih efisien, minggu ini menyuntikkan sedikit kecerdasan buatan ke platformnya. Sekarang, Harness dapat secara otomatis menyelesaikan kegagalan pembangunan dan penerapan, menemukan dan memperbaiki kerentanan keamanan, dan memberikan saran untuk mengendalikan biaya cloud.

pembelajaran mesin lainnya

Minggu ini adalah CVPR di Vancouver, Kanada, dan saya berharap saya akan pergi karena pembicaraan dan makalahnya terdengar sangat menarik. Jika Anda hanya dapat menonton satu, periksalah Keynote oleh Yejin Choi Tentang kemungkinan, ketidakmungkinan, dan paradoks kecerdasan buatan.

Kredit gambar: CVPR/Youtube

Profesor UW dan penerima hibah MacArthur Genius pertama-tama membahas beberapa batasan tak terduga dari model paling mumpuni saat ini. Secara khusus, GPT-4 sangat buruk dalam perkalian. Dia gagal menemukan hasil kali dua angka tiga digit dengan benar pada tingkat yang mengejutkan, meskipun dengan sedikit persuasi dia bisa melakukannya dengan benar 95% dari waktu. Mengapa penting bahwa model bahasa tidak dapat menghitung, Anda bertanya? Karena seluruh pasar AI sekarang didasarkan pada gagasan bahwa model bahasa menggeneralisasi dengan baik ke banyak tugas menarik, termasuk hal-hal seperti melakukan pajak atau akuntansi. Maksud Choi adalah bahwa kita harus mencari batasan AI dan bekerja ke dalam, bukan sebaliknya, karena itu memberi tahu kita lebih banyak tentang kemampuan mereka.

Bagian lain dari pidatonya menarik dan menggugah pikiran. Anda dapat menonton semuanya di sini.

Rod Brooks, diperkenalkan sebagai “Hype Killer”, Berikan sejarah yang menarik dari beberapa konsep dasar pembelajaran mesin Konsep yang tampak baru hanya karena sebagian besar orang yang menerapkannya tidak ada saat ditemukan! Menengok ke belakang selama beberapa dekade, dia menyentuh McCulloch, Minsky, dan bahkan Heap—dan menunjukkan bagaimana ide-ide tersebut tetap relevan jauh melampaui zamannya. Ini adalah pengingat yang bermanfaat bahwa pembelajaran mesin adalah bidang yang berdiri di pundak para raksasa di era pascaperang.

Banyak, banyak makalah telah diserahkan ke CVPR dan dipresentasikan di CVPR, dan adalah reduktif untuk hanya melihat pemenang penghargaan, tetapi ini adalah laporan berita, bukan tinjauan literatur yang komprehensif. Jadi, inilah yang menurut para juri di konferensi paling menarik:

Kredit gambar: AI2

visprog, dari para peneliti di AI2, adalah jenis meta-model yang melakukan tugas pemrosesan visual yang rumit menggunakan kotak alat kode multiguna. Katakanlah Anda memiliki gambar beruang grizzly di atas rerumputan (seperti pada gambar) – Anda cukup memberi tahu “Ganti beruang dengan beruang kutub di salju” dan itu akan berhasil. Ini mengidentifikasi bagian-bagian dari gambar, memisahkannya secara visual, mencari dan menemukan atau membuat pengganti yang sesuai, dan dengan cerdas menyatukan semuanya kembali, tanpa dorongan lebih lanjut dari pihak pengguna. Antarmuka “peningkatan” Blade Runner mulai terlihat cukup pejalan kaki. Dan ini hanyalah salah satu dari banyak kemungkinannya.

“Kepemimpinan Independen Berorientasi Rencana,” Dari kelompok riset multi-lembaga Cina yang mencoba menyatukan bagian-bagian berbeda dari pendekatan yang agak parsial yang kami ambil untuk mobil yang bisa mengemudi sendiri. Biasanya ada semacam proses langkah demi langkah “mempersepsikan, memprediksi, merencanakan”, yang masing-masing mungkin memiliki sejumlah subtugas (seperti mensegmentasi orang, mengidentifikasi hambatan, dll.). Model mereka mencoba memasukkan semua ini ke dalam satu model, seperti model multimedia yang kita lihat yang dapat menggunakan teks, suara, atau gambar sebagai input dan output. Demikian pula, model ini dalam beberapa hal menyederhanakan ketergantungan kompleks tumpukan self-driving modern.

DynIBaR Ini menunjukkan cara yang kuat dan berkualitas tinggi untuk berinteraksi dengan video menggunakan “bidang radiasi saraf dinamis”, atau NeRF. Pemahaman mendalam tentang apa yang ada di video memungkinkan hal-hal seperti stabilisasi, gerakan halus, dan hal-hal lain yang biasanya tidak Anda harapkan setelah Anda benar-benar merekam video. Sekali lagi… “Tingkatkan”. Ini jelas merupakan hal yang Apple akan pekerjakan untuk Anda dan kemudian dipuji di WWDC berikutnya.

Booth Impian Anda mungkin ingat sedikit awal tahun ini ketika halaman proyek telah diposting. Ini adalah sistem terbaik, tidak ada jalan lain, pembuatan deepfake. Tentu saja berguna dan ampuh untuk melakukan manipulasi gambar semacam ini, belum lagi kesenangan, dan peneliti seperti yang ada di Google sedang bekerja untuk membuatnya lebih mulus dan lebih realistis. Konsekuensinya… nanti, mungkin.

Penghargaan untuk makalah siswa terbaik diberikan untuk cara membandingkan dan mencocokkan kisi, atau menggambar poin dalam 3D – sejujurnya, terlalu teknis bagi saya untuk mencoba menjelaskannya, tetapi ini adalah kemampuan penting untuk persepsi dunia nyata dan peningkatannya disambut baik . Lihat kertas di sini untuk contoh dan informasi lebih lanjut.

Hanya dua nugget lagi: ditawarkan Intel Model yang menarik ini, LDM3D, untuk menghasilkan gambar 3D 360 derajat seperti lingkungan virtual. Jadi, saat Anda berada di metaverse dan berkata “Tempatkan kami di reruntuhan yang tumbuh terlalu besar di hutan”, itu menciptakan kehancuran baru sesuai permintaan.

Dan mengeluarkan orang mati Alat sintesis suara disebut Voicebox Ini sangat bagus dalam mengekstraksi dan mengulang fitur suara, bahkan saat inputnya tidak bersih. Biasanya Anda memerlukan jumlah dan variasi rekaman audio bersih yang bagus untuk menyalin audio, tetapi Voicebox melakukan ini lebih baik daripada banyak lainnya, dengan data lebih sedikit (pikirkan seperti 2 detik). Untungnya mereka menyimpan jin itu di dalam botol untuk saat ini. Bagi mereka yang merasa perlu mereproduksi suaranya, lihat Acapela.

Yoga Mahendra

Yoga Mahendra adalah penulis di Pospapua.com yang meliput berbagai topik, termasuk berita, politik, bisnis, teknologi, olahraga, hiburan, dan gaya hidup. Ia berfokus pada penyajian informasi yang jelas, akurat, dan mudah dipahami, sehingga pembaca dapat mengikuti perkembangan isu terkini dengan lebih baik. Melalui pelaporan yang informatif dan relevan, Yoga menghadirkan berita serta cerita yang dekat dengan kebutuhan dan minat pembaca, sambil mengedepankan fakta dan konteks yang penting.

Minggu Ini di AI: Teknologi Besar Bertaruh Miliaran pada Alat Pembelajaran Mesin

pembelajaran mesin lainnya

Nvidia Amankan Pasokan Memori SK Hynix untuk Dukung Infrastruktur AI Senilai US$500 Miliar

OpenAI Luncurkan Perangkat Keras Pertama, Keyboard Mini untuk Mengendalikan Agen AI

Penyegaran Generasi Kedua Prosesor Komputasi Qualcomm Muncul dalam Peta Pengembangan Produsen Perangkat

You may have missed

Nvidia Amankan Pasokan Memori SK Hynix untuk Dukung Infrastruktur AI Senilai US$500 Miliar

Musim Sprint MotoGP 2026 Jadi yang Paling Ketat Sekaligus Paling Dramatis

Xiaomi SkyNomad N90 Tawarkan Konsep SUV Keluarga Premium dengan Kabin Modular dan Teknologi Canggih

ASUS Luncurkan Monitor Gaming Tandem RGB OLED Pertama dengan Dukungan DisplayPort 2.1

main menu

pages

pembelajaran mesin lainnya

Tinggalkan Balasan Batalkan balasan

More Stories

Nvidia Amankan Pasokan Memori SK Hynix untuk Dukung Infrastruktur AI Senilai US$500 Miliar

OpenAI Luncurkan Perangkat Keras Pertama, Keyboard Mini untuk Mengendalikan Agen AI

Penyegaran Generasi Kedua Prosesor Komputasi Qualcomm Muncul dalam Peta Pengembangan Produsen Perangkat

You may have missed

Nvidia Amankan Pasokan Memori SK Hynix untuk Dukung Infrastruktur AI Senilai US$500 Miliar

Musim Sprint MotoGP 2026 Jadi yang Paling Ketat Sekaligus Paling Dramatis

Xiaomi SkyNomad N90 Tawarkan Konsep SUV Keluarga Premium dengan Kabin Modular dan Teknologi Canggih

ASUS Luncurkan Monitor Gaming Tandem RGB OLED Pertama dengan Dukungan DisplayPort 2.1