Ashari Tech

Hai, Sobat Tekno! Ada kabar gembira nih dari dunia kecerdasan buatan. OpenAI, yang dikenal sebagai otak di balik ChatGPT yang fenomenal, baru saja memperkenalkan teknologi terbarunya yang bernama Sora. 

Apa Itu Sora?

Sora adalah sistem AI terbaru dari OpenAI yang bisa menghasilkan video-video super realistis hanya dari deskripsi teks. Bayangkan saja, dengan mengetikkan deskripsi singkat, kamu bisa mendapatkan video mamut berbulu yang berlari di padang salju atau adegan ramai di jalan Tokyo yang terlihat seperti diambil langsung dari film Hollywood. Keren, kan?

Mengapa Sora Spesial?

Sora bukan sekadar alat pembuat video biasa. Ini adalah lompatan besar dalam teknologi generasi video, yang membuka banyak kemungkinan baru, baik untuk pembuat film profesional maupun kreator konten online. Namun, seperti dua sisi mata uang, kemampuan canggih Sora juga menimbulkan kekhawatiran tentang penyebaran informasi palsu di internet.

Kelebihan Utama Sora

  • Kualitas Tinggi: Berbeda dengan teknologi sebelumnya, video yang dihasilkan Sora punya kualitas yang jauh lebih baik, bahkan bisa dibilang susah dibedakan dari video asli.
  • Belum Dirilis untuk Publik: OpenAI masih melakukan review komprehensif untuk mengerti dan memitigasi potensi penyalahgunaan Sora. Saat ini, mereka sedang bekerja sama dengan sekelompok akademisi dan peneliti untuk menguji sistem ini.
  • Fitur Watermark: Untuk mengatasi masalah autentisitas, OpenAI menambahkan watermark pada video yang dihasilkan. Meski begitu, mereka mengakui bahwa watermark ini bisa saja dihilangkan atau sulit dikenali.

Potensi dan Tantangan

Meskipun Sora menawarkan potensi kreatif yang tak terbatas, ada kekhawatiran tentang dampaknya terhadap industri seni digital dan pembuatan konten. Banyak profesional khawatir bahwa kehadiran Sora bisa mengancam pekerjaan mereka, mengingat AI ini bisa menghasilkan konten berkualitas tinggi dengan cepat dan murah.

Teknik Penelitian di Balik Sora

Model Difusi: Kreativitas dari Kebisingan

Sora menggunakan model difusi, yang memulai proses dengan video yang tampak seperti statis atau kebisingan, lalu secara bertahap mengubahnya dengan mengurangi kebisingan ini melalui banyak langkah. Teknik ini memungkinkan Sora untuk menghasilkan video yang tidak hanya menakjubkan secara visual tapi juga kohesif dari awal hingga akhir.

Kemampuan Generasi Video

Salah satu keunggulan Sora adalah kemampuannya untuk menghasilkan seluruh video sekaligus atau memperpanjang video yang sudah dihasilkan, membuatnya lebih panjang. Dengan memberikan model wawasan tentang banyak frame sekaligus, Sora berhasil mengatasi masalah sulit dalam memastikan subjek tetap sama, bahkan ketika sementara keluar dari pandangan.

Arsitektur Transformer

Mirip dengan model GPT, Sora menggunakan arsitektur transformer, yang menawarkan kinerja skalabilitas superior. Ini memungkinkan Sora untuk menangani data visual dengan lebih efisien, menciptakan video yang lebih kaya dan lebih detail.

Representasi Data sebagai Patch

Sora merepresentasikan video dan gambar sebagai kumpulan unit data yang lebih kecil, yang disebut patch, serupa dengan token dalam GPT. Pendekatan unik ini memungkinkan pelatihan transformer difusi pada berbagai data visual, meliputi durasi, resolusi, dan rasio aspek yang berbeda.

Membangun dari Penelitian Sebelumnya

Sora membangun dari penelitian terdahulu dalam model DALL·E dan GPT, menggunakan teknik recaptioning dari DALL·E 3. Teknik ini menghasilkan keterangan yang sangat deskriptif untuk data visual pelatihan, memungkinkan model mengikuti instruksi teks pengguna dengan lebih setia dalam video yang dihasilkan.

Kemampuan Tambahan

Sora tidak hanya mampu menghasilkan video dari instruksi teks saja tetapi juga dapat mengambil gambar diam yang ada dan menghasilkan video darinya, menganimasikan isi gambar dengan akurasi dan perhatian pada detail kecil. Model ini juga bisa memperpanjang video yang ada atau mengisi frame yang hilang.

Keamanan dan Etika

Dalam memperkenalkan Sora, OpenAI tidak hanya fokus pada kemajuan teknologi tetapi juga sangat memperhatikan aspek keamanan. Sebelum Sora tersedia dalam produk-produk OpenAI, ada beberapa langkah keamanan penting yang sedang dan akan diambil.

Kerjasama dengan Red Teamers

OpenAI bekerja sama dengan red teamers, yaitu para ahli dalam berbagai bidang seperti misinformasi, konten kebencian, dan bias. Mereka akan melakukan pengujian adversarial terhadap model untuk mengidentifikasi potensi penyalahgunaan dan memastikan langkah-langkah mitigasi efektif diterapkan.

Pengembangan Alat Deteksi

Untuk membantu mendeteksi konten yang menyesatkan, OpenAI sedang mengembangkan alat-alat seperti classifier deteksi yang dapat mengidentifikasi kapan sebuah video dihasilkan oleh Sora. Rencananya, metadata C2PA akan dimasukkan di masa depan jika model ini diimplementasikan dalam produk OpenAI.

Apa Itu C2PA?

C2PA (Coalition for Content Provenance and Authenticity) adalah standar untuk membantu memerangi misinformasi dan konten palsu dengan menyediakan metadata yang menyertakan informasi tentang asal-usul dan keaslian konten. Dengan memasukkan metadata C2PA pada video yang dihasilkan oleh Sora, pengguna bisa lebih mudah memverifikasi keaslian konten tersebut.

Menggunakan Metode Keamanan yang Ada

Selain mengembangkan teknik baru, OpenAI juga memanfaatkan metode keamanan yang telah dibangun untuk produk yang menggunakan DALL·E 3, yang berlaku juga untuk Sora. Misalnya, classifier teks OpenAI akan memeriksa dan menolak input teks yang melanggar kebijakan penggunaan, seperti permintaan untuk konten kekerasan ekstrem, konten seksual, imaji kebencian, kemiripan selebriti, atau hak kekayaan intelektual orang lain. OpenAI juga telah mengembangkan classifier gambar yang kuat untuk meninjau frame dari setiap video yang dihasilkan, membantu memastikan kepatuhan terhadap kebijakan penggunaan sebelum ditunjukkan kepada pengguna.

Kolaborasi dengan Pemangku Kepentingan

OpenAI akan berinteraksi dengan pembuat kebijakan, pendidik, dan seniman di seluruh dunia untuk memahami kekhawatiran mereka dan mengidentifikasi kasus penggunaan positif untuk teknologi baru ini. Meskipun telah melakukan penelitian dan pengujian ekstensif, OpenAI mengakui bahwa mereka tidak bisa memprediksi semua cara bermanfaat orang akan menggunakan teknologi ini, maupun semua cara penyalahgunaan yang mungkin terjadi. Itulah mengapa belajar dari penggunaan dunia nyata menjadi komponen kritis dalam menciptakan dan merilis sistem AI yang semakin aman seiring waktu.

Login untuk menambahkan komentar
Klik tombol Google dibawah ini untuk masuk sebagai user

Tambahkan Komentar

Kamu mungkin juga suka