Sora AI adalah model AI yang dicipta oleh OpenAI, sebuah syarikat yang terkenal dengan penciptaan model AI seperti Dall-E dan ChatGPT. Ia dapat mengambil perkataan yang ditulis oleh orang dan menukarkannya menjadi video menarik yang kelihatan nyata. Video ini boleh berjalan selama satu minit dan penuh dengan adegan menarik, kamera yang bergerak, dan watak-watak berwarna-warni. Sora berfungsi dengan menggunakan teknik khas yang dipanggil model difusi. Ia bermula dengan bunyi yang kabur dan perlahan-lahan mengubahnya untuk menjadikan gambar atau video yang jelas mengikut perkataan yang diberikan. Model AI ini belajar daripada banyak contoh di mana orang menulis tentang video, jadi ia memahami bagaimana membuat gambar dan tindakan yang betul sepadan dengan penerangan.
Apakah keupayaannya?
Penghasilan Video dan Gambar
Sora AI secara umumnya dapat mencipta video definisi tinggi sehingga satu minit dari penerangan teks. Ia juga boleh menghasilkan imej dalam pelbagai saiz.
Memahami Bahasa Pengguna
Model ini mempunyai pemahaman mendalam tentang bahasa, membolehkannya menterjemahkan penerangan teks ke dalam video dan memperluaskan video sedia ada ke hadapan atau ke belakang dalam masa. Walaupun pengguna menggunakan penerangan pendek, ia akan menghantar penerangan yang lebih panjang dan terperinci kepada model video untuk menghasilkan video secara tepat mengikut penerangan pengguna.
Menukar imej dan video kepada video
Kini adalah mungkin untuk membuat imej statik bergerak. Memasukkan imej ke dalam penerangan akan membuat Sora menghasilkannya menjadi video. Apabila meletakkan video sebagai penerangan, ia boleh memanjangkan tempoh video lebih lama, bukan dengan membuat video secara perlahan tetapi dengan menambahkan lebih banyak bingkai ke dalam video yang sedia ada.
Penyuntingan Imej dan Video
Apabila pengguna memasukkan mana-mana imej atau video dan meminta Sora untuk menyunting video kepada gaya tertentu, seperti memasang penapis atau menukar latar belakang video, ia boleh melakukannya.
Mencipta peralihan dengan dua video
Dengan Sora, pengguna boleh mencipta peralihan menggunakan dua video yang berbeza. Bayangkan anda mempunyai satu video tentang sebiji telur dan video lain tentang seekor ayam. Sora membantu mencipta peralihan yang lancar, seperti menukar sebiji telur menjadi ayam dalam satu video, dengan dua video yang anda berikan.
Mampu membuat simulasi
Dengan kemampuan ini, Sora dapat membuat simulasi yang kelihatan seperti manusia sebenar, haiwan, dan tempat-tempat di dunia nyata. Ia boleh menghasilkan video dengan pergerakan kamera, sama ada berputar, bergerak ke atas, ke bawah atau lebih. Dengan konsistensi jarak jauh dan ketetapan objek, manusia, haiwan atau objek masih wujud walaupun mereka berada di luar bingkai. Oleh itu, pengguna boleh menghasilkan video objek dari pelbagai sudut. Selain itu, setiap tindakan dalam video boleh memberi kesan sebagaimana di dunia nyata, seperti meninggalkan kesan gigitan pada seseorang yang sedang makan burger. Ia juga boleh mensimulasikan dunia digital, seperti mencipta persekitaran maya yang serupa dengan permainan video seperti Minecraft.
Had Sora
Walaupun Sora AI mempunyai keupayaan yang mengagumkan, ia mempunyai beberapa kekangan yang penting untuk dipertimbangkan:
- Panjang Video Pendek: Pada masa kini, Sora hanya boleh mencipta video sehingga satu minit sahaja.
- Kekurangan dalam Simulasi: Model ini mungkin mengalami kesukaran dalam mensimulasikan fizik bagi adegan kompleks dan memahami contoh-contoh khusus sebab dan kesan. Sebagai contoh, apabila mengambil sepotong kek dari kek penuh, sepatutnya ada ruang kosong, tetapi kek masih wujud. Oleh itu, ia mungkin tidak tahu dengan tepat bagaimana satu tindakan akan mempengaruhi tindakan yang lain.
- Butiran Ruang dan Masa: Sora mungkin keliru dengan butiran ruang dalam penerangan, seperti kiri dan kanan, dan menghadapi kesulitan dengan penerangan yang tepat mengenai peristiwa yang berlaku dari masa ke masa, seperti mengikuti trajektori kamera yang spesifik.
Sora AI sedang diuji oleh kumpulan kecil orang untuk memastikan ia selamat dan berfungsi dengan baik sebelum ia tersedia kepada semua orang. Ia boleh mengubah cara video dibuat dan digunakan dalam perkara seperti iklan dan pemasaran. Terdapat alat-alat serupa lain, seperti Veed.io dan Runway. OpenAI, syarikat di sebalik Sora, sedang berbincang dengan orang-orang penting untuk memahami sebarang kebimbangan tentang penggunaan teknologi seperti ini. Tetapi pada masa ini, tiada tarikh untuk apabila Sora akan dilepaskan kepada semua orang.