Merubah Teks menjadi Sebuah Gambar dengan Teknologi Kecerdasan Buatan

Hasil penggambaran text-to-image milik Imagen | Sumber: Imagen


#57TahunTelkom #DigitalBisaUntukSemua

Teknologi kecerdasan buatan atau artificial intelligence (AI) dikembangkan oleh Tim Brain dari Google dalam menghadirkan Imagen, sebuah model text-to-image yang dapat merubah kalimat menjadi sebuah fotorealistik. Jika kita memasukkan kalimat apapun maka sistem akan menghasilkan sebuah gambar yang sangat realistik. Apapun yang kita ketikkan akan menjadi sebuah gambar. Model kecerdasan buatan tersebut memberikan wadah baru dalam penyaluran imajinasi.

Google bukanlah yang pertama dalam menghadirkan artificial intelligence model text-to-image. Sebelum Google telah muncul DALL-E yang dikembangkan oleh AI lab OpenAI. Jika dibandingkan dengan Imagen, DALL-E memiliki sistem yang jauh lebih sederhana. Namun Google Research menjelaskan jika Imagen memiliki kualitas yang jauh lebih baik dibandingkan DAAL-E. OpenAI sendiri telah mengembangkan DAAL-E 2 dengan hasil penggambaran yang lebih baik dan realistik serta resolusi 4 kali lebih baik dibandingkan DAAL-E.

Tim Brain menggunakan DrawBench untuk membandingkan model yang dimiliki Imagen dengan VQ GAN, LDM, serta DALL-E 2. Sekitar 200 text prompts atau teks yang dimasukkan ke program Imagen dan generator text-to-image lainnya yang menghasilkan output berbeda dari tiap tiap generator. Lalu hasil tersebut dibandingkan dan dinilai oleh pengguna. Hasilnya menunjukkan jika lebih banyak yang menyukai gambar keluaran Imagen dibanding pesaing lainnya.

Contoh hasil karya Imagen:

Hasil penggambaran Imagen | Sumber: Imagen

Text input : 

  • Foto kiri : A marble statue of a Koala DJ in front of a marble statue of a turntable. The Koala has wearing large marble headphones. (Sebuah patung marmer DJ Koala di depan patung marmer meja putar. Koala tersebut menggunakan headphone marmer besar) 
  • Foto kanan : A majestic oil painting of a raccoon Queen wearing red French royal gown. The painting is hanging on an ornate wall decorated with wallpaper. (Lukisan minyak dari Ratu rakun yang mengenakan gaun berwarna merah kerajaan Prancis. Lukisannya tergantung di dinding hiasan yang dihias dengan wallpaper)

Sangat realistis bukan hasil penggambaran yang diberikan. Terasa sangat nyata karena Imagen memiliki tingkat pemahaman bahasa yang tinggi. Tingkat hasil penggambaran tersebut belum pernah dikembangkan oleh perusahaan manapun.

Walaupun hasil penggambaran oleh DAAL-E masih terbilang kalah dibandingkan Imagen, DAAL-E telah memulai pemasarannya dalam versi Beta sehingga pengguna dapat membuat gambar sesuai keinginannya. Para pengguna mendapatkan hak penggunaan penuh untuk mengkomersialkan gambar yang mereka buat dengan DAAL-E, termasuk untuk mencetak ulang, menjual kembali, dan sebagainya. 

Dengan teks input: Sebuah lukisan seekor rubah yang duduk di lapangan saat matahari terbit ala Claude Monet. ( Kiri: DAAL-E, Kanan : DAAL-E 2 ) | Sumber : DAAL-E

Namun Google masih belum membuka Imagen untuk digunakan oleh publik secara luas. Menurut para peneliti Google, terdapat kemungkinan jika Imagen disalahgunakan dalam menghasilkan gambar yang menghina atau berbahaya. Karena dataset seperti itu sering mencerminkan stereotip sosial serta sudut pandang yang menindas. Para peneliti masih berusaha untuk mengkodekan bias sosial seperti kemungkinan untuk membuat gambar orang dengan warna kulit yang lebih gelap maupun terang dan menempatkan mereka pada peran gender stereotip tertentu.

Imagen juga menggunakan dataset LAION-400M yang diketahui berisi berbagai konten yang tidak pantas seperti rasis dan stereotip sosial yang berbahaya. Terdapat risiko bahwa Imagen telah mengkodekan stereotip dan representasi berbahaya, yang membuat tim peneliti tidak merilis Imagen dalam bentuk demo publik. 

Namun, Imagen akan terus mengeksplorasi sistem kerangka program untuk menghadirkan Imagen yang aman digunakan bagi masyarakat. Para ahli bertujuan untuk membuat kemajuan pada beberapa tantangan serta keterbatasan yang ada dalam pekerjaan di masa depan.

Sumber : Situs Imagen | Situs DALL-E

Komentar

Silakan masuk terlebih dahulu, untuk berkomentar memakai akun kamu.

X

Tekan ESC untuk keluar