Sekarang siapa pun dapat membuat aplikasi yang menggunakan DALL E 2 untuk membuat gambar •

Berita23 Views

Terakhir, DALL-E 2, sistem AI generasi gambar OpenAI, tersedia sebagai API, yang berarti pengembang dapat membangun sistem ke dalam aplikasi, situs web, dan layanan mereka. Dalam posting blog hari ini, OpenAI mengumumkan bahwa pengembang mana pun dapat mulai memanfaatkan kekuatan DALL-E 2 – sekarang digunakan oleh lebih dari tiga juta orang untuk menghasilkan lebih dari empat juta gambar per hari – setelah mereka membuat akun OpenAI API sebagai bagian dari beta publik.

Harga DALL-E 2 API bervariasi menurut resolusi. Untuk gambar 1024 x 1024, biayanya $0,02 per gambar; 512 x 512 foto – $0,018 per foto; Dan 256 x 256 gambar adalah $0,016 per gambar. Diskon volume tersedia untuk perusahaan yang bekerja dengan tim OpenAI Foundation.

Seperti DALL-E 2 beta, API akan memungkinkan pengguna membuat gambar baru dari perintah teks (misalnya, “Kelinci berbulu melompat melintasi ladang bunga”) atau mengedit gambar yang ada. Microsoft, mitra dekat OpenAI, memanfaatkannya ke Bing dan Microsoft Edge dengan alat Image Creator-nya, yang memungkinkan pengguna membuat gambar jika hasil web tidak mengembalikan apa yang mereka cari. Aplikasi desain mode CALA menggunakan DALL-E 2 API alat yang memungkinkan pelanggan untuk menyempurnakan ide desain dari deskripsi teks atau gambar, sementara startup foto Mixtiles membawanya ke dalam alur pembuatan karya seni penggunanya.

Tidak banyak perubahan dalam hal kebijakan dengan peluncuran API, yang kemungkinan akan mengecewakan mereka yang khawatir bahwa sistem AI generatif seperti DALL-E 2 akan diluncurkan tanpa pertimbangan yang memadai dari masalah etika dan hukum yang mereka angkat. Seperti sebelumnya, pengguna terikat oleh Persyaratan Layanan OpenAI, yang melarang penggunaan DALL-E 2 untuk membuat konten kekerasan, seksual, atau kebencian. OpenAI juga terus mencegah pengguna mengunggah gambar orang tanpa persetujuan mereka atau gambar di mana mereka tidak memiliki hak, menggunakan kombinasi sistem pemantauan otomatis dan manusia untuk menegakkan ini.

Salah satu tweak kecil adalah bahwa gambar yang dihasilkan menggunakan API tidak perlu berisi tanda air. OpenAI memperkenalkan watermarking selama DALL-E 2 beta sebagai cara untuk menunjukkan gambar yang berasal dari sistem, tetapi memilih untuk menjadikannya opsional dengan peluncuran API.

“Kami mendorong pengembang untuk mengungkapkan bahwa gambar tersebut dihasilkan oleh AI, tetapi tidak memerlukan tanda tangan DALL-E 2 untuk disertakan,” Luke Miller, manajer produk di OpenAI yang mengawasi pengembangan DALL-E 2, mengatakan kepada TechCrunch melalui email.

Alat Microsoft Designer, didukung oleh DALL-E API 2. Kredit gambar: Microsoft

OpenAI juga menggunakan filter jalur dan level gambar dengan DALL-E 2, meskipun filter yang dikeluhkan beberapa pelanggan terlalu norak dan tidak akurat. Perusahaan telah memfokuskan sebagian dari upaya penelitiannya untuk mendiversifikasi jenis gambar yang dihasilkan DALL-E 2, dengan tujuan memerangi bias yang diketahui menjadi korban sistem AI untuk konversi teks ke gambar (misalnya, membuat gambar di sebagian besar pria kulit putih saat diminta) dengan teks seperti “Contoh CEO”).

Tetapi langkah-langkah ini tidak menenangkan setiap kritikus. Pada bulan Agustus, Getty Images melarang pengunduhan dan penjualan ilustrasi yang dibuat dengan DALL-E 2 dan alat lainnya, mengikuti keputusan serupa oleh situs termasuk Newgrounds, PurplePort, dan FurAffinity. CEO Getty Images Craig Peters mengatakan kepada The Verge bahwa larangan itu disebabkan oleh kekhawatiran tentang “masalah yang tidak tertangani dengan benar,” di mana set data pelatihan untuk sistem seperti DALL-E 2 berisi gambar berhak cipta yang diambil dari web.

Banyak kritikus mengatakan bukan hanya pelanggaran karya bermerek dagang yang mereka khawatirkan tentang DALL-E 2. Sistem ini mengancam mata pencaharian seniman yang metodenya sekarang dapat direplikasi dengan beberapa skrip, menurut mereka, termasuk seniman yang tidak setuju. untuk menggunakan pekerjaan mereka dalam pelatihan DALL-E 2. (Agar adil bagi OpenAI, perusahaan dia memiliki Saya melisensikan sebagian gambar dalam set data pelatihan DALL-E 2, yang lebih dari yang dapat dikatakan untuk beberapa pesaingnya.)

Dalam upaya untuk menemukan kompromi, pesaing Getty Images Shutterstock baru-baru ini mengumumkan bahwa mereka akan mulai menggunakan DALL-E 2 untuk membuat konten tetapi pada saat yang sama akan meluncurkan “dana kontributor” untuk mengkompensasi pembuat ketika perusahaan menjual pekerjaan untuk melatih sistem AI untuk mengubah teks menjadi gambar. Ini juga memblokir seni AI yang diunggah oleh pihak ketiga untuk mengurangi kemungkinan karya berhak cipta masuk ke platform.

Baca juga :  Di balik layar dengan perancang monster "Kabinet Keingintahuan" Guillermo del Toro

Teknisi Matt Dreyhurst dan Holly Herndon memimpin upaya yang disebut Source+ untuk memungkinkan orang tidak mengizinkan pekerjaan mereka atau sesuatu seperti itu digunakan untuk tujuan pelatihan AI. Tapi sifatnya sukarela. OpenAI belum mengatakan apakah akan berpartisipasi – atau memang, apakah akan menawarkan alat swalayan untuk memungkinkan pemegang hak mengecualikan pekerjaan mereka dari pelatihan atau pembuatan konten.

Mixtile DALL-E 2 API

Mixtiles adalah salah satu yang pertama mengadopsi DALL-E 2 API. Kredit gambar: Campuran

Dalam sebuah wawancara, Miller mengungkapkan sedikit tentang secara spesifik tentang langkah-langkah mitigasi baru, kecuali bahwa OpenAI bekerja untuk meningkatkan tekniknya untuk mencegah sistem membuat konten yang bias, beracun, dan menyinggung yang mungkin dianggap tidak menyenangkan oleh pelanggan. Dia menggambarkan beta terbuka API sebagai proses “berulang”, yang akan mencakup bekerja dengan “pengguna dan artis” selama beberapa bulan ke depan saat OpenAI memperluas infrastruktur untuk menjalankan DALL-E 2.

Tentu, jika DALL-E 2 beta merupakan indikasi, API akan berkembang seiring waktu. Awalnya, OpenAI menonaktifkan kemampuan untuk mengedit wajah orang dengan DALL-E 2, tetapi kemudian mengaktifkan kemampuan ini setelah melakukan peningkatan pada sistem keamanannya.

“Kami telah melakukan banyak pekerjaan pada aspek ini – dengan gambar yang Anda unggah dan klaim yang Anda kirimkan sejauh kebijakan konten kami cocok dan memanggang dalam berbagai mitigasi untuk memfilter baik di tempat maupun di tingkat gambar untuk membuat yakin itu sesuai dengan kebijakan konten kami. Jadi, misalnya, jika seseorang mengunggah gambar yang mengandung simbol kebencian atau berdarah — seperti konten yang sangat, sangat kekerasan — itu akan ditolak,” kata Miller. “Kami selalu memikirkan cara meningkatkan sistem.”

Tetapi sementara OpenAI tampaknya ingin menghindari kontroversi seputar Stable Diffusion, sumber terbuka yang setara dengan DALL-E 2 yang digunakan untuk membuat deepfake film porno dan selebriti, terserah kepada pengguna API untuk memilih dengan tepat bagaimana dan di mana teknologi mereka. dikerahkan. Beberapa, seperti Microsoft, tidak diragukan lagi akan mengambil pendekatan yang diperhitungkan, secara perlahan meluncurkan produk bertenaga DALL-E 2 untuk mengumpulkan umpan balik. Yang lain akan terjun lebih dulu, merangkul teknologi dan dilema etika yang menyertainya.

Jika satu hal yang pasti, ada permintaan terpendam untuk AI generatif – konsekuensinya terkutuk. Bahkan sebelum API secara resmi tersedia, pengembang menerbitkan solusi untuk mengintegrasikan DALL-E 2 ke dalam aplikasi, layanan, situs web, dan bahkan video game. Dengan peluncuran beta publiknya, didorong oleh kekuatan pemasaran besar OpenAI, gambar sintetis siap untuk benar-benar memasuki arus utama.