DALL-E 3'ün yapay zeka boyama yeteneği göz alıcı! OpenAI ayrıca bu trendden yararlandı ve DALL-E 3 hakkında,
görsellerin metin açıklamalarını (altyazılarını) sentezleyerek modelin oluşturma yeteneklerinin nasıl geliştirilebileceğini açıklamaya odaklanan bir teknik rapor yayınladı . Bununla birlikte, teknik rapordaki ana gelişme,
istemi takip etme yeteneği, yani oluşturulan görüntü ile giriş metni istemi arasındaki tutarlılıktır.
OpenAI, DALL-E 3'ün spesifik model mimarisini ve uygulama ayrıntılarını ayrıntılı olarak tanıtmadı ve hala birçok çekince var~
Teknik raporun tamamı iki bölüme ayrılabilir. İlk bölüm, eğitim veri setindeki görsellerin altyazılarını sentezleyerek modelin üretim yeteneklerinin nasıl geliştirilebileceğinden bahsediyor. İkinci bölüm temel olarak DALL-E 3 ve karşılaştırmasının değerlendirilmesinden ve karşılaştırılmasından bahsediyor. diğer Vincent grafik modelleri.
Pdf:
https://cdn.openai.com/papers/dall-e-3.pdf