
DALL-E 3'ün yapay zeka boyama yeteneği göz alıcı! OpenAI ayrıca bu trendden yararlandı ve DALL-E 3 hakkında, görsellerin metin açıklamalarını (altyazılarını) sentezleyerek modelin oluşturma yeteneklerinin nasıl geliştirilebileceğini açıklamaya odaklanan bir teknik rapor yayınladı . Bununla birlikte, teknik rapordaki ana gelişme, istemi takip etme yeteneği, yani oluşturulan görüntü ile giriş metni istemi arasındaki tutarlılıktır. OpenAI, DALL-E 3'ün spesifik model mimarisini ve uygulama ayrıntılarını ayrıntılı olarak tanıtmadı ve hala birçok çekince var~
Teknik raporun tamamı iki bölüme ayrılabilir. İlk bölüm, eğitim veri setindeki görsellerin altyazılarını sentezleyerek modelin üretim yeteneklerinin nasıl geliştirilebileceğinden bahsediyor. İkinci bölüm temel olarak DALL-E 3 ve karşılaştırmasının değerlendirilmesinden ve karşılaştırılmasından bahsediyor. diğer Vincent grafik modelleri.
Pdf: https://cdn.openai.com/papers/dall-e-3.pdf
