ما یک AI نقاشی 26 نقوش داشتیم، این نتایج شگفت انگیز است



Dall-E 2، Midjourney، Stable Diffusion: رونق هنر از طریق الگوریتم های یادگیری ماشینی تازه آغاز شده است. و ما نیز از این فرصت استفاده کردیم و چند اصطلاح به مدل ها زدیم. اینها نتایج است.

این واقعیت که می توان با کمی یادگیری ماشینی تصاویر فوتورئالیستی ایجاد کرد چندان جدید نیست. Thispersondoesnotexist.com چند سال پیش نشان داد که هوش مصنوعی چه توانایی هایی دارد. اکنون چند سال دیگر از توسعه فرا رسیده است که نتیجه آن این است که نه تنها چهره ها، بلکه تقریباً همه چیز را می توان اکنون توسط یک هوش مصنوعی ایجاد کرد.

ما ابزارهایی را برای ایجاد هنر هوش مصنوعی امتحان کردیم. نحوه کار آنها و دلیل اینکه در حال حاضر موضوع بحث و جدل هستند را می توانید در ویدیو پیدا کنید. می توانید برخی از نتایج ما را در صفحات زیر مشاهده کنید.

چرا این موز انسان نما از خیابان عبور کرد؟ البته برای اینکه با عینک آفتابی باحال به نظر برسید. اما روی آن لغزش نکنید!

این موتیف یکی از اولین نمونه هایی بود که امتحان کردیم. هنوز هم مشکلاتی در مورد صورت وجود دارد، دندان های صاف اغلب با Stable Diffusion زشت به نظر می رسند. از سوی دیگر، ظاهر واقعی تصویر دوم ما را شگفت زده کرد.

چرا اجازه دهید چند سگ پوکر بازی کنند وقتی که برای دو اورکا سر میز وجود دارد؟
به نظر می رسد که Stable Diffusion با تم نهنگ قاتل مشکلاتی دارد. حداقل ما واقعاً نمی‌توانیم از روی تصاویر بفهمیم که آیا این دو واقعاً در مسیر درستی قرار دارند یا خیر.

آزمایش‌های ما نشان داده‌اند که Stable Diffusion چقدر می‌تواند عکس‌های غذا را کنترل کند. ما تقریباً هیچ عکسی ندیدیم که به نوعی خوشمزه به نظر نمی رسید. ممکن است کسی فکر کند که اینترنت پر از مطالب آموزشی کافی است. با این حال، گاهی اوقات نباید خیلی دقیق نگاه کنید و سوال کنید که به کدام مواد نگاه می کنید، زیرا گاهی اوقات دیگر واقعاً قابل تشخیص نیستند.

سه عکس از اختاپوس و موز. ما در واقع می‌خواستیم عکس یکی از دوستان لغزنده‌مان را که موز را می‌جوید شرمنده کنیم، اما این اتفاق در هیچ یک از تصاویر رخ نداد. درعوض، هر دوی آنها را به شامی با نور شمع در تصویر دو فرستادیم. خوب، حداقل این چیزی است که ما فکر می کنیم در تصویر نشان داده شده است.

عکس کدوم سریال اینجا هست؟ سؤال خوبی بود! درخواست Stable Diffusion برای تصویری که می‌تواند شبیه مجموعه کمدی‌های دهه 90 باشد، کاملاً مورد توجه است. با این حال، شما نباید آپارتمان خود را توسط هوش مصنوعی راه اندازی کنید.

با استفاده از دیفیوزرها، Stable Diffusion را می توان فریب داد و تصاویری به سبکی ایجاد کرد که در ابتدا برای انجام آن آموزش ندیده بود. برای مثال، یکی از کاربران «Mo Di Diffusion» را بر اساس فیلم‌های انیمیشن کامپیوتری دیزنی آموزش داد. بنابراین ما پیش نمایشی از این که یک سری انیمیشن سه بعدی دیزنی بر اساس Tomb Raider چگونه می تواند باشد را دریافت می کنیم. این یک اشاره کوچک با پست حصار است، دیزنی، اسکوئر انیکس به تازگی مجوز Tomb Raider را با پول ارزان فروخته است.

برای کسانی که دندان شیرین دارند: در این موتیف، ما سعی کردیم به Stable Diffusion اجازه دهیم سناریویی را ایجاد کند که تا حد امکان غیر واقعی باشد. برای تصویر وسط از تابع “img2img” استفاده کردیم. در یکی دیگر از برنامه‌های ویرایش تصویر، خطوط کلی یک وافل را ترسیم کردیم و پرکننده، Stable Diffusion سپس این الگو را پر از زندگی کرد. خوشبختانه، تمام تصاویر تولید شده با این موضوع کمی غیر واقعی به نظر می رسند.

سه عکس از سگ های شاد. با این حال، در تمام عکس‌ها احساس خاصی در دره عجیب و غریب وجود دارد.

خرس قطبی واقعا چگونه یک فنجان قهوه را نگه می دارد؟ البته با دست انسانش. جدای از تصویر دوم، نتایج در نگاه اول قانع کننده است. اما در نگاه دوم، کمی تاری در اطراف بینی خرس دیده می شود.

اصطلاح «عکس‌های دایناسورها» به تنهایی کار را دشوار می‌کند، به هر حال ما از آن زمان کارت‌های تبریک عکس زیادی از Pangea دریافت نکردیم. این کار را برای هوش مصنوعی دشوارتر می کند تا عینک آفتابی را روی این موجودات که به سختی از آنها عکس گرفته شده است، قرار دهد. از این گذشته: به نظر می رسد دایناسور سمت چپ عینک ها را دوست دارد، حتی اگر آنها البته استفاده کمی داشته باشند.

این ربات ها در حال تماشای غروب خورشید از یک مزرعه هستند. به جز ربات در تصویر دوم، دو خورشید در حال برخورد با سیاره خود هستند. چنین ناسازگاری هایی از نظر واقع گرایی در انتشار پایدار بیشتر دیده می شود.

چرا فقط یک خانه شیرینی زنجفیلی بسازید در حالی که می توانید یک شهر کامل شیرینی زنجفیلی بسازید؟ با این حال، هیچ یک از تصاویر واقعاً سه بعدی نبودند و به نظر نمی‌رسد که Stable Diffusion به استفاده از آیسینگ عادت داشته باشد.

یک مشکل رایج در تصاویر: اگر سوژه ها از نظر بصری خیلی نزدیک به هم باشند، می توانند به راحتی با هم ترکیب شوند. در بسیاری از عکس های ایجاد شده، پنگوئن ها با گیتار ترکیب شده اند، مانند مثال سمت راست.

مشکل بزرگ هنر هوش مصنوعی این است که می توانید به راحتی از سبک هنرمندان دیگر تقلید کنید. برای مثال، گرافیتی سمت چپ، می‌توانست با استفاده از فرآیند استنسیل، مانند آنچه توسط هنرمند خیابانی بنکسی استفاده می‌شود، ایجاد شود. فقط این کار تولید شده با هوش مصنوعی فاقد هر گونه معنایی است. در واقع، تصویر سمت راست شبیه اثری است که ممکن است روی دیواری در برلین پیدا شود.

دیدن قبض برق این سه آقا را به درد سر می اندازد. به نظر ما، اخم کمی بیش از حد آزادانه روی این تصاویر اعمال شده است.

این خانم‌های مسن‌تر همگی به جکپات رسیده‌اند. و عکس ها حتی نیمه طبیعی به نظر می رسند. می توانید دوبار تبریک بگویید!

من همیشه خانه‌هایم را در The Sims اینگونه می‌ساختم: با استخرهای زیاد بدون نردبان و با بالکن‌های بدون نرده، زیرا بار دیگر پول کافی وجود نداشت. جدا از این واقعیت که پرسپکتیو در تصویر اول منطقی نیست، تصاویر دو و سه در واقع خانه‌هایی را نشان می‌دهند که ممکن است آنها را در یک بازی Sims پیدا کنید.

ما چند بار در این لیست “عکس حیوانات و چیزهایی که عینک می زنند” داشته ایم. با این موتیف نیز عکس های زیادی در تصاویر تولید شده وجود داشت که در آن تعداد چشم اشتباه، چندین جفت عینک یا هر دو تولید شده بود.

این مدل آنقدر با مفهوم دایناسورها در حال نواختن سازهای جاز ناآشنا بود که عکس ها در هیچ نمونه ای کار نمی کردند. به عنوان یک نقاشی رنگارنگ انتزاعی رنگ و روغن، “گروه جاز دایناسور” تفاوت زیادی ایجاد می کند. برای تصویر اول دوباره از “img2img” استفاده کردیم و طرحی از انتشار پایدار ارائه کردیم که فقط باید پر می شد.

این تنبل ها تصمیم گرفته اند بعد از کار یک آبجو خنک بخورند. اما قبل از اینکه کهنه شود عجله کنید!

بسیاری از هوش مصنوعی برای ایجاد عکس پروفایل استفاده می کنند. این پرتره ها دلیل را نشان می دهد: اگر هوش مصنوعی روی ظاهر شما تنظیم شده باشد، می توان در کمترین زمان تصاویر زیبایی ایجاد کرد. اما همین امر در اینجا نیز صدق می‌کند: یک هوش مصنوعی نمی‌تواند با بسیاری از درخواست‌های خلاقانه‌تر پاسخ دهد، بنابراین طراح گرافیکی که به آن اعتماد دارید می‌تواند این کار را انجام دهد.

موتیفی که Stable Diffusion با آن مشکلات بزرگی داشت. ظاهراً مفهوم حیوانات روی تخته موج سواری چندان رایج نیست. حداقل بیشتر حیوانات (مانند جوجه تیغی در تصویر دو) اغلب فاقد تخته موج سواری بودند.

با این نقش ما از هر دو نقاشی داخلی و بیرونی استفاده کردیم. اینها روش‌هایی برای استفاده از انتشار پایدار برای بازسازی برخی نواحی در داخل یا خارج از تصویر هستند. در نسخه اصلی، تصویر بسیار باریکتر بود، درست در کنار ربات سمت چپ متوقف شد. علاوه بر این، به جای تلفن، تجهیزات دیگری وجود داشت که – مانند مدل تلفن سمت راست – هیچ معنایی نداشت.

ما در نهایت پاسخی به این سوال داریم که اگر لئوناردو داوینچی به عنوان یک پنگوئن به دنیا می‌آمد، هنر او چگونه بود. حتی با وجود اینکه ما یک “مرد شبیه ویترووین” را در Stable Diffusion اضافه کردیم، هوش مصنوعی تنها می‌توانست با این ورودی کاری به میزان محدودی انجام دهد.

1000 سال دیگر چگونه زندگی خواهیم کرد؟ اگر زیر آب در یک گنبد شیشه ای باشد، حداقل سه پیش نویس از آنچه می تواند به نظر برسد، خواهیم داشت.

با درخواست “یک پشته پنکیک” یک سوال را باز گذاشتیم: چقدر شربت کافی است؟ پنکیک ها همیشه خوراکی به نظر می رسند.



منبع