من همیشه خانههایم را در The Sims اینگونه میساختم: با استخرهای زیاد بدون نردبان و با بالکنهای بدون نرده، زیرا بار دیگر پول کافی وجود نداشت. جدا از این واقعیت که پرسپکتیو در تصویر اول منطقی نیست، تصاویر دو و سه در واقع خانههایی را نشان میدهند که ممکن است آنها را در یک بازی Sims پیدا کنید.
برای کسانی که دندان شیرین دارند: در این موتیف، ما سعی کردیم به Stable Diffusion اجازه دهیم سناریویی را ایجاد کند که تا حد امکان غیر واقعی باشد. برای تصویر وسط از تابع “img2img” استفاده کردیم. در یکی دیگر از برنامههای ویرایش تصویر، خطوط کلی یک وافل را ترسیم کردیم و پرکننده، Stable Diffusion سپس این الگو را پر از زندگی کرد. خوشبختانه، تمام تصاویر تولید شده با این موضوع کمی غیر واقعی به نظر می رسند.
خرس قطبی واقعا چگونه یک فنجان قهوه را نگه می دارد؟ البته با دست انسانش. جدای از تصویر دوم، نتایج در نگاه اول قانع کننده است. اما در نگاه دوم، کمی تاری در اطراف بینی خرس دیده می شود.
ما ابزارهایی را برای ایجاد هنر هوش مصنوعی امتحان کردیم. نحوه کار آنها و دلیل اینکه در حال حاضر موضوع بحث و جدل هستند را می توانید در ویدیو پیدا کنید. می توانید برخی از نتایج ما را در صفحات زیر مشاهده کنید.
یک مشکل رایج در تصاویر: اگر سوژه ها از نظر بصری خیلی نزدیک به هم باشند، می توانند به راحتی با هم ترکیب شوند. در بسیاری از عکس های ایجاد شده، پنگوئن ها با گیتار ترکیب شده اند، مانند مثال سمت راست.
این موتیف یکی از اولین نمونه هایی بود که امتحان کردیم. هنوز هم مشکلاتی در مورد صورت وجود دارد، دندان های صاف اغلب با Stable Diffusion زشت به نظر می رسند. از سوی دیگر، ظاهر واقعی تصویر دوم ما را شگفت زده کرد.
سه عکس از اختاپوس و موز. ما در واقع میخواستیم عکس یکی از دوستان لغزندهمان را که موز را میجوید شرمنده کنیم، اما این اتفاق در هیچ یک از تصاویر رخ نداد. درعوض، هر دوی آنها را به شامی با نور شمع در تصویر دو فرستادیم. خوب، حداقل این چیزی است که ما فکر می کنیم در تصویر نشان داده شده است.
ما در نهایت پاسخی به این سوال داریم که اگر لئوناردو داوینچی به عنوان یک پنگوئن به دنیا میآمد، هنر او چگونه بود. حتی با وجود اینکه ما یک “مرد شبیه ویترووین” را در Stable Diffusion اضافه کردیم، هوش مصنوعی تنها میتوانست با این ورودی کاری به میزان محدودی انجام دهد.
1000 سال دیگر چگونه زندگی خواهیم کرد؟ اگر زیر آب در یک گنبد شیشه ای باشد، حداقل سه پیش نویس از آنچه می تواند به نظر برسد، خواهیم داشت.
چرا فقط یک خانه شیرینی زنجفیلی بسازید در حالی که می توانید یک شهر کامل شیرینی زنجفیلی بسازید؟ با این حال، هیچ یک از تصاویر واقعاً سه بعدی نبودند و به نظر نمیرسد که Stable Diffusion به استفاده از آیسینگ عادت داشته باشد.
اصطلاح «عکسهای دایناسورها» به تنهایی کار را دشوار میکند، به هر حال ما از آن زمان کارتهای تبریک عکس زیادی از Pangea دریافت نکردیم. این کار را برای هوش مصنوعی دشوارتر می کند تا عینک آفتابی را روی این موجودات که به سختی از آنها عکس گرفته شده است، قرار دهد. از این گذشته: به نظر می رسد دایناسور سمت چپ عینک ها را دوست دارد، حتی اگر آنها البته استفاده کمی داشته باشند.
دیدن قبض برق این سه آقا را به درد سر می اندازد. به نظر ما، اخم کمی بیش از حد آزادانه روی این تصاویر اعمال شده است.
Dall-E 2، Midjourney، Stable Diffusion: رونق هنر از طریق الگوریتم های یادگیری ماشینی تازه آغاز شده است. و ما نیز از این فرصت استفاده کردیم و چند اصطلاح به مدل ها زدیم. اینها نتایج است.
مشکل بزرگ هنر هوش مصنوعی این است که می توانید به راحتی از سبک هنرمندان دیگر تقلید کنید. برای مثال، گرافیتی سمت چپ، میتوانست با استفاده از فرآیند استنسیل، مانند آنچه توسط هنرمند خیابانی بنکسی استفاده میشود، ایجاد شود. فقط این کار تولید شده با هوش مصنوعی فاقد هر گونه معنایی است. در واقع، تصویر سمت راست شبیه اثری است که ممکن است روی دیواری در برلین پیدا شود.
بسیاری از هوش مصنوعی برای ایجاد عکس پروفایل استفاده می کنند. این پرتره ها دلیل را نشان می دهد: اگر هوش مصنوعی روی ظاهر شما تنظیم شده باشد، می توان در کمترین زمان تصاویر زیبایی ایجاد کرد. اما همین امر در اینجا نیز صدق میکند: یک هوش مصنوعی نمیتواند با بسیاری از درخواستهای خلاقانهتر پاسخ دهد، بنابراین طراح گرافیکی که به آن اعتماد دارید میتواند این کار را انجام دهد.
چرا اجازه دهید چند سگ پوکر بازی کنند وقتی که برای دو اورکا سر میز وجود دارد؟
به نظر می رسد که Stable Diffusion با تم نهنگ قاتل مشکلاتی دارد. حداقل ما واقعاً نمیتوانیم از روی تصاویر بفهمیم که آیا این دو واقعاً در مسیر درستی قرار دارند یا خیر.
ما چند بار در این لیست “عکس حیوانات و چیزهایی که عینک می زنند” داشته ایم. با این موتیف نیز عکس های زیادی در تصاویر تولید شده وجود داشت که در آن تعداد چشم اشتباه، چندین جفت عینک یا هر دو تولید شده بود.
آزمایشهای ما نشان دادهاند که Stable Diffusion چقدر میتواند عکسهای غذا را کنترل کند. ما تقریباً هیچ عکسی ندیدیم که به نوعی خوشمزه به نظر نمی رسید. ممکن است کسی فکر کند که اینترنت پر از مطالب آموزشی کافی است. با این حال، گاهی اوقات نباید خیلی دقیق نگاه کنید و سوال کنید که به کدام مواد نگاه می کنید، زیرا گاهی اوقات دیگر واقعاً قابل تشخیص نیستند.
این تنبل ها تصمیم گرفته اند بعد از کار یک آبجو خنک بخورند. اما قبل از اینکه کهنه شود عجله کنید!
این واقعیت که می توان با کمی یادگیری ماشینی تصاویر فوتورئالیستی ایجاد کرد چندان جدید نیست. Thispersondoesnotexist.com چند سال پیش نشان داد که هوش مصنوعی چه توانایی هایی دارد. اکنون چند سال دیگر از توسعه فرا رسیده است که نتیجه آن این است که نه تنها چهره ها، بلکه تقریباً همه چیز را می توان اکنون توسط یک هوش مصنوعی ایجاد کرد.
سه عکس از سگ های شاد. با این حال، در تمام عکسها احساس خاصی در دره عجیب و غریب وجود دارد.
موتیفی که Stable Diffusion با آن مشکلات بزرگی داشت. ظاهراً مفهوم حیوانات روی تخته موج سواری چندان رایج نیست. حداقل بیشتر حیوانات (مانند جوجه تیغی در تصویر دو) اغلب فاقد تخته موج سواری بودند.
چرا این موز انسان نما از خیابان عبور کرد؟ البته برای اینکه با عینک آفتابی باحال به نظر برسید. اما روی آن لغزش نکنید!
عکس کدوم سریال اینجا هست؟ سؤال خوبی بود! درخواست Stable Diffusion برای تصویری که میتواند شبیه مجموعه کمدیهای دهه 90 باشد، کاملاً مورد توجه است. با این حال، شما نباید آپارتمان خود را توسط هوش مصنوعی راه اندازی کنید.
با استفاده از دیفیوزرها، Stable Diffusion را می توان فریب داد و تصاویری به سبکی ایجاد کرد که در ابتدا برای انجام آن آموزش ندیده بود. برای مثال، یکی از کاربران «Mo Di Diffusion» را بر اساس فیلمهای انیمیشن کامپیوتری دیزنی آموزش داد. بنابراین ما پیش نمایشی از این که یک سری انیمیشن سه بعدی دیزنی بر اساس Tomb Raider چگونه می تواند باشد را دریافت می کنیم. این یک اشاره کوچک با پست حصار است، دیزنی، اسکوئر انیکس به تازگی مجوز Tomb Raider را با پول ارزان فروخته است.
این خانمهای مسنتر همگی به جکپات رسیدهاند. و عکس ها حتی نیمه طبیعی به نظر می رسند. می توانید دوبار تبریک بگویید!
این ربات ها در حال تماشای غروب خورشید از یک مزرعه هستند. به جز ربات در تصویر دوم، دو خورشید در حال برخورد با سیاره خود هستند. چنین ناسازگاری هایی از نظر واقع گرایی در انتشار پایدار بیشتر دیده می شود.
این مدل آنقدر با مفهوم دایناسورها در حال نواختن سازهای جاز ناآشنا بود که عکس ها در هیچ نمونه ای کار نمی کردند. به عنوان یک نقاشی رنگارنگ انتزاعی رنگ و روغن، “گروه جاز دایناسور” تفاوت زیادی ایجاد می کند. برای تصویر اول دوباره از “img2img” استفاده کردیم و طرحی از انتشار پایدار ارائه کردیم که فقط باید پر می شد.
با درخواست “یک پشته پنکیک” یک سوال را باز گذاشتیم: چقدر شربت کافی است؟ پنکیک ها همیشه خوراکی به نظر می رسند.
با این نقش ما از هر دو نقاشی داخلی و بیرونی استفاده کردیم. اینها روشهایی برای استفاده از انتشار پایدار برای بازسازی برخی نواحی در داخل یا خارج از تصویر هستند. در نسخه اصلی، تصویر بسیار باریکتر بود، درست در کنار ربات سمت چپ متوقف شد. علاوه بر این، به جای تلفن، تجهیزات دیگری وجود داشت که – مانند مدل تلفن سمت راست – هیچ معنایی نداشت.