چند هفته پیش، تیم محتوا در Sapphire Orlando و بارسلونا با من تماس گرفتند و از من خواستند که در ساخت کارتون برای ارائه اصلی کریستین کلاین، مدیر عامل SAP، کمک کنم.
در مورد موضوع “تغییر” این بود که شامل دو پنل بود: در اولی رهبر از جمعیت می پرسد “چه کسی تغییر می خواهد و همه دست خود را بالا می برند و در دومی رهبر می پرسد “چه کسی تغییر می خواهد؟” دستشان پایین است
همانطور که در این سایت می بینید، من در طول سال ها کارتون های زیادی ساخته ام، عمدتاً طرح های برداری ساده با استفاده از Adobe Illustrator در مک یا Inkpad در iPad. مشکل این بود که من هنرمند خیلی خوبی نیستم و این روند بیش از آنچه باید زمان می برد، بنابراین تعداد زیادی از ایده های کارتونی داشتم که به خلق آنها نرسیدم.
و سپس ChatGPT با قابلیت ساخت کارتون تنها با چند کلیک ظاهر شد و من توانستم از آن برای ساخت کارتون سریعتر و با کیفیت هنری بهتر استفاده کنم.
میدانم که بسیاری از مردم احساس میکنند استفاده از چنین تولیدکنندههای تصویر هوش مصنوعی غیراخلاقی است، زیرا از هنر دیگران بدون پرداخت هزینه یا تأیید استفاده میکند. من شخصاً دچار تعارض هستم. برای هزاران سال، هنر با الهام گرفتن از آثار هنرمندان دیگر و ترکیب مجدد آنها رشد کرده است. همانند سایر زمینهها، فناوریهای جدید اغلب ظاهر میشوند که همان کاری را که انسانها همیشه انجام میدادند، انجام میدهند، اما اکنون آن را در مقیاس انجام میدهند. جامعه سود می برد، اما به هزینه تک تک صنعتگرانی که قبلاً کار را انجام می دادند.
دادگاه های مختلف در سراسر جهان با موضوع حقوق و پرداخت دست و پنجه نرم می کنند. تا کنون، آنها به طور کلی حکم داده اند که هنر تولید شده توسط هوش مصنوعی یک تغییر قانونی قابل قبول در تصاویر زیربنایی است (بر اساس تصمیماتی که به عنوان مثال، به Google اجازه می دهد تصاویر کوچک را در اختیار شما قرار دهد و تصاویر مشابهی را در طول جستجو نشان دهد). و آنها همچنین حکم داده اند که آثار هنری خلق شده قابل کپی رایت نیستند – مگر اینکه سهم انسانی قابل توجهی در اثر هنری تمام شده وجود داشته باشد (و دقیقاً چه معنایی دارد توسط دادگاه مورد بحث قرار می گیرد).
در ضمن، احساس میکنم بیشتر از هوش مصنوعی بهعنوان ابزاری برای رساندن سریعتر به جایی که میخواهم استفاده میکنم – به نوعی مانند یک توسعه قدرتمند از برنامههای طراحی که قبلاً استفاده میکردم (محصولات Adobe این کار را مستقیماً با استفاده از Firefly خود انجام میدهند. موتور، بر اساس تصاویری که آنها می گویند بیشتر از نظر اخلاقی منشا گرفته شده است – اما در هنر انیمیشن بد است).
من ایده ای به ذهنم می رسد، از ChatGPT برای ارائه تصاویر احتمالی برای نشان دادن آن استفاده می کنم، بین آنها انتخاب می کنم و سپس از ترکیب برش و چسباندن و ترسیم مجدد و اضافه کردن متن برای ایجاد کارتون نهایی استفاده می کنم.
در حالی که ما منتظریم تا مرزهای قانونی و اخلاقی با وضوح بیشتری ترسیم شود، شفافیت مهم است، بنابراین در اینجا ایده ای از جریان کاری است که برای ایجاد کاریکاتور برای ارائه اصلی انجام شد.
مرحله اول: من از ChatGPT خواستم که یک انیمیشن تمام شده برای من ایجاد کند – توضیح دو پانل، ارائه متن و غیره. اما موتور تصویر فعلی در حال استفاده، DALL-E 3، در حال حاضر قادر به پیروی از دستورالعمل ها نیست (GPT-4o جدید چندوجهی است و ممکن است در صورت موجود بودن بهتر عمل کند؛ در حال حاضر فقط جنبه متنی کارها را انجام می دهد).
در اینجا برخی از نتایج وجود دارد – همانطور که می بینید، مشکلاتی در مخلوط کردن مفاهیم وجود داشت. هیچ کدوم قابل استفاده نبود
بنابراین، در عوض، از ChatGPT خواستم که چند تصویر از رهبر و جمعیت، با دستانشان بالا، ایجاد کند، و سپس از آنها خواستم که سعی کنند همان تصویر را با دستانشان پایین ایجاد کنند. این تصاویر خوبی تولید کرد، اما ثابت شد که نمیتوان دست همه را بالا برد، و تصویر دوم هرگز آنقدر به تصویر اصلی نزدیک نشد که قابل استفاده باشد.
در نهایت متوجه شدم که باید تصویر ساده تری ایجاد کنم که بتوانم آن را با آنچه نیاز دارم دوباره ترسیم کنم. پس از ایجاد ده ها مثال مختلف، تصمیم گرفتم از این مورد استفاده کنم:
و بر این اساس، با برش، چسباندن و کشیدن بیش از حد، یک کارتون دو صفحه ای ساختم:
اما برای سخنرانیهای اصلی کریستین کلاین، آنها میخواستند کارتونها را در قالب گستردهتر و پشت سر هم نشان دهند، بنابراین پس از چند دستور جدید با استفاده از تصویر اصلی، به این تصویر ایجاد شده توسط ChatGPT رسیدم:
سپس برش دادم و چسباندم و رنگ آمیزی مجدد کردم تا این دو پانل را ایجاد کنم:
و برای سرگرمی خودم، پانل سوم و بدبینانهتری را اضافه کردهام، که فکر میکنم ممکن است در بسیاری از تنظیمات (بیشتر؟) نمایش واقعیتری از چالش باشد:
سپس متذکر شد که این کاریکاتور به دور از فراگیری است (یعنی بسیار شبیه واقعیت بیشتر سازمان ها!).
بنابراین از ChatGPT خواستم که بلندگو را آفریقایی آمریکایی بسازد، این چیزی است که به دست آمد:
من این دو مرد و موقعیت آنها را برای ایجاد دو پانل ترکیب کردم:
و سپس من کاری مشابه برای یک میزبان زن انجام دادم. ChatGPT این را ایجاد می کند:
من این تصویر را گرفتم اما آن را با تریبون تصویر قبلی ادغام کردم، یک بینی اضافه کردم، دست را در موقعیت دوم دوباره کشیدم، لبخند را تغییر دادم و غیره. (من میتوانستم زنان پیشزمینه بیشتری را به جمعیت اضافه میکردم، اما وقتم تمام میشد).
تیم کریستین با دو تیم اول رفت و آنها در هر دو بازی Sapphire Orlando و Sapphire Barcelona نشان داده شدند:
[Bonus points if you notice something “interesting” about how the images were cropped in the final presentation]
در نهایت، برای بازگشت به سوال اخلاقی: همانطور که می بینید، دخالت انسان برای ساختن کارتون های نهایی بسیار زیاد بود: انتخاب تصاویر برای استفاده. مخلوط کردن و تغییر موقعیت عناصر از تصاویر تولید شده مختلف؛ برش و چسباندن عناصر (به عنوان مثال، تکرار دست های بلند شده)؛ بزرگنمایی و رنگ آمیزی دستی اثر هنری
اما آیا این بدان معناست که تصاویر نهایی اکنون از نظر اخلاقی قابل قبول و/یا دارای حق چاپ هستند؟ من فقط نمی دانم. یک چیز واضح است: شخص دیگری که از همان روش پیروی می کند و از همان مولدهای تصویر هوش مصنوعی استفاده می کند، با انتخاب شخصی و ذهنی خود با کاریکاتور کاملاً متفاوتی روبرو می شود.
در هر صورت، مانند کارتونهای دیگر من، و تا آنجایی که من از نظر قانونی میتوانم به شما اجازه انجام این کار را بدهم، در صورت تمایل میتوانید آزادانه از آنها در ارائههای خود استفاده کنید (البته لطفاً برای من بنویسید تا بدانم چه کار میکنید: همیشه دیدن اینکه مردم از آنها برای چه استفاده می کنند لذت بخش است…).