کارتون های من در SAP Sapphire نمایش داده شد، در اینجا نحوه ساختن آنها آمده است. – بشارت بدیع

چند هفته پیش، تیم محتوا در Sapphire Orlando و بارسلونا با من تماس گرفتند و از من خواستند که در ساخت کارتون برای ارائه اصلی کریستین کلاین، مدیر عامل SAP، کمک کنم.

در مورد موضوع “تغییر” این بود که شامل دو پنل بود: در اولی رهبر از جمعیت می پرسد “چه کسی تغییر می خواهد و همه دست خود را بالا می برند و در دومی رهبر می پرسد “چه کسی تغییر می خواهد؟” دستشان پایین است

همانطور که در این سایت می بینید، من در طول سال ها کارتون های زیادی ساخته ام، عمدتاً طرح های برداری ساده با استفاده از Adobe Illustrator در مک یا Inkpad در iPad. مشکل این بود که من هنرمند خیلی خوبی نیستم و این روند بیش از آنچه باید زمان می برد، بنابراین تعداد زیادی از ایده های کارتونی داشتم که به خلق آنها نرسیدم.

و سپس ChatGPT با قابلیت ساخت کارتون تنها با چند کلیک ظاهر شد و من توانستم از آن برای ساخت کارتون سریعتر و با کیفیت هنری بهتر استفاده کنم.

می‌دانم که بسیاری از مردم احساس می‌کنند استفاده از چنین تولیدکننده‌های تصویر هوش مصنوعی غیراخلاقی است، زیرا از هنر دیگران بدون پرداخت هزینه یا تأیید استفاده می‌کند. من شخصاً دچار تعارض هستم. برای هزاران سال، هنر با الهام گرفتن از آثار هنرمندان دیگر و ترکیب مجدد آنها رشد کرده است. همانند سایر زمینه‌ها، فناوری‌های جدید اغلب ظاهر می‌شوند که همان کاری را که انسان‌ها همیشه انجام می‌دادند، انجام می‌دهند، اما اکنون آن را در مقیاس انجام می‌دهند. جامعه سود می برد، اما به هزینه تک تک صنعتگرانی که قبلاً کار را انجام می دادند.

دادگاه های مختلف در سراسر جهان با موضوع حقوق و پرداخت دست و پنجه نرم می کنند. تا کنون، آنها به طور کلی حکم داده اند که هنر تولید شده توسط هوش مصنوعی یک تغییر قانونی قابل قبول در تصاویر زیربنایی است (بر اساس تصمیماتی که به عنوان مثال، به Google اجازه می دهد تصاویر کوچک را در اختیار شما قرار دهد و تصاویر مشابهی را در طول جستجو نشان دهد). و آنها همچنین حکم داده اند که آثار هنری خلق شده قابل کپی رایت نیستند – مگر اینکه سهم انسانی قابل توجهی در اثر هنری تمام شده وجود داشته باشد (و دقیقاً چه معنایی دارد توسط دادگاه مورد بحث قرار می گیرد).

در ضمن، احساس می‌کنم بیشتر از هوش مصنوعی به‌عنوان ابزاری برای رساندن سریع‌تر به جایی که می‌خواهم استفاده می‌کنم – به نوعی مانند یک توسعه قدرتمند از برنامه‌های طراحی که قبلاً استفاده می‌کردم (محصولات Adobe این کار را مستقیماً با استفاده از Firefly خود انجام می‌دهند. موتور، بر اساس تصاویری که آنها می گویند بیشتر از نظر اخلاقی منشا گرفته شده است – اما در هنر انیمیشن بد است).

من ایده ای به ذهنم می رسد، از ChatGPT برای ارائه تصاویر احتمالی برای نشان دادن آن استفاده می کنم، بین آنها انتخاب می کنم و سپس از ترکیب برش و چسباندن و ترسیم مجدد و اضافه کردن متن برای ایجاد کارتون نهایی استفاده می کنم.

در حالی که ما منتظریم تا مرزهای قانونی و اخلاقی با وضوح بیشتری ترسیم شود، شفافیت مهم است، بنابراین در اینجا ایده ای از جریان کاری است که برای ایجاد کاریکاتور برای ارائه اصلی انجام شد.

مرحله اول: من از ChatGPT خواستم که یک انیمیشن تمام شده برای من ایجاد کند – توضیح دو پانل، ارائه متن و غیره. اما موتور تصویر فعلی در حال استفاده، DALL-E 3، در حال حاضر قادر به پیروی از دستورالعمل ها نیست (GPT-4o جدید چندوجهی است و ممکن است در صورت موجود بودن بهتر عمل کند؛ در حال حاضر فقط جنبه متنی کارها را انجام می دهد).

در اینجا برخی از نتایج وجود دارد – همانطور که می بینید، مشکلاتی در مخلوط کردن مفاهیم وجود داشت. هیچ کدوم قابل استفاده نبود

بنابراین، در عوض، از ChatGPT خواستم که چند تصویر از رهبر و جمعیت، با دستانشان بالا، ایجاد کند، و سپس از آنها خواستم که سعی کنند همان تصویر را با دستانشان پایین ایجاد کنند. این تصاویر خوبی تولید کرد، اما ثابت شد که نمی‌توان دست همه را بالا برد، و تصویر دوم هرگز آنقدر به تصویر اصلی نزدیک نشد که قابل استفاده باشد.

در نهایت متوجه شدم که باید تصویر ساده تری ایجاد کنم که بتوانم آن را با آنچه نیاز دارم دوباره ترسیم کنم. پس از ایجاد ده ها مثال مختلف، تصمیم گرفتم از این مورد استفاده کنم:

و بر این اساس، با برش، چسباندن و کشیدن بیش از حد، یک کارتون دو صفحه ای ساختم:

اما برای سخنرانی‌های اصلی کریستین کلاین، آنها می‌خواستند کارتون‌ها را در قالب گسترده‌تر و پشت سر هم نشان دهند، بنابراین پس از چند دستور جدید با استفاده از تصویر اصلی، به این تصویر ایجاد شده توسط ChatGPT رسیدم:

سپس برش دادم و چسباندم و رنگ آمیزی مجدد کردم تا این دو پانل را ایجاد کنم:

و برای سرگرمی خودم، پانل سوم و بدبینانه‌تری را اضافه کرده‌ام، که فکر می‌کنم ممکن است در بسیاری از تنظیمات (بیشتر؟) نمایش واقعی‌تری از چالش باشد:

سپس متذکر شد که این کاریکاتور به دور از فراگیری است (یعنی بسیار شبیه واقعیت بیشتر سازمان ها!).

بنابراین از ChatGPT خواستم که بلندگو را آفریقایی آمریکایی بسازد، این چیزی است که به دست آمد:

من این دو مرد و موقعیت آنها را برای ایجاد دو پانل ترکیب کردم:

و سپس من کاری مشابه برای یک میزبان زن انجام دادم. ChatGPT این را ایجاد می کند:

من این تصویر را گرفتم اما آن را با تریبون تصویر قبلی ادغام کردم، یک بینی اضافه کردم، دست را در موقعیت دوم دوباره کشیدم، لبخند را تغییر دادم و غیره. (من می‌توانستم زنان پیش‌زمینه بیشتری را به جمعیت اضافه می‌کردم، اما وقتم تمام می‌شد).

تیم کریستین با دو تیم اول رفت و آنها در هر دو بازی Sapphire Orlando و Sapphire Barcelona نشان داده شدند:

[Bonus points if you notice something “interesting” about how the images were cropped in the final presentation]

در نهایت، برای بازگشت به سوال اخلاقی: همانطور که می بینید، دخالت انسان برای ساختن کارتون های نهایی بسیار زیاد بود: انتخاب تصاویر برای استفاده. مخلوط کردن و تغییر موقعیت عناصر از تصاویر تولید شده مختلف؛ برش و چسباندن عناصر (به عنوان مثال، تکرار دست های بلند شده)؛ بزرگنمایی و رنگ آمیزی دستی اثر هنری

اما آیا این بدان معناست که تصاویر نهایی اکنون از نظر اخلاقی قابل قبول و/یا دارای حق چاپ هستند؟ من فقط نمی دانم. یک چیز واضح است: شخص دیگری که از همان روش پیروی می کند و از همان مولدهای تصویر هوش مصنوعی استفاده می کند، با انتخاب شخصی و ذهنی خود با کاریکاتور کاملاً متفاوتی روبرو می شود.

در هر صورت، مانند کارتون‌های دیگر من، و تا آنجایی که من از نظر قانونی می‌توانم به شما اجازه انجام این کار را بدهم، در صورت تمایل می‌توانید آزادانه از آن‌ها در ارائه‌های خود استفاده کنید (البته لطفاً برای من بنویسید تا بدانم چه کار می‌کنید: همیشه دیدن اینکه مردم از آنها برای چه استفاده می کنند لذت بخش است…).

دیدگاهتان را بنویسید لغو پاسخ