بررسی هوش مصنوعی جیبلی (Ghibli) – تبدیل عکس‌ به انیمه

۱۶ فروردین ۱۴۰۴
دسته بندی ها: عمومی

همواره یکی از علاقمندان انیمه‌های ژاپنی بودم و تعدادی از تولیدات شناخته شده استودیو جیبلی را از جمله شهر اشباح (Spirited Away)، همسایه من توتورو، لاپوتا قلعه‌ای در آسمان و… را دنبال کرده‌ و از آنها لذت برده‌ام. بنابراین هنگامی که هفته گذشته پس از انتشار جدیدترین مبدل تصویر هوش مصنوعی OpenAI، اینترنت پر از استایل Ghibli شد به شدت هیجان زده شدم و در این نوشته احساسم را با شما درباره ترند تبدیل عکس‌ به انیمه، در میان می‌گذارم.

استودیو Ghibli یک استودیوی انیمیشن‌سازی ژاپنی است که به خاطر ساختن انیمیشن‌هایی بسیار زیبا، خیال‌انگیز و احساسی شناخته می‌شود. این استودیو توسط هایائو میازاکی و ایسائو تاکاهاتا در سال 1985 تاسیس شد.

به سختی می‌توان انکار کرد که توانایی ناگهانی در Ghiblify کردن هر تصویر و تبدیل عکس‌ به انیمه، شگفت انگیز است.
شاید افرادی که به آن اعتراض کرده‌اند (غیر از افرادی که ارتباط نزدیکی با خود استودیو جیبلی دارند) احتمالا در ابتدا، خودشان هم تحت تاثیر آن قرار گرفتند.
احساس عجیبی است که بتوانید خود را به شخصیتی از دنیای انیمه تبدیل کنید که در گذشته تماشا کرده و حتی هوادارش بوده‌اید.
به نوعی من را به یاد کودکی می اندازد زمانی که اولین فیلم‌های لاکپشت‌های نینجا اکران شد. با دوره‌ای کعه با برادر کوچکم، ساعت‌ها درگیر بازی در دنیای کارتونی بودیم. ناگهان شخصیت‌های کارتونی مورد علاقه من به موجوداتی واقعی تبدیل شدند.

اما حتی بدون فکر کردن بیش از حد به روانشناسی زیربنایی، دو داقعیت را نمی‌توان نادیده گرفت:

این واقعا لذت بخش است که خودتان را Ghiblify کنید.
مبدل تصویر جدید OpenAI بسیار جذاب و چشمگیر است.

چه چیزی مبدل تصویر OpenAI جدید را متفاوت می‌کند

جدا از عامل سرگرم کننده، سه چیز اصلی در مورد تولید کننده تصویر OpenAI جدید برای من وجود دارد. به نظر من، این فقط یک به روز رسانی ساده نیست. بلکه یک تغییر کلی در بازی است.

متن در جیبلی کار می‌کند

برای اولین بار از زمانی که ابزارهای تصویری هوش مصنوعی وارد اینترنت شدند، در نهایت می‌توانیم تصویری تولید کنیم که متن آن حروف الفبای ناخوانا نباشد.
می‌توانید به ابزار جدید OpenAI دستور دهید تا متن خاصی را روی قسمت هایی از تصویر خود بنویسد و به طور کلی این کار را بدون خطا انجام می‌دهد. در صورت وجود خطا، جزئی و قابل رفع هستند.
و اگر از آن برای Ghiblify کردن یک تصویر (یا اعمال جلوه های دیگر) استفاده می‌کنید، متن موجود در تصویر آپلود شده را نیز دریافت می‌کند و بدون اینکه شما بخواهید آن را تکرار می کند.

آگاهی متنی در جیبلی

تفاوت جالب دیگری که من با مدل‌های تولید تصویر قبلی متوجه شدم این است که ابزار جدید OpenAI آگاهی زمینه‌ای را نشان می‌دهد.
این ابزار می‌توانست تصویر را اسکن کند، مکان دقیق را به درستی شناسایی کند و بخش‌هایی از آن را که در کادر تصویر نیست، با دقت بازسازی کند.

در اعمال بازخورد بسیار بهتر است

اکثر مدل‌های جدید تصویر هوش مصنوعی دارای یک عملکرد بازخورد هستند که به شما امکان می‌دهد پس از خروجی اولیه که به شما داده می‌شود، آنچه را که می‌خواهید تغییر دهید، توضیح دهید. از تجربه شخصی این ویژگی‌های بازخورد می‌توانند به راحتی شما را به یک حلقه بی پایان از تکرارها بکشانند که در نهایت به بستن برگه خود از سر ناامیدی ختم می‌شود.
به نوعی تولید کننده تصویر جدید OpenAI در واقع بازخورد شما را درک نموده و آن را اعمال می‌کند. این هنوز کامل نیست و ممکن است چند بار تلاش کند، اما شما در نهایت به نتیجه دلخواه خود یا چیزی نزدیک به آن می‌رسید.

اخلاقی و قانونی بودن

توانایی یک چیز است، اما اخلاق و قانون چیزهایی کاملا جدا از هم هستند.
در حالی که احتمالا برای پیدا کردن کسی که قصد دارد با قابلیت‌های مدل جدید OpenAI (و توانایی آن در Ghiblify تصاویر) مخالفت کند، کار سختی خواهید داشت، لازم نیست دور نگاه کنید تا متوجه شوید که همه نسبت به آن احساس گرم و مبهم ندارند. قبل از همه احتمالا بنیانگذار استودیو جیبلی، هایائو میازاکی است.
اگرچه او به طور علنی در مورد ترند هوش مصنوعی جیبلی به طور خاص اظهار نظر نکرده است، اما نام او بلافاصله با اوج گرفتن این روند ظاهر شد. منتقدان شروع به نقل قول های او در مستندی از تقریبا یک دهه پیش کردند. در این مستند، پس از نمایش یک دموی انیمیشن خام تولید شده توسط هوش مصنوعی از یک زامبی، او پاسخ داد:

کسی که این چیزها را خلق می‌کند نمی‌داند درد چیست. من کاملا منزجر هستم … شدیدا احساس می‌کنم که این یک توهین به خود زندگی است.

آنچه قانون می گوید

از نظر قانونی، OpenAI یک شرکت آمریکایی است که دفتر مرکزی آن در سانفرانسیسکو قرار دارد. اما در عمل، این یک غول شرکتی فراملیتی است. کاری که آنها مدل‌های خود را بر روی آن آموزش می‌دهند، از هر گوشه ای از زمین متصل به وب می‌آید. در سناریوهایی که یکی دیگر از نهادهای ایالات متحده از OpenAI در مورد استفاده بدون اجازه از کار خود ناراحت است و تصمیم می گیرد از آنها شکایت کند، ایجاد صلاحیت قضایی آسان است.

اما اگر به فرض یک شرکت ژاپنی مانند Studio Ghibli بخواهد از OpenAI به دلایل مشابه شکایت کند، چه؟

مگر اینکه OpenAI دارایی‌های قابل توجهی در ژاپن داشته باشد، اجرای حکم ژاپنی علیه یک شرکت آمریکایی چالش برانگیز خواهد بود. نه تنها این، بلکه قوانین ژاپن به هر حال حمایت کمی از آنها می کند. ماده 30-4 ژاپن به صراحت استفاده از آثار دارای حق چاپ را برای اهداف آموزشی هوش مصنوعی، حتی برای استفاده تجاری، مجاز می‌داند.

بنابراین اگر آنها خواهان یک نوع رجوع قانونی بودند، تنها گزینه استودیو جیبلی شکایت در دادگاه های ایالات متحده بود. این پرونده تحت قانون کپی رایت آمریکا محاکمه می شود، جایی که دو عامل اصلی در بازی وجود دارد:

در صورتی که برنامه به آثار صاحب حق نسخه‌برداری دسترسی داشته باشد و خروجی‌هایی ایجاد کند که «به طور قابل ملاحظه‌ای مشابه» کار موجود مالک حق نسخه‌برداری باشد، هوش مصنوعی مولد به طور بالقوه می‌تواند قانون حق نسخه‌برداری را نقض کند. اما هیچ اجماع قانونی فدرال وجود ندارد که تعیین کند چه چیزی شباهت اساسی را تشکیل می دهد.
فراتر از آن، استفاده از مطالب دارای حق چاپ برای آموزش هوش مصنوعی تحت دکترین استفاده منصفانه قرار می‌گیرد. این یک اصل قانونی است که استفاده محدود از مطالب دارای حق نسخه برداری را بدون اجازه تحت شرایط خاص مجاز می‌کند.

به طور خلاصه، این یک منطقه خاکستری قانونی است و احتمالا برای آینده قابل پیش‌بینی یک منطقه خاکستری قانونی باقی خواهد ماند. از نظر OpenAI، این برابر با چراغ نارنجی نیست، بلکه یک چراغ سبز است.

سرور مجازی یک ماشین مجازی کامل است که امکان انتخاب سیستم عامل و منابع را فراهم می‌کند.
خرید وی پی اس در پنج موقعیت جغرافیایی ایران، ترکیه، هلند، آلمان و آمریکا با قابلیت تحویل آنی در پارسدو فراهم است.

به عنوان یک طرفدار و کاربر ابزارهای هوش مصنوعی، احساسات متفاوتی در مورد تاثیر آنها بر جامعه دارم.
برخی کارشناسان معتقدند، ما احتمالا سه تکرار با تولید تصویر تقریبا بی عیب و نقص فاصله داریم. تا آن زمان، هوش مصنوعی سورا (OpenAI’s Sora) حتی می‌تواند تمام کارتون‌های مینی استودیو جیبلی را با چند پرامپت تولید کند.

معنای آن برای همه ما یک موضوع کاملا جداگانه است. اما یک چیز مسلم است: به هر کجا که می‌رویم، سریع می‌رویم!

OpenAI و سایر غول های فناوری اجازه نمی‌دهند هیچ یک از ما از ماشین پیاده شویم شاید هر کدام از ما زمانی بفهمیم که چگونه می‌توان از سواری لذت برد.