بررسی هوش مصنوعی جیبلی (Ghibli) – تبدیل عکس‌ به انیمه

جیبلی

همواره یکی از علاقمندان انیمه‌های ژاپنی بودم و تعدادی از تولیدات شناخته شده استودیو جیبلی را از جمله شهر اشباح (Spirited Away)، همسایه من توتورو، لاپوتا قلعه‌ای در آسمان و… را دنبال کرده‌ و از آنها لذت برده‌ام. بنابراین هنگامی که هفته گذشته پس از انتشار جدیدترین مولد تصویر هوش مصنوعی OpenAI، اینترنت پر از استایل Ghibli شد به شدت هیجان زده شدم و در این نوشته احساسم را با شما درباره تریند تبدیل عکس‌ به انیمه، در میان می‌گذارم.

استودیو Ghibli یک استودیوی انیمیشن‌سازی ژاپنیه که به خاطر ساختن انیمیشن‌هایی بسیار زیبا، خیال‌انگیز و احساسی شناخته می‌شه. این استودیو توسط هایائو میازاکی و ایسائو تاکاهاتا در سال ۱۹۸۵ تاسیس شد.

به سختی می‌توان انکار کرد که توانایی ناگهانی در Ghiblify کردن هر تصویر و تبدیل عکس‌ به انیمه، شگفت انگیز است.
شاید افرادی که به آن اعتراض کرده‌اند (غیر از افرادی که ارتباط نزدیکی با خود استودیو جیبلی دارند) احتمالا در ابتدا، خودشان هم تحت تاثیر قرار گرفتند.
احساس عجیبی است که بتوانید خود را به شخصیتی از دنیای انیمه تبدیل کنید که در گذشته تماشا کرده و هوادارش بوده اید.
این به نوعی مرا به یاد احساس من در کودکی می اندازد که اولین فیلم Teenage Mutant Ninja Turtles در سال ۱۹۹۰ اکران شد. ناگهان شخصیت‌های کارتونی مورد علاقه من به موجوداتی واقعی تبدیل شدند.

اما حتی بدون فکر کردن بیش از حد به روانشناسی زیربنایی، واقعیت ها باقی می‌مانند:

  • این واقعا لذت بخش است که خودتان را Ghiblify کنید.
  • مولد تصویر جدید OpenAI بسیار چشمگیر است.

چه چیزی مولد تصویر OpenAI جدید را متفاوت می‌کند

جدا از عامل سرگرم کننده، سه چیز اصلی در مورد تولید کننده تصویر OpenAI جدید برای من وجود دارد. به نظر من، این فقط یک به روز رسانی ساده نیست. بلکه یک تغییر دهنده بازی است.

جیبلی در هوش مصنوعی

متن در جیبلی کار می‌کند

برای اولین بار از زمانی که ابزارهای تصویری هوش مصنوعی وارد اینترنت شدند، در نهایت می‌توانیم تصویری تولید کنیم که متن آن حروف الفبای ناخوانا نباشد.
می توانید به ابزار جدید OpenAI دستور دهید تا متن خاصی را روی قسمت هایی از تصویر خود بنویسد و به طور کلی این کار را بدون خطا انجام می دهد. در صورت وجود خطا، جزئی و قابل رفع هستند.
و اگر از آن برای Ghiblify کردن یک تصویر (یا اعمال جلوه های دیگر) استفاده می کنید، متن موجود در تصویر آپلود شده شما را نیز دریافت می کند و بدون اینکه شما بخواهید آن را تکرار می کند.</p><h4>آگاهی متنی در جیبلی

تفاوت جالب دیگری که من با مدل های تولید تصویر قبلی متوجه شدم این است که ابزار جدید OpenAI آگاهی زمینه‌ای را نشان می‌دهد.
این ابزار می‌توانست تصویر را اسکن کند، مکان دقیق را به درستی شناسایی کند و بخش‌های نامرئی آن را با دقت بازسازی کند. اگر من عکس واقعی را در یک روز کمتر ابری و با زاویه کمی متفاوت گرفته بودم، دقیقا به همان شکلی بود که ابزار آن را ترسیم کرده بود.

در اعمال بازخورد بسیار بهتر است

اکثر مدل‌های جدید تصویر هوش مصنوعی دارای یک عملکرد بازخورد هستند که به شما امکان می‌دهد پس از خروجی اولیه که به شما داده می‌شود، آنچه را که می‌خواهید تغییر دهید، توضیح دهید. از تجربه شخصی این ویژگی های بازخورد می توانند به راحتی شما را به یک حلقه بی پایان از تکرارها بکشانند که در نهایت به بستن برگه خود از سر ناامیدی ختم می شود.
به نوعی تولید کننده تصویر جدید OpenAI در واقع بازخورد شما را درک نموده و آن را اعمال می‌کند. این همیشه کامل نیست و ممکن است هنوز چند بار تلاش کند، اما شما در نهایت به نتیجه دلخواه خود یا چیزی نزدیک به آن می‌رسید.

اخلاقی و قانونی بودن

توانایی یک چیز است، اما اخلاق و قانون چیزهایی کاملا جدا از هم هستند.
در حالی که احتمالا برای پیدا کردن کسی که قصد دارد با قابلیت‌های مدل جدید OpenAI (و توانایی آن در Ghiblify تصاویر) مخالفت کند، کار سختی خواهید داشت، لازم نیست دور نگاه کنید تا متوجه شوید که همه نسبت به آن احساس گرم و مبهم ندارند. حداقل از همه احتمالا بنیانگذار استودیو جیبلی، هایائو میازاکی است.
اگرچه او به طور علنی برای اظهار نظر در مورد روند هوش مصنوعی جیبلی به طور خاص ظاهر نشده است، اما نام او بلافاصله با اوج گرفتن این روند ظاهر شد. منتقدان شروع به نقل قول های او در مستندی از تقریبا یک دهه پیش کردند. در این مستند، پس از نمایش یک دموی انیمیشن خام تولید شده توسط هوش مصنوعی از یک زامبی، او پاسخ داد:

کسی که این چیزها را خلق می‌کند نمی‌داند درد چیست. من کاملا منزجر هستم … شدیدا احساس می کنم که این یک توهین به خود زندگی است.

 

آنچه قانون می گوید

متاسفانه، نظرات شخصی و تفاسیر قانونی یکسان نیستند، به همین دلیل آلتمن به طور موثری از استفاده از سبک Ghibli در مدل های هوش مصنوعی خود دوری کنند.

مدیر عامل OpenAI حتی به نظر می‌رسید که مخالفان را در حساب X خود با پست کردن فقط به این دلیل که باید به این معنی نیست که می‌توانید به تمسخر گرفت ؛ بازی با کلماتی که موقعیت باید و می‌تواند را معکوس می‌کند تا معنای جذابیت کلاسیک به اخلاق را تغییر دهد.

از نظر قانونی، OpenAI یک شرکت آمریکایی است که دفتر مرکزی آن در سانفرانسیسکو قرار دارد. اما در عمل، این یک غول شرکتی فراملیتی است. کاری که آنها مدل های خود را بر روی آن آموزش می دهند، از هر گوشه ای از زمین متصل به وب می آید. در سناریوهایی که یکی دیگر از نهادهای ایالات متحده از OpenAI در مورد استفاده بدون اجازه از کار خود ناراحت است و تصمیم می گیرد از آنها شکایت کند، ایجاد صلاحیت قضایی آسان است.

اما اگر به فرض یک شرکت ژاپنی مانند Studio Ghibli بخواهد از OpenAI به دلایل مشابه شکایت کند، چه؟

مگر اینکه OpenAI دارایی‌های قابل توجهی در ژاپن داشته باشد، اجرای حکم ژاپنی علیه یک شرکت آمریکایی چالش برانگیز خواهد بود. نه تنها این، بلکه قوانین ژاپن به هر حال حمایت کمی از آنها می کند. ماده ۳۰-۴ ژاپن به صراحت استفاده از آثار دارای حق چاپ را برای اهداف آموزشی هوش مصنوعی، حتی برای استفاده تجاری، مجاز می داند.

بنابراین اگر آنها خواهان یک نوع رجوع قانونی بودند، تنها گزینه استودیو جیبلی شکایت در دادگاه های ایالات متحده بود. این پرونده تحت قانون کپی رایت آمریکا محاکمه می شود، جایی که دو عامل اصلی در بازی وجود دارد:

در صورتی که برنامه به آثار صاحب حق نسخه‌برداری دسترسی داشته باشد و خروجی‌هایی ایجاد کند که «به طور قابل ملاحظه‌ای مشابه» کار موجود مالک حق نسخه‌برداری باشد، هوش مصنوعی مولد به طور بالقوه می‌تواند قانون حق نسخه‌برداری را نقض کند. اما  هیچ اجماع قانونی فدرال وجود ندارد که تعیین کند چه چیزی شباهت اساسی را تشکیل می دهد.
فراتر از آن، استفاده از مطالب دارای حق چاپ برای آموزش هوش مصنوعی تحت دکترین استفاده منصفانه قرار می‌گیرد. این یک اصل قانونی است که استفاده محدود از مطالب دارای حق نسخه برداری را بدون اجازه تحت شرایط خاص مجاز می‌کند.

به طور خلاصه، این یک منطقه خاکستری قانونی است و احتمالا برای آینده قابل پیش‌بینی یک منطقه خاکستری قانونی باقی خواهد ماند. از نظر OpenAI، این برابر با چراغ نارنجی نیست، بلکه یک پراغ بسیار سبز است.

سرور مجازی یک ماشین مجازی کامل است که امکان انتخاب سیستم عامل و منابع را فراهم می‌کند.
خرید وی پی اس در پنج موقعیت جغرافیایی ایران، ترکیه، هلند، آلمان و آمریکا با قابلیت تحویل آنی در پارسدو فراهم است.

به کجا می رویم

به عنوان یک طرفدار و کاربر ابزارهای هوش مصنوعی، احساسات متفاوتی در مورد تاثیر آنها بر جامعه دارم.
برخی کارشناسان معتقدند، ما احتمالا سه تکرار با تولید تصویر تقریبا بی عیب و نقص فاصله داریم. تا آن زمان، سورای OpenAI حتی می‌تواند تمام کارتون‌های مینی استودیو جیبلی را از چند دستور تولید کند.

معنای آن برای همه ما یک موضوع کاملا جداگانه است. اما یک چیز مسلم است: هر جا که می رویم، سریع به آنجا می رویم.

OpenAI و سایر غول های فناوری اجازه نمی دهند هیچ یک از ما از ماشین خارج شویم. همچنین ممکن است بفهمید که چگونه می توانید از سواری لذت ببرید.