بررسی هوش مصنوعی جیبلی (Ghibli) – تبدیل عکس به انیمه
همواره یکی از علاقمندان انیمههای ژاپنی بودم و تعدادی از تولیدات شناخته شده استودیو جیبلی را از جمله شهر اشباح (Spirited Away)، همسایه من توتورو، لاپوتا قلعهای در آسمان و… را دنبال کرده و از آنها لذت بردهام. بنابراین هنگامی که هفته گذشته پس از انتشار جدیدترین مولد تصویر هوش مصنوعی OpenAI، اینترنت پر از استایل Ghibli شد به شدت هیجان زده شدم و در این نوشته احساسم را با شما درباره تریند تبدیل عکس به انیمه، در میان میگذارم.
استودیو Ghibli یک استودیوی انیمیشنسازی ژاپنیه که به خاطر ساختن انیمیشنهایی بسیار زیبا، خیالانگیز و احساسی شناخته میشه. این استودیو توسط هایائو میازاکی و ایسائو تاکاهاتا در سال 1985 تاسیس شد.
به سختی میتوان انکار کرد که توانایی ناگهانی در Ghiblify کردن هر تصویر و تبدیل عکس به انیمه، شگفت انگیز است.
شاید افرادی که به آن اعتراض کردهاند (غیر از افرادی که ارتباط نزدیکی با خود استودیو جیبلی دارند) احتمالا در ابتدا، خودشان هم تحت تاثیر قرار گرفتند.
احساس عجیبی است که بتوانید خود را به شخصیتی از دنیای انیمه تبدیل کنید که در گذشته تماشا کرده و هوادارش بوده اید.
این به نوعی مرا به یاد احساس من در کودکی می اندازد که اولین فیلم Teenage Mutant Ninja Turtles در سال 1990 اکران شد. ناگهان شخصیتهای کارتونی مورد علاقه من به موجوداتی واقعی تبدیل شدند.
اما حتی بدون فکر کردن بیش از حد به روانشناسی زیربنایی، واقعیت ها باقی میمانند:
- این واقعا لذت بخش است که خودتان را Ghiblify کنید.
- مولد تصویر جدید OpenAI بسیار چشمگیر است.
چه چیزی مولد تصویر OpenAI جدید را متفاوت میکند
جدا از عامل سرگرم کننده، سه چیز اصلی در مورد تولید کننده تصویر OpenAI جدید برای من وجود دارد. به نظر من، این فقط یک به روز رسانی ساده نیست. بلکه یک تغییر دهنده بازی است.
متن در جیبلی کار میکند
برای اولین بار از زمانی که ابزارهای تصویری هوش مصنوعی وارد اینترنت شدند، در نهایت میتوانیم تصویری تولید کنیم که متن آن حروف الفبای ناخوانا نباشد.
می توانید به ابزار جدید OpenAI دستور دهید تا متن خاصی را روی قسمت هایی از تصویر خود بنویسد و به طور کلی این کار را بدون خطا انجام می دهد. در صورت وجود خطا، جزئی و قابل رفع هستند.
و اگر از آن برای Ghiblify کردن یک تصویر (یا اعمال جلوه های دیگر) استفاده می کنید، متن موجود در تصویر آپلود شده شما را نیز دریافت می کند و بدون اینکه شما بخواهید آن را تکرار می کند.</p><h4>آگاهی متنی در جیبلی
تفاوت جالب دیگری که من با مدل های تولید تصویر قبلی متوجه شدم این است که ابزار جدید OpenAI آگاهی زمینهای را نشان میدهد.
این ابزار میتوانست تصویر را اسکن کند، مکان دقیق را به درستی شناسایی کند و بخشهای نامرئی آن را با دقت بازسازی کند. اگر من عکس واقعی را در یک روز کمتر ابری و با زاویه کمی متفاوت گرفته بودم، دقیقا به همان شکلی بود که ابزار آن را ترسیم کرده بود.
در اعمال بازخورد بسیار بهتر است
اکثر مدلهای جدید تصویر هوش مصنوعی دارای یک عملکرد بازخورد هستند که به شما امکان میدهد پس از خروجی اولیه که به شما داده میشود، آنچه را که میخواهید تغییر دهید، توضیح دهید. از تجربه شخصی این ویژگی های بازخورد می توانند به راحتی شما را به یک حلقه بی پایان از تکرارها بکشانند که در نهایت به بستن برگه خود از سر ناامیدی ختم می شود.
به نوعی تولید کننده تصویر جدید OpenAI در واقع بازخورد شما را درک نموده و آن را اعمال میکند. این همیشه کامل نیست و ممکن است هنوز چند بار تلاش کند، اما شما در نهایت به نتیجه دلخواه خود یا چیزی نزدیک به آن میرسید.
اخلاقی و قانونی بودن
توانایی یک چیز است، اما اخلاق و قانون چیزهایی کاملا جدا از هم هستند.
در حالی که احتمالا برای پیدا کردن کسی که قصد دارد با قابلیتهای مدل جدید OpenAI (و توانایی آن در Ghiblify تصاویر) مخالفت کند، کار سختی خواهید داشت، لازم نیست دور نگاه کنید تا متوجه شوید که همه نسبت به آن احساس گرم و مبهم ندارند. حداقل از همه احتمالا بنیانگذار استودیو جیبلی، هایائو میازاکی است.
اگرچه او به طور علنی برای اظهار نظر در مورد روند هوش مصنوعی جیبلی به طور خاص ظاهر نشده است، اما نام او بلافاصله با اوج گرفتن این روند ظاهر شد. منتقدان شروع به نقل قول های او در مستندی از تقریبا یک دهه پیش کردند. در این مستند، پس از نمایش یک دموی انیمیشن خام تولید شده توسط هوش مصنوعی از یک زامبی، او پاسخ داد:
کسی که این چیزها را خلق میکند نمیداند درد چیست. من کاملا منزجر هستم … شدیدا احساس می کنم که این یک توهین به خود زندگی است.
آنچه قانون می گوید
متاسفانه، نظرات شخصی و تفاسیر قانونی یکسان نیستند، به همین دلیل آلتمن به طور موثری از استفاده از سبک Ghibli در مدل های هوش مصنوعی خود دوری کنند.
مدیر عامل OpenAI حتی به نظر میرسید که مخالفان را در حساب X خود با پست کردن فقط به این دلیل که باید به این معنی نیست که میتوانید به تمسخر گرفت ؛ بازی با کلماتی که موقعیت باید و میتواند را معکوس میکند تا معنای جذابیت کلاسیک به اخلاق را تغییر دهد.
از نظر قانونی، OpenAI یک شرکت آمریکایی است که دفتر مرکزی آن در سانفرانسیسکو قرار دارد. اما در عمل، این یک غول شرکتی فراملیتی است. کاری که آنها مدل های خود را بر روی آن آموزش می دهند، از هر گوشه ای از زمین متصل به وب می آید. در سناریوهایی که یکی دیگر از نهادهای ایالات متحده از OpenAI در مورد استفاده بدون اجازه از کار خود ناراحت است و تصمیم می گیرد از آنها شکایت کند، ایجاد صلاحیت قضایی آسان است.
اما اگر به فرض یک شرکت ژاپنی مانند Studio Ghibli بخواهد از OpenAI به دلایل مشابه شکایت کند، چه؟
مگر اینکه OpenAI داراییهای قابل توجهی در ژاپن داشته باشد، اجرای حکم ژاپنی علیه یک شرکت آمریکایی چالش برانگیز خواهد بود. نه تنها این، بلکه قوانین ژاپن به هر حال حمایت کمی از آنها می کند. ماده 30-4 ژاپن به صراحت استفاده از آثار دارای حق چاپ را برای اهداف آموزشی هوش مصنوعی، حتی برای استفاده تجاری، مجاز می داند.
بنابراین اگر آنها خواهان یک نوع رجوع قانونی بودند، تنها گزینه استودیو جیبلی شکایت در دادگاه های ایالات متحده بود. این پرونده تحت قانون کپی رایت آمریکا محاکمه می شود، جایی که دو عامل اصلی در بازی وجود دارد:
در صورتی که برنامه به آثار صاحب حق نسخهبرداری دسترسی داشته باشد و خروجیهایی ایجاد کند که «به طور قابل ملاحظهای مشابه» کار موجود مالک حق نسخهبرداری باشد، هوش مصنوعی مولد به طور بالقوه میتواند قانون حق نسخهبرداری را نقض کند. اما هیچ اجماع قانونی فدرال وجود ندارد که تعیین کند چه چیزی شباهت اساسی را تشکیل می دهد.
فراتر از آن، استفاده از مطالب دارای حق چاپ برای آموزش هوش مصنوعی تحت دکترین استفاده منصفانه قرار میگیرد. این یک اصل قانونی است که استفاده محدود از مطالب دارای حق نسخه برداری را بدون اجازه تحت شرایط خاص مجاز میکند.
به طور خلاصه، این یک منطقه خاکستری قانونی است و احتمالا برای آینده قابل پیشبینی یک منطقه خاکستری قانونی باقی خواهد ماند. از نظر OpenAI، این برابر با چراغ نارنجی نیست، بلکه یک پراغ بسیار سبز است.
سرور مجازی یک ماشین مجازی کامل است که امکان انتخاب سیستم عامل و منابع را فراهم میکند.
خرید وی پی اس در پنج موقعیت جغرافیایی ایران، ترکیه، هلند، آلمان و آمریکا با قابلیت تحویل آنی در پارسدو فراهم است.
به کجا می رویم
به عنوان یک طرفدار و کاربر ابزارهای هوش مصنوعی، احساسات متفاوتی در مورد تاثیر آنها بر جامعه دارم.
برخی کارشناسان معتقدند، ما احتمالا سه تکرار با تولید تصویر تقریبا بی عیب و نقص فاصله داریم. تا آن زمان، سورای OpenAI حتی میتواند تمام کارتونهای مینی استودیو جیبلی را از چند دستور تولید کند.
معنای آن برای همه ما یک موضوع کاملا جداگانه است. اما یک چیز مسلم است: هر جا که می رویم، سریع به آنجا می رویم.
OpenAI و سایر غول های فناوری اجازه نمی دهند هیچ یک از ما از ماشین خارج شویم. همچنین ممکن است بفهمید که چگونه می توانید از سواری لذت ببرید.