سرمقاله

منافع استراتژیک و دوگانگی محکومیت‌های رسمی / سعید پای بند

مشاهده کل سرمقاله ها

صفحات روزنامه

اخبار آنلاین

  • پایداری ایرانسل در حفاظت از آخرین بازماندگان یوز ایرانی
  • معرفی ۶ رسانه برتر اقتصادی ایران و جهان با رعایت اصول E-E-A-T
  • بسته ویژه ایرانسل به مناسبت روز قزوین
  • مشاهده کل اخبار آنلاین

    کد خبر: 51699  |  صفحه آخر  |  تاریخ: 11 شهریور 1404
    رقیبی برای فتوشاپ؛ گوگل مدل ویرایش تصویر Nano Banana را به جمینای اضافه کرد
    مدل جدید گوگل همان هوش مصنوعی مرموز Nano-Banana است که عملکردش در ویرایش تصویر، کاربران و کارشناسان را شگفت‌زده کرده بود. گوگل از یک ارتقا بزرگ و بسیار قدرتمند برای قابلیت ویرایش تصویر جمینای رونمایی کرد. این به‌روزرسانی که مدل پشت پرده آن Nano banana نام دارد، به کاربران کنترل بسیار دقیق‌تری در زمینه ویرایش تصاویر می‌دهد و به‌طور خاص مشکل بزرگ حفظ ثبات چهره و جزئیات سوژه را در ویرایش‌های متوالی حل می‌کند.
    براساس گزارش تک‌کرانچ، مدل جدید گوگل که نام رسمی آن Gemini 2.5 Flash Image است، پیش از معرفی رسمی، به صورت ناشناس با نام Nano-Banana در پلتفرم ارزیابی هوش مصنوعی LMArena ظاهر شده بود و با عملکرد خیره‌کننده‌اش، کاربران و کارشناسان را شگفت‌زده کرد. اکنون گوگل تأیید کرده است که این مدل تحسین‌شده، همان فناوری جدیدی است که درحال اضافه‌شدن به جمینای است.
    تمرکز اصلی این ارتقا روی حل یکی از بزرگ‌ترین مشکلات هوش مصنوعی مولد تصویر است: حفظ ثبات شخصیت. از این پس، می‌توانید یک عکس از دوستان، خانواده یا حتی حیوانات خانگی خود را ویرایش کنید و مطمئن باشید که چهره و ظاهر آن‌ها در ویرایش‌های مختلف (مانند تغییر مدل مو، لباس یا حتی کل صحنه) ثابت و واقعی باقی می‌ماند.
    علاوه‌براین، قابلیت‌های پیشرفته دیگری نیز اضافه شده است؛ کاربران می‌توانند چندین عکس را بارگذاری کنند و از هوش مصنوعی بخواهند تا آن‌ها را در یک صحنه جدید و منسجم ترکیب کند. همچنین می‌توانید سبک بصری یک تصویر (مانند الگوی یک گل) را بر روی یک شیء در تصویر دیگر اعمال کنید (مثلاً آن را به طرح یک لباس تبدیل کنید). همچنین کاربران می‌توانند به صورت متوالی و مرحله به مرحله، اجزای مختلف یک تصویر را تغییر دهند، بدون اینکه ویرایش‌های قبلی از بین برود.
    این به‌روزرسانی در بحبوحه رقابتی شدید در بازار هوش مصنوعی صورت می‌گیرد. پس از آنکه OpenAI با ابزارهای تصویرسازی خود در ChatGPT توانست کاربران زیادی را جذب کند، گوگل نیز در تلاش است با ارائه ابزارهای قدرتمندتر، این فاصله را جبران کند. درحال‌حاضر، ChatGPT بیش از ۷۰۰ میلیون کاربر هفتگی دارد، درحالی‌که جمینای ۴۵۰ میلیون کاربر ماهانه را ثبت کرده است.
    گوگل همچنین با درس‌گرفتن از مشکلات گذشته (مانند تولید تصاویر تاریخی نادرست) تدابیر ایمنی جدیدی را نیز در نظر گرفته است. تمام تصاویر تولید یا ویرایش شده با این ابزار جدید، دارای یک واترمارک قابل مشاهده و یک واترمارک نامرئی (SynthID) خواهند بود تا به راحتی از تصاویر واقعی قابل تشخیص باشند. علاوه‌براین، قوانین سخت‌گیرانه‌ای برای جلوگیری از تولید محتوای مضر، مانند تصاویر خصوصی، اعمال شده است.
    این قابلیت‌های جدید به تدریج برای تمام کاربران در اپلیکیشن جمینای و همچنین برای توسعه‌دهندگان از طریق پلتفرم‌های API گوگل در دسترس قرار می‌گیرد.