تازه‌ترین آپدیت‌های AI گوگل؛ از بنانا 2 لایت تا Omni Flash

گوگل در ۲۴ ساعت گذشته چند خبر مهم برای ابزارهای هوش مصنوعی خودش منتشر کرده که نشان می‌دهد رقابت در دنیای AI فقط روی چت‌بات‌ها نیست؛ حالا میدان اصلی رقابت به سمت ساخت تصویر، تولید ویدئو، خلاصه‌سازی تصویری و تبدیل اطلاعات پیچیده به محتوای قابل فهم رفته است. مهم‌ترین تغییرات جدید گوگل شامل معرفی مدل تصویرساز Nano Banana 2 Lite، اضافه شدن قابلیت ویدئوهای عمودی کوتاه به NotebookLM و عرضه پیش‌نمایش مدل ویدئوساز Gemini Omni Flash می‌شود. این سه آپدیت در ظاهر جدا از هم هستند، اما در عمل یک پیام مشترک دارند: گوگل می‌خواهد مسیر تولید محتوا با هوش مصنوعی را سریع‌تر، ارزان‌تر و قابل استفاده‌تر کند.

تا همین چند وقت پیش، ساخت تصویر با AI برای خیلی‌ها بیشتر جنبه سرگرمی داشت و تولید ویدئو با هوش مصنوعی هم بیشتر شبیه یک قابلیت جذاب ولی دور از دسترس بود. اما آپدیت‌های جدید گوگل نشان می‌دهد این ابزارها کم‌کم دارند وارد فضای جدی‌تر تولید محتوا، آموزش، مارکتینگ، طراحی محصول و حتی ارائه‌های کاری می‌شوند. یعنی دیگر بحث فقط این نیست که یک عکس فانتزی با پرامپت بسازیم؛ بحث این است که بتوانیم از یک ایده خام، در چند دقیقه به تصویر، ویدئو، خلاصه آموزشی یا محتوای آماده انتشار برسیم.

این تغییرات مخصوصاً برای تولیدکننده‌های محتوا، دیجیتال مارکترها، طراح‌ها، مدرس‌ها، تیم‌های آموزشی و حتی کسب‌وکارهای کوچک اهمیت زیادی دارد. چون ابزارهایی که قبلاً نیاز به زمان، نیروی متخصص و هزینه بالا داشتند، حالا دارند ساده‌تر و در دسترس‌تر می‌شوند. البته هنوز همه قابلیت‌ها کاملاً عمومی یا رایگان نیستند، اما مسیر مشخص است: گوگل می‌خواهد ابزارهای هوش مصنوعی خودش را از مرحله «نمایش تکنولوژی» به مرحله «استفاده روزمره و کاربردی» برساند.

فهرست مطالب
نانو بنانا 2 لایت؛ تصویرسازی سریع‌تر و ارزان‌تر با هوش مصنوعی گوگل
قابلیت‌های جدید NotebookLM؛ تبدیل یادداشت‌ها به ویدئوهای کوتاه و قابل فهم
مدل ویدئوساز Gemini Omni Flash؛ قدم تازه گوگل برای ساخت و ویرایش ویدئو با AI
ابزارهای هوش مصنوعی گوگل با سرعت در حال تکامل

نانو بنانا 2 لایت؛ تصویرسازی سریع‌تر و ارزان‌تر با هوش مصنوعی گوگل

یکی از مهم‌ترین خبرهای جدید گوگل، معرفی مدل Nano Banana 2 Lite است؛ مدلی که گوگل آن را سریع‌ترین و کم‌هزینه‌ترین مدل تصویرساز خانواده Gemini Image معرفی کرده است. طبق توضیحات رسمی گوگل، این مدل می‌تواند در بعضی حالت‌ها تصویر را در حدود ۴ ثانیه تولید کند؛ عددی که برای کسانی که با تصویرسازی AI کار می‌کنند، خیلی مهم است. چون در کارهای واقعی، معمولاً اولین خروجی نهایی نیست و کاربر باید چندین بار پرامپت را تغییر بدهد، تصویر را اصلاح کند و نسخه‌های مختلف بگیرد تا به نتیجه دلخواه برسد.

نکته مهم درباره Nano Banana 2 Lite این است که گوگل فقط روی کیفیت خروجی مانور نداده، بلکه روی سرعت و هزینه هم تأکید کرده است. این یعنی مدل جدید بیشتر برای مرحله ایده‌پردازی، تست سریع کانسپت‌ها، ساخت طرح اولیه و تولید حجم بالایی از تصویر کاربرد دارد. برای مثال، یک طراح گرافیک می‌تواند چند مدل کاور، پوستر، تصویر محصول یا ایده بصری را خیلی سریع تست کند. یک تیم مارکتینگ هم می‌تواند قبل از اینکه وارد طراحی نهایی شود، چند مسیر خلاقانه مختلف را با هزینه کمتر بررسی کند.

نانو بنانا 2 لایت؛ تصویرسازی سریع‌تر و ارزان‌تر با هوش مصنوعی گوگل

از نظر کاربردی، این مدل می‌تواند برای ساخت تصویر مقاله، تصویر شبکه‌های اجتماعی، طرح اولیه کمپین تبلیغاتی، کانسپت محصول، مودبرد و حتی تصویرسازی آموزشی استفاده شود. جذابیت ماجرا اینجاست که اگر سرعت تولید تصویر واقعاً در استفاده عملی هم نزدیک به عدد اعلام‌شده گوگل باشد، فاصله بین «ایده به ذهنم رسید» تا «اولین خروجی تصویری را دیدم» خیلی کوتاه می‌شود. این موضوع برای تیم‌هایی که با محدودیت زمان و منابع کار می‌کنند، ارزش زیادی دارد.

البته باید به این نکته هم توجه کرد که نسخه Lite معمولاً قرار نیست جایگزین کامل مدل‌های سنگین‌تر و حرفه‌ای‌تر شود. در بیشتر خانواده‌های مدل‌های هوش مصنوعی، نسخه‌های Lite یا Flash برای سرعت، هزینه کمتر و استفاده پرتکرار طراحی می‌شوند، نه لزوماً برای سنگین‌ترین و پیچیده‌ترین پروژه‌ها. پس اگر کسی دنبال خروجی بسیار ظریف، کنترل هنری خیلی دقیق یا تصویرسازی فوق‌حرفه‌ای باشد، ممکن است همچنان به مدل‌های قوی‌تر نیاز داشته باشد. اما برای بخش بزرگی از نیازهای روزمره تولید محتوا، Nano Banana 2 Lite می‌تواند یک گزینه بسیار کاربردی باشد.

Nano Banana 2 Lite

از زاویه سئو و تولید محتوای سایت هم این آپدیت مهم است. چون خیلی از سایت‌ها و رسانه‌ها برای هر مقاله نیاز به تصویر اختصاصی دارند، اما همیشه زمان یا بودجه طراحی تصویر اختصاصی وجود ندارد. اگر این مدل بتواند تصاویر سریع، قابل قبول و متناسب با متن تولید کند، کار تولید تصویر برای مقاله‌ها، راهنماها و محتوای آموزشی ساده‌تر می‌شود. به‌خصوص برای سایت‌هایی که روزانه چندین مطلب منتشر می‌کنند، چنین ابزاری می‌تواند بخشی از فرآیند تولید محتوا را سریع‌تر کند.

قابلیت‌های جدید NotebookLM؛ تبدیل یادداشت‌ها به ویدئوهای کوتاه و قابل فهم

آپدیت مهم بعدی مربوط به NotebookLM است؛ ابزاری که گوگل ابتدا آن را بیشتر به عنوان یک دستیار تحقیق، مطالعه و خلاصه‌سازی معرفی کرده بود، اما حالا کم‌کم دارد به یک ابزار تولید محتوای آموزشی تبدیل می‌شود. قابلیت جدیدی که در ۲۴ ساعت گذشته خبرساز شده، امکان ساخت Short Video Overviews یا همان ویدئوهای عمودی کوتاه از داخل نوت‌بوک‌هاست. طبق گزارش‌ها، این قابلیت می‌تواند از منابعی مثل یادداشت‌ها، فایل‌ها، کتاب‌ها یا لینک‌های واردشده، یک ویدئوی عمودی حدوداً ۶۰ ثانیه‌ای بسازد.

ایده اصلی این قابلیت خیلی ساده اما کاربردی است: شما منابع و اطلاعات خودتان را به NotebookLM می‌دهید، بعد ابزار به جای اینکه فقط یک خلاصه متنی یا صوتی بدهد، آن را به یک ویدئوی کوتاه و قابل فهم تبدیل می‌کند. این ویدئوها می‌توانند برای توضیح مفاهیم پیچیده، مرور سریع یک موضوع، آموزش کوتاه یا حتی تولید محتوای مناسب شبکه‌های اجتماعی استفاده شوند. به زبان ساده، گوگل دارد از NotebookLM یک مسیر جدید برای تبدیل دانش خام به محتوای قابل مصرف می‌سازد.

تا قبل از این، NotebookLM بیشتر با قابلیت‌هایی مثل خلاصه‌سازی منابع، پاسخ به سؤال بر اساس فایل‌های آپلودشده و Audio Overview شناخته می‌شد. اما اضافه شدن ویدئوی عمودی کوتاه، کاربرد این ابزار را وارد فضای جدیدی می‌کند. چون امروز خیلی از کاربران، مخصوصاً در شبکه‌های اجتماعی، با ویدئوهای کوتاه راحت‌تر ارتباط می‌گیرند تا متن‌های طولانی. اگر یک مدرس، دانشجو، تولیدکننده محتوا یا مدیر آموزش بتواند از یک فایل طولانی، یک ویدئوی خلاصه بسازد، فرآیند انتقال دانش سریع‌تر و جذاب‌تر می‌شود.

طبق گزارش The Verge، این قابلیت فعلاً برای کاربران پلن‌های Google AI Pro و Ultra فعال شده و در حال حاضر محدودیت‌هایی هم دارد؛ از جمله اینکه فعلاً بیشتر روی زبان انگلیسی متمرکز است و دسترسی آن برای همه کاربران آزاد نیست. اما خود همین مسیر نشان می‌دهد گوگل برای NotebookLM برنامه جدی‌تری دارد. این ابزار دیگر فقط یک دفترچه هوشمند برای تحقیق نیست؛ دارد تبدیل می‌شود به یک استودیوی سبک تولید محتوای آموزشی.

قابلیت‌های جدید NotebookLM؛ تبدیل یادداشت‌ها به ویدئوهای کوتاه و قابل فهم

برای کاربر عادی، جذابیت NotebookLM در این است که لازم نیست حتماً متخصص تدوین، طراحی یا تولید محتوا باشد. کاربر منابعش را وارد می‌کند و ابزار سعی می‌کند از دل آن‌ها خروجی قابل فهم بسازد. البته هنوز نباید انتظار داشت خروجی این نوع ویدئوها همیشه در حد یک ویدئوی حرفه‌ای تدوین‌شده توسط انسان باشد. اما برای مرور سریع، آموزش سبک، ارائه اولیه یا تبدیل یک موضوع سخت به یک محتوای ساده‌تر، می‌تواند خیلی مفید باشد.

این قابلیت برای تیم‌های محتوا و آموزش هم اهمیت زیادی دارد. فرض کنید یک تیم آموزشی یک مقاله طولانی، جزوه، فایل PDF یا گزارش تخصصی دارد. با چنین قابلیتی می‌تواند از همان منبع، یک نسخه کوتاه ویدئویی هم بسازد؛ نسخه‌ای که برای اینستاگرام، تیک‌تاک، یوتیوب شورتز یا حتی پیام‌رسان‌ها مناسب‌تر است. این دقیقاً همان نقطه‌ای است که AI می‌تواند به جای حذف نیروی انسانی، کارهای تکراری و زمان‌بر را سبک‌تر کند و به تیم‌ها فرصت بدهد روی کیفیت پیام، سناریو و استراتژی تمرکز کنند.

مدل ویدئوساز Gemini Omni Flash؛ قدم تازه گوگل برای ساخت و ویرایش ویدئو با AI

سومین آپدیت مهم گوگل مربوط به Gemini Omni Flash است؛ مدلی که به عنوان نسخه سریع‌تر و در دسترس‌تر خانواده Gemini Omni معرفی شده و تمرکزش روی تولید و ویرایش ویدئو با هوش مصنوعی است. گوگل پیش‌تر Gemini Omni را به عنوان مدلی معرفی کرده بود که می‌تواند از ورودی‌های مختلف مثل متن، تصویر، صدا و ویدئو برای ساخت ویدئو استفاده کند. حالا نسخه Flash قرار است همین ایده را با تمرکز بیشتر روی سرعت و هزینه قابل استفاده‌تر کند.

ویژگی جذاب Gemini Omni Flash این است که فقط یک مدل «متن به ویدئو» ساده نیست. ایده اصلی این مدل، ساخت ویدئو از انواع ورودی‌ها و امکان ویرایش ویدئو از طریق گفت‌وگوست. یعنی کاربر می‌تواند یک تصویر، متن یا حتی ویدئوی کوتاه بدهد و بعد با دستورهای ساده، خروجی را تغییر دهد. مثلاً بگوید نور گرم‌تر شود، زاویه دوربین تغییر کند، محصول بیشتر در مرکز باشد یا حال و هوای ویدئو تبلیغاتی‌تر شود. این مدل از نظر کاربردی می‌تواند برای ساخت تیزر، نمونه اولیه تبلیغ، محتوای شبکه اجتماعی و ویدئوهای کوتاه محصول استفاده شود.

طبق توضیحات منتشرشده، Gemini Omni Flash فعلاً در وضعیت preview یا پیش‌نمایش قرار دارد و بیشتر برای توسعه‌دهنده‌ها و استفاده از طریق ابزارهای گوگل مثل AI Studio و API مطرح شده است. این یعنی هنوز نباید آن را یک ابزار کاملاً عمومی و بی‌نقص برای همه کاربران دانست. اما از نظر مسیر تکنولوژی، اتفاق مهمی است؛ چون گوگل دارد ساخت ویدئو را هم مثل ساخت تصویر، وارد جریان کاری سریع‌تر و تعاملی‌تر می‌کند. به جای اینکه کاربر یک پرامپت بدهد، خروجی بگیرد و از اول همه‌چیز را دوباره بسازد، می‌تواند با مدل حرف بزند و همان خروجی را مرحله‌به‌مرحله اصلاح کند.

برای کسب‌وکارها، چنین قابلیتی می‌تواند خیلی مهم باشد. امروز تولید ویدئوی تبلیغاتی، حتی در ساده‌ترین حالت، نیاز به سناریو، تصویر، تدوین، صداگذاری و اصلاحات چندباره دارد. اگر ابزارهایی مثل Gemini Omni Flash بتوانند بخشی از این مسیر را سریع‌تر کنند، برندهای کوچک هم می‌توانند با هزینه کمتر به خروجی‌های ویدئویی برسند. البته این به معنی حذف کامل تدوینگر، طراح یا تیم خلاق نیست؛ بیشتر یعنی مرحله تست ایده، ساخت نمونه اولیه و تولید نسخه‌های سریع می‌تواند با AI انجام شود.

مدل ویدئوساز Gemini Omni Flash؛ قدم تازه گوگل برای ساخت و ویرایش ویدئو با AI

از طرف دیگر، این مدل برای خالقان محتوا هم جذاب است. کسی که یک عکس محصول، یک اسکرین‌شات اپلیکیشن یا یک ایده آموزشی دارد، می‌تواند آن را به یک ویدئوی کوتاه تبدیل کند. این موضوع مخصوصاً در فضای امروز که ویدئوهای کوتاه نقش مهمی در دیده‌شدن محتوا دارند، ارزش زیادی دارد. اگر ابزارهای ویدئوساز AI به مرحله‌ای برسند که خروجی قابل استفاده و قابل ویرایش بدهند، تولید محتوای ویدئویی از یک کار پرهزینه و سنگین به یک فرآیند سریع‌تر و روزمره‌تر تبدیل می‌شود.

البته نباید از چالش‌ها هم غافل شد. تولید ویدئو با هوش مصنوعی هنوز با مسائلی مثل ثبات شخصیت‌ها، طبیعی بودن حرکت، کیفیت صدا، رعایت حقوق تصویر و امکان سوءاستفاده روبه‌روست. گوگل هم در مدل‌های تصویری و ویدئویی خودش روی موضوعاتی مثل شناسایی محتوای تولیدشده با AI و واترمارک‌های نامرئی مثل SynthID تأکید داشته است. این یعنی هرچقدر ابزارها قدرتمندتر می‌شوند، بحث شفافیت، امنیت و استفاده مسئولانه هم مهم‌تر می‌شود.

ابزارهای هوش مصنوعی گوگل با سرعت در حال تکامل

آپدیت‌های جدید گوگل را اگر جداگانه نگاه کنیم، هر کدام یک خبر جذاب در حوزه AI هستند؛ Nano Banana 2 Lite برای تولید تصویر سریع و ارزان، NotebookLM برای تبدیل منابع و یادداشت‌ها به ویدئوهای کوتاه آموزشی، و Gemini Omni Flash برای ساخت و ویرایش ویدئو با ورودی‌های مختلف. اما اگر این سه خبر را کنار هم بگذاریم، تصویر بزرگ‌تری دیده می‌شود: گوگل دارد زنجیره تولید محتوا با هوش مصنوعی را از متن و تحقیق تا تصویر و ویدئو به هم وصل می‌کند.

برای کاربران عادی، معنی این اتفاق این است که ابزارهای پیچیده تولید محتوا کم‌کم ساده‌تر می‌شوند. برای تیم‌های مارکتینگ و محتوا، یعنی می‌توان سریع‌تر ایده تست کرد، سریع‌تر خروجی گرفت و با هزینه کمتر نسخه‌های مختلف ساخت. برای مدرس‌ها و تیم‌های آموزشی، یعنی تبدیل محتوای سنگین به خروجی‌های ساده‌تر و قابل فهم‌تر آسان‌تر می‌شود. و برای توسعه‌دهنده‌ها، یعنی APIها و مدل‌های جدید گوگل می‌توانند وارد محصولات و سرویس‌های مختلف شوند.

البته هنوز این ابزارها کامل نیستند و بعضی از قابلیت‌ها محدود به پلن‌های پولی، زبان انگلیسی یا نسخه پیش‌نمایش هستند. اما روند کلی کاملاً مشخص است: گوگل می‌خواهد هوش مصنوعی را از یک ابزار کمکی ساده به یک زیرساخت جدی برای تولید محتوا، آموزش، طراحی و ارتباطات تبدیل کند. اگر تولید محتوا، آموزش، مارکتینگ یا طراحی بخشی از کار شماست، این آپدیت‌ها ارزش دنبال کردن دارند؛ چون احتمالاً در ماه‌های آینده همین قابلیت‌ها ساده‌تر، عمومی‌تر و کاربردی‌تر می‌شوند.

نویسنده : سجاد یوسفی

تاریخ انتشار 8 ساعت پیش

برچسب ها

هوش مصنوعی