هوش مصنوعی بدون نیاز به اینترنت: گالری AI Edge از گوگل توانمندی‌های جدید را به موبایل‌ها آورد

به گزارش مالی3، گوگل به تازگی یک برنامه جدید را منتشر کرده که تا کنون کسی درخواست آن را نکرده است، اما علاقه‌مندان به طراحی وب و تکنولوژی به آن علاقه‌مندند و می‌خواهند این برنامه را امتحان کنند.

گالری AI Edge، که باهوش ترین گالری بر روی تمام تلفن های هوشمند است، در تاریخ 31 مه راه اندازی شد. این گالری بدون نیاز به اتصال به اینترنت و به اشتراک گذاری داده های شما با سرورهای بزرگ فناوری (Big Tech)، هوش مصنوعی را مستقیماً روی تلفن هوشمند شما اجرا می کند.

یک برنامه آزمایشی با مجوز Apache 2.0 منتشر شده است که به هر کسی این امکان را می‌دهد تا از آن برای هر مقصدی استفاده کند. این برنامه ابتدا برای سیستم عامل Android در GitHub منتشر شده است و نسخه iOS آن نیز به زودی عرضه خواهد شد.

مدل‌هایی مانند Google’s Gemma 3N کاملاً بدون نیاز به اینترنت (آفلاین) عمل می‌کنند. این مدل‌ها توانایی انجام تمام عملکردهای خود را از تجزیه و تحلیل تصاویر تا نوشتن کد را با استفاده از سخت‌افزار تلفن شما فراهم می‌کنند.

و به طرز شگفت‌آور خوب است.

این برنامه در حال حاضر بر روی توسعه دهندگان متمرکز شده است و شامل سه ویژگی اصلی است: چتبات هوش مصنوعی برای مکالمات، درخواست تصویر برای تجزیه و تحلیل بصری، و آزمایشگاه سریع برای کارهای تک نوبت مانند بازنویسی متن.

اشخاص قادرند مدل‌هایی را از پلتفرم‌هایی مانند Hugging Face دانلود کنند. ولی باید به این نکته توجه داشت که این امکان فقط برای برخی مدل‌های خاص مانند GEMMA-3N-E2B و QWEN2.5-1.5 b ممکن است.

کاربران Reddit بلافاصله از تازگی برنامه سؤال کردند و آن را با راه حل های موجود مانند PocketPal مقایسه کردند.

بعضی افراد نگرانی های امنیتی برای برنامه‌هایی که در GitHub رسمی آپلود شده اند بیان کردند. آن‌ها اعتقاد داشتند که میزبان‌های این برنامه ها در GitHub ادعاهای تقلبی مبنی بر اینکه آن‌ها هویت واقعی نیستند دارند. تا به حال هیچ مدرکی ارائه نشده که نشان دهد برنامه‌های مذکور دارای بدافزار یا نرم افزار مخرب هستند.

ما یک آزمایش انجام دادیم با استفاده از یک Samsung Galaxy S24 Ultra و دو مدل بزرگترین و کوچکترین Gemma 3 را برای آن دانلود کردیم.

هر مدل هوش مصنوعی یک فایل داده خاص دارد که تمام اطلاعات و دانشی که در طول آموزش به دست آمده است را در خود جای داده است. می‌توان این فایل را مثل یک عکس فشرده فرض کرد که تمام اطلاعات لازم برای عملکرد مدل در آن ذخیره شده است، بدون نیاز به دسترسی به یک بانک اطلاعاتی زیاد حجم. اندازه این فایل‌ها بسته به اندازه و پیچیدگی مدل‌ها متغیر است، به عنوان مثال، بزرگترین مدل از نام Gemma 3 تقریباً 4.4 گیگابایت حجم دارد در حالی که کوچکترین مدل حدوداً 554 مگابایت است.

پس از دانلود، دیگر نیازی به داده‌های بیشتر ندارید. مدل به طور کامل بر روی دستگاه شما اجرا می‌شود، به سوالات پاسخ می‌دهد و وظایف خود را با استفاده از اطلاعاتی که قبلاً یاد گرفته است انجام می‌دهد.

حتی اگر CPU شما با سرعت پایینی است، با استفاده از مدل GPT-5.5 هنگام پردازش، با خروجی سریعی روبرو خواهید شد. این مدل با مدل‌های بزرگتر قابل مقایسه نیست، اما باز هم قابل استفاده می‌باشد.

مدل Gemma 3 1B به سرعت بیش از 20 نشانه در ثانیه می‌رسد و تجربه‌ای صاف و دقیق را با دقت بالا فراهم می‌کند.

مهم است که آیا شما به صورت آفلاین هستید یا داده‌های حساس را مدیریت می‌کنید یا نه. اگر مایل به به اشتراک گذاری این اطلاعات با الگوریتم‌های آموزش یافته توسط Google یا OpenAI هستید، باید دقت کنید که این الگوریتم‌ها به طور پیش فرض از داده‌های شما استفاده می‌کنند. اما شما می‌توانید از این فرایند امتناع کنید و اجازه به دیگران ندهید که از داده‌های شما استفاده کنند.

در مدل کوچکترین Gemma، GPU بهترین عملکرد را ارائه می‌دهد، با توانایی پردازش بیش از 105 نشانه در ثانیه. از سوی دیگر، CPU تنها می‌تواند 39 نشانه در ثانیه را پردازش کند. اگرچه مدل پس از تفکر، پاسخ‌هایی ایجاد می‌کند، اما سرعت پردازش این پاسخ‌ها توسط GPU حدود 10 نشانه در ثانیه و توسط CPU حدود 7 نشانه در ثانیه است.

به نظر می‌رسد که CPU در مدل‌های کوچک‌تر نتایج بهتری نسبت به GPU دارد. این امر در تست‌های مختلف مشاهده شده است. به عنوان مثال، در یک مورد، مدل استنتاج CPU به دقت سن و وضعیت تاهل منطبق با عکس آزمایشی حدس زد: برای من، سن اواخر دهه 30 و برای او، سن اواخر 20.

به نظر می‌رسد که GPU شما اشتباهاً سن شما را 20 سال جوانتر از واقعیت تشخیص داده است. همیشه بهتر است از مواد اولیه دقیق برای پیش بینی سن استفاده کرد.

مدل های Google با سانسور سنگین همراه هستند ، اما زندانیان اساسی با حداقل تلاش می توانند حاصل شوند.

خلاف خدمات مدل‌های متمرکز که به شما اجازه دادن استفاده از تکنیک های فرار ندارند، مدل‌های محلی از نظر درخواست‌های شما گزارش نمی‌دهند. این به معنای این است که می‌توانید به راحتی از تکنیک‌های فرار از زندان بدون اخطار یا محدودیت‌های دیگری استفاده کنید. این روش می‌تواند برای دسترسی به اطلاعاتی که در نسخه‌های سانسور شده از مدل‌های متمرکز موجود نیست، به عنوان یک گزینه خوب محسوب شود.

پشتیبانی مدل شخص ثالث در دسترس است ، اما تا حدودی محدود است.

برنامه تنها فایل‌های با پسوند .task را قبول می‌کند و از این نظر محدود است. اما کارایی و امنیت آن به طور گسترده توسط شرکت SafetEnsor تأیید شده است که رقبایی معتبر همچون Ollama نیز از آن حمایت می‌کنند.

این موضوع تعداد مدل‌های موجود را به طور قابل توجهی کاهش می‌دهد. هرچند روش‌هایی برای تبدیل پرونده‌های safetensor به فرمت .task وجود دارد، اما این فرایند برای تمامی مدل‌ها مناسب نیست.

مراقبت از کد به اندازه کافی اهمیت دارد ولی مدل‌های تخصصی مثل Codestral در انجام وظایف برنامه‌نویسی از Gemma 3 بهتر عمل می‌کنند. برای استفاده از این مدل‌ها، نیاز به یک فرمت .task دارید که می‌تواند جایگزینی مؤثر باشد.

مدل‌های محاسباتی بدون ارسال داده به سرورهای شرکت‌های بزرگ مانند سامسونگ یا گوگل، برای کارهای اساسی همانند تغییر مجدد، خلاصه کردن محتوا و توضیح مفاهیم بهتر است. این مدل‌ها به دلیل عدم وابستگی به این شرکت‌ها، حفظ حریم خصوصی و کاهش خطر نشت اطلاعات دارای مزیت هستند. از سوی دیگر، امکان تنظیمات و تنوع بیشتر در این مدل‌ها، اجازه بهتری برای سفارشی‌سازی و تنظیمات مورد نیاز را فراهم می‌کند.

بنا به این، کاربران دیگر نیازی به استفاده از ورودی دستی مانند صفحه کلید و کلیپ بورد برای استفاده از فناوری ابزارهای بزرگ ندارند. زیرا سخت‌افزارهای خودشان تمام فرآیندهای مورد نیاز را انجام می‌دهند و کاربران نیازی به دخالت دستی ندارند.

تا سال 2025، استاندارد احساس در پنجره زمینه 4096 توکن محدود است، اما تنها دو سال پیش با آنچه مورد قبول بود هماهنگ بود.

مکالمات به طور طبیعی در محدودیت‌ها و شرایط خاصی رخ می‌دهد. این شاید بهترین روش برای تعریف تجربه باشد.

با استفاده از مدل هوش مصنوعی روی تلفن هوشمندتان، تجربه چت بهبود یافته‌ای دارید. این بدان معناست که توانایی پردازش و پاسخ‌دهی به سرعت و دقت بالاتری نسبت به چت‌های معمولی را دارد. همچنین، از مزایای دیگری مانند استفاده از چند مدل مختلف و امکان دست‌زدن به کد برخوردار است که امکان بهبود و سفارشی‌سازی بیشتری را برای شما فراهم می‌کند.

بله، داشتن یک نسخه آهسته تر و پایین تر از هوش مصنوعی مورد علاقه خود را بر روی تلفن خود اجرا کردن می تواند به شما این امکان را بدهد که فضای ذخیره سازی بیشتری روی تلفن خود داشته باشید، این به خصوص در صورتی مفید است که فضای ذخیره سازی تلفن شما محدود باشد. همچنین، اجرای یک نسخه خفیف تر از هوش مصنوعی می‌تواند باعث کاهش مصرف باتری و منابع سیستم شما شود و در نتیجه تلفن شما به طور کلی بهتر و کارآمدتر عمل می‌کند. از طرف دیگر، استفاده از یک نسخه سبک تر و پایین تر از هوش مصنوعی می‌تواند تجربه کار با این سامانه ها را برای شما آسان‌تر و کارآمدتر کند، زیرا پیچیدگی‌ها و مشکلاتی که برای برخی افراد با نسخه های پیشرفته تر از هوش مصنوعی پیش می‌آید را کاهش می دهد.

حفظ حریم خصوصی یک ویژگی مهم است که در قابلیت‌های هوش مصنوعی یک چالش بزرگ ایجاد می‌کند. به عنوان مثال، کارکنان مراقبت‌های بهداشتی که به داده‌های بیماران دسترسی دارند، روزنامه‌نگاران فعال در حوزه اطلاعات حساس، یا هر فردی که با اطلاعات خصوصی سر و کار دارد، ممکن است به قابلیت‌های هوش مصنوعی دسترسی پیدا کنند بدون اینکه افراد ذی‌نفع این موضوع را تصور کنند.

“بدون نیاز به اینترنت” به این معنی است که این فناوری می‌تواند بدون اتصال به اینترنت عمل کند. این بدان معناست که به کمک داده‌ها و اطلاعاتی که از قبل در دستگاه ذخیره شده‌اند، قادر است به اجرای وظایف و عملکردهای مورد نظر بپردازد، حتی در مواقعی که امکان دسترسی به اینترنت وجود ندارد. این قابلیت به ویژه در شرایطی مانند سفر، مناطق دورافتاده یا زمانی که اتصال به اینترنت ممکن نیست، بسیار مفید است.

پسرفتارهای کارایی ابری سریعاً هزینه‌ها را افزایش می‌دهد. خدمات هوش‌مصنوعی ابری هر بار که استفاده شوند، هزینه‌ها را به حساب می‌آورند، در حالی که مدل‌های محلی تنها به توانایی پردازش تلفن شما نیاز دارند. کسب‌وکارهای کوچک و سرگرمی‌ها می‌توانند بدون دستمزد مداوم آزمایش کنند. اگر مدلی را به صورت محلی اجرا کنید، می‌توانید بدون نیاز به تقاضای مداوم، کردیت یا اشتراک داشته باشید و به اندازه دلخواه با آن تعامل کنید، بدون هیچ هزینه‌ای.

پیشرفت‌های تأخیر احساس چشمگیری دارند. به این معنی که هر چیزی که برنامه‌های زمان واقعی مثل چت‌بات‌ها یا تجزیه و تحلیل تصاویر را نشان می‌دهد، بهبود پیدا کرده است. این به این معنی است که نیاز نیست برای پاسخ‌های سریع به سرورها دورتر بروید، و بنابراین چت‌بات شما هیچ وقت خاموش نمی‌شود.

در کل، برای وظایف اساسی، استفاده از نسخه‌های رایگان ChatGPT، Claude، Gemini، Meta، Reka و Mistral معمولا کافی است و در صورت نیاز به محاسبات سنگین‌تر، می‌توان از نسخه پولی دیگری استفاده کرد.

بله، Chatbot مورد علاقه شما در اینترنت به زودی جایگزین نخواهد شد. برخی از چالش‌های مرتبط با فرزندخواندگی زودهنگام وجود دارد.

مشکلات تخلیه باتری، به ویژه در دستگاه‌های بزرگتر، همچنان موجود است و برای کاربران عمومی که با مسائل تنظیم فنی زیاد آشنا نیستند می‌تواند یک چالش باشد. وجود انواع مختلف مدل‌ها نیز در مقایسه با پیشنهادهای ابری، و تصمیم گوگل برای پشتیبانی از مدل‌های SafetEnsor (که تقریباً 100٪ از کل مدل‌های موجود در اینترنت را تشکیل می‌دهد) گیج‌کننده است.

آزمایشی از گوگل نشان داد که شرکت به سمت تغییر فلسفه استقرار هوش مصنوعی در محیط های خصوصی حرکت می کند. به جای اینکه کاربران را مجبور به انتخاب بین هوش مصنوعی قدرتمند و حریم خصوصی کند، گوگل اکنون قصد دارد هر دو را همزمان ارائه دهد، حتی اگر این تجربه هنوز کاملاً فراهم نشده باشد.

گالری AI Edge تجربه‌ای فوق‌العاده‌ی با کیفیت برای اجرای برنامه‌های هوش مصنوعی در دستگاه‌های محلی است. بهینه‌سازی Google نشان می‌دهد که این گالری بهترین رابط کاربری برای اجرای مدل‌های هوش مصنوعی بر روی دستگاه‌ها را فراهم می‌کند.

اضافه کردن حمایت از فایل‌های .safetensor امکان باز کردن اکوسیستم گسترده‌ای از مدل‌های موجود را فراهم می‌کند و می‌تواند یک برنامه کاربردی عالی را به یک ابزار اساسی برای کاربران هوش مصنوعی با توجه به حریم خصوصی تبدیل کند.

به ویرایش توسط جاش کویتنر و سباستین سینکلر اطلاق می‌شود وقتی دو نفر با همکاری تلاش می‌کنند تا یک نوشته را بهبود ببخشند و از جوانب مختلف آن مرتبط با محتوا، دستور زبانی و سبک نگارشی بهره مند شوند. این فرآیند به منظور ارتقای کیفیت و روون شدن متن انجام می‌شود.

هوش مصنوعی بدون نیاز به اینترنت: گالری AI Edge از گوگل توانمندی‌های جدید را به موبایل‌ها آورد