هوش مصنوعی بدون نیاز به اینترنت: گالری AI Edge از گوگل توانمندیهای جدید را به موبایلها آورد
به گزارش مالی3، گوگل به تازگی یک برنامه جدید را منتشر کرده که تا کنون کسی درخواست آن را نکرده است، اما علاقهمندان به طراحی وب و تکنولوژی به آن علاقهمندند و میخواهند این برنامه را امتحان کنند.
گالری AI Edge، که باهوش ترین گالری بر روی تمام تلفن های هوشمند است، در تاریخ 31 مه راه اندازی شد. این گالری بدون نیاز به اتصال به اینترنت و به اشتراک گذاری داده های شما با سرورهای بزرگ فناوری (Big Tech)، هوش مصنوعی را مستقیماً روی تلفن هوشمند شما اجرا می کند.
یک برنامه آزمایشی با مجوز Apache 2.0 منتشر شده است که به هر کسی این امکان را میدهد تا از آن برای هر مقصدی استفاده کند. این برنامه ابتدا برای سیستم عامل Android در GitHub منتشر شده است و نسخه iOS آن نیز به زودی عرضه خواهد شد.
مدلهایی مانند Google’s Gemma 3N کاملاً بدون نیاز به اینترنت (آفلاین) عمل میکنند. این مدلها توانایی انجام تمام عملکردهای خود را از تجزیه و تحلیل تصاویر تا نوشتن کد را با استفاده از سختافزار تلفن شما فراهم میکنند.
و به طرز شگفتآور خوب است.
این برنامه در حال حاضر بر روی توسعه دهندگان متمرکز شده است و شامل سه ویژگی اصلی است: چتبات هوش مصنوعی برای مکالمات، درخواست تصویر برای تجزیه و تحلیل بصری، و آزمایشگاه سریع برای کارهای تک نوبت مانند بازنویسی متن.
اشخاص قادرند مدلهایی را از پلتفرمهایی مانند Hugging Face دانلود کنند. ولی باید به این نکته توجه داشت که این امکان فقط برای برخی مدلهای خاص مانند GEMMA-3N-E2B و QWEN2.5-1.5 b ممکن است.
کاربران Reddit بلافاصله از تازگی برنامه سؤال کردند و آن را با راه حل های موجود مانند PocketPal مقایسه کردند.
بعضی افراد نگرانی های امنیتی برای برنامههایی که در GitHub رسمی آپلود شده اند بیان کردند. آنها اعتقاد داشتند که میزبانهای این برنامه ها در GitHub ادعاهای تقلبی مبنی بر اینکه آنها هویت واقعی نیستند دارند. تا به حال هیچ مدرکی ارائه نشده که نشان دهد برنامههای مذکور دارای بدافزار یا نرم افزار مخرب هستند.
ما یک آزمایش انجام دادیم با استفاده از یک Samsung Galaxy S24 Ultra و دو مدل بزرگترین و کوچکترین Gemma 3 را برای آن دانلود کردیم.
هر مدل هوش مصنوعی یک فایل داده خاص دارد که تمام اطلاعات و دانشی که در طول آموزش به دست آمده است را در خود جای داده است. میتوان این فایل را مثل یک عکس فشرده فرض کرد که تمام اطلاعات لازم برای عملکرد مدل در آن ذخیره شده است، بدون نیاز به دسترسی به یک بانک اطلاعاتی زیاد حجم. اندازه این فایلها بسته به اندازه و پیچیدگی مدلها متغیر است، به عنوان مثال، بزرگترین مدل از نام Gemma 3 تقریباً 4.4 گیگابایت حجم دارد در حالی که کوچکترین مدل حدوداً 554 مگابایت است.
پس از دانلود، دیگر نیازی به دادههای بیشتر ندارید. مدل به طور کامل بر روی دستگاه شما اجرا میشود، به سوالات پاسخ میدهد و وظایف خود را با استفاده از اطلاعاتی که قبلاً یاد گرفته است انجام میدهد.
حتی اگر CPU شما با سرعت پایینی است، با استفاده از مدل GPT-5.5 هنگام پردازش، با خروجی سریعی روبرو خواهید شد. این مدل با مدلهای بزرگتر قابل مقایسه نیست، اما باز هم قابل استفاده میباشد.
مدل Gemma 3 1B به سرعت بیش از 20 نشانه در ثانیه میرسد و تجربهای صاف و دقیق را با دقت بالا فراهم میکند.
مهم است که آیا شما به صورت آفلاین هستید یا دادههای حساس را مدیریت میکنید یا نه. اگر مایل به به اشتراک گذاری این اطلاعات با الگوریتمهای آموزش یافته توسط Google یا OpenAI هستید، باید دقت کنید که این الگوریتمها به طور پیش فرض از دادههای شما استفاده میکنند. اما شما میتوانید از این فرایند امتناع کنید و اجازه به دیگران ندهید که از دادههای شما استفاده کنند.
در مدل کوچکترین Gemma، GPU بهترین عملکرد را ارائه میدهد، با توانایی پردازش بیش از 105 نشانه در ثانیه. از سوی دیگر، CPU تنها میتواند 39 نشانه در ثانیه را پردازش کند. اگرچه مدل پس از تفکر، پاسخهایی ایجاد میکند، اما سرعت پردازش این پاسخها توسط GPU حدود 10 نشانه در ثانیه و توسط CPU حدود 7 نشانه در ثانیه است.
به نظر میرسد که CPU در مدلهای کوچکتر نتایج بهتری نسبت به GPU دارد. این امر در تستهای مختلف مشاهده شده است. به عنوان مثال، در یک مورد، مدل استنتاج CPU به دقت سن و وضعیت تاهل منطبق با عکس آزمایشی حدس زد: برای من، سن اواخر دهه 30 و برای او، سن اواخر 20.
به نظر میرسد که GPU شما اشتباهاً سن شما را 20 سال جوانتر از واقعیت تشخیص داده است. همیشه بهتر است از مواد اولیه دقیق برای پیش بینی سن استفاده کرد.
مدل های Google با سانسور سنگین همراه هستند ، اما زندانیان اساسی با حداقل تلاش می توانند حاصل شوند.
خلاف خدمات مدلهای متمرکز که به شما اجازه دادن استفاده از تکنیک های فرار ندارند، مدلهای محلی از نظر درخواستهای شما گزارش نمیدهند. این به معنای این است که میتوانید به راحتی از تکنیکهای فرار از زندان بدون اخطار یا محدودیتهای دیگری استفاده کنید. این روش میتواند برای دسترسی به اطلاعاتی که در نسخههای سانسور شده از مدلهای متمرکز موجود نیست، به عنوان یک گزینه خوب محسوب شود.
پشتیبانی مدل شخص ثالث در دسترس است ، اما تا حدودی محدود است.
برنامه تنها فایلهای با پسوند .task را قبول میکند و از این نظر محدود است. اما کارایی و امنیت آن به طور گسترده توسط شرکت SafetEnsor تأیید شده است که رقبایی معتبر همچون Ollama نیز از آن حمایت میکنند.
این موضوع تعداد مدلهای موجود را به طور قابل توجهی کاهش میدهد. هرچند روشهایی برای تبدیل پروندههای safetensor به فرمت .task وجود دارد، اما این فرایند برای تمامی مدلها مناسب نیست.
مراقبت از کد به اندازه کافی اهمیت دارد ولی مدلهای تخصصی مثل Codestral در انجام وظایف برنامهنویسی از Gemma 3 بهتر عمل میکنند. برای استفاده از این مدلها، نیاز به یک فرمت .task دارید که میتواند جایگزینی مؤثر باشد.
مدلهای محاسباتی بدون ارسال داده به سرورهای شرکتهای بزرگ مانند سامسونگ یا گوگل، برای کارهای اساسی همانند تغییر مجدد، خلاصه کردن محتوا و توضیح مفاهیم بهتر است. این مدلها به دلیل عدم وابستگی به این شرکتها، حفظ حریم خصوصی و کاهش خطر نشت اطلاعات دارای مزیت هستند. از سوی دیگر، امکان تنظیمات و تنوع بیشتر در این مدلها، اجازه بهتری برای سفارشیسازی و تنظیمات مورد نیاز را فراهم میکند.
بنا به این، کاربران دیگر نیازی به استفاده از ورودی دستی مانند صفحه کلید و کلیپ بورد برای استفاده از فناوری ابزارهای بزرگ ندارند. زیرا سختافزارهای خودشان تمام فرآیندهای مورد نیاز را انجام میدهند و کاربران نیازی به دخالت دستی ندارند.
تا سال 2025، استاندارد احساس در پنجره زمینه 4096 توکن محدود است، اما تنها دو سال پیش با آنچه مورد قبول بود هماهنگ بود.
مکالمات به طور طبیعی در محدودیتها و شرایط خاصی رخ میدهد. این شاید بهترین روش برای تعریف تجربه باشد.
با استفاده از مدل هوش مصنوعی روی تلفن هوشمندتان، تجربه چت بهبود یافتهای دارید. این بدان معناست که توانایی پردازش و پاسخدهی به سرعت و دقت بالاتری نسبت به چتهای معمولی را دارد. همچنین، از مزایای دیگری مانند استفاده از چند مدل مختلف و امکان دستزدن به کد برخوردار است که امکان بهبود و سفارشیسازی بیشتری را برای شما فراهم میکند.
بله، داشتن یک نسخه آهسته تر و پایین تر از هوش مصنوعی مورد علاقه خود را بر روی تلفن خود اجرا کردن می تواند به شما این امکان را بدهد که فضای ذخیره سازی بیشتری روی تلفن خود داشته باشید، این به خصوص در صورتی مفید است که فضای ذخیره سازی تلفن شما محدود باشد. همچنین، اجرای یک نسخه خفیف تر از هوش مصنوعی میتواند باعث کاهش مصرف باتری و منابع سیستم شما شود و در نتیجه تلفن شما به طور کلی بهتر و کارآمدتر عمل میکند. از طرف دیگر، استفاده از یک نسخه سبک تر و پایین تر از هوش مصنوعی میتواند تجربه کار با این سامانه ها را برای شما آسانتر و کارآمدتر کند، زیرا پیچیدگیها و مشکلاتی که برای برخی افراد با نسخه های پیشرفته تر از هوش مصنوعی پیش میآید را کاهش می دهد.
حفظ حریم خصوصی یک ویژگی مهم است که در قابلیتهای هوش مصنوعی یک چالش بزرگ ایجاد میکند. به عنوان مثال، کارکنان مراقبتهای بهداشتی که به دادههای بیماران دسترسی دارند، روزنامهنگاران فعال در حوزه اطلاعات حساس، یا هر فردی که با اطلاعات خصوصی سر و کار دارد، ممکن است به قابلیتهای هوش مصنوعی دسترسی پیدا کنند بدون اینکه افراد ذینفع این موضوع را تصور کنند.
“بدون نیاز به اینترنت” به این معنی است که این فناوری میتواند بدون اتصال به اینترنت عمل کند. این بدان معناست که به کمک دادهها و اطلاعاتی که از قبل در دستگاه ذخیره شدهاند، قادر است به اجرای وظایف و عملکردهای مورد نظر بپردازد، حتی در مواقعی که امکان دسترسی به اینترنت وجود ندارد. این قابلیت به ویژه در شرایطی مانند سفر، مناطق دورافتاده یا زمانی که اتصال به اینترنت ممکن نیست، بسیار مفید است.
پسرفتارهای کارایی ابری سریعاً هزینهها را افزایش میدهد. خدمات هوشمصنوعی ابری هر بار که استفاده شوند، هزینهها را به حساب میآورند، در حالی که مدلهای محلی تنها به توانایی پردازش تلفن شما نیاز دارند. کسبوکارهای کوچک و سرگرمیها میتوانند بدون دستمزد مداوم آزمایش کنند. اگر مدلی را به صورت محلی اجرا کنید، میتوانید بدون نیاز به تقاضای مداوم، کردیت یا اشتراک داشته باشید و به اندازه دلخواه با آن تعامل کنید، بدون هیچ هزینهای.
پیشرفتهای تأخیر احساس چشمگیری دارند. به این معنی که هر چیزی که برنامههای زمان واقعی مثل چتباتها یا تجزیه و تحلیل تصاویر را نشان میدهد، بهبود پیدا کرده است. این به این معنی است که نیاز نیست برای پاسخهای سریع به سرورها دورتر بروید، و بنابراین چتبات شما هیچ وقت خاموش نمیشود.
در کل، برای وظایف اساسی، استفاده از نسخههای رایگان ChatGPT، Claude، Gemini، Meta، Reka و Mistral معمولا کافی است و در صورت نیاز به محاسبات سنگینتر، میتوان از نسخه پولی دیگری استفاده کرد.
بله، Chatbot مورد علاقه شما در اینترنت به زودی جایگزین نخواهد شد. برخی از چالشهای مرتبط با فرزندخواندگی زودهنگام وجود دارد.
مشکلات تخلیه باتری، به ویژه در دستگاههای بزرگتر، همچنان موجود است و برای کاربران عمومی که با مسائل تنظیم فنی زیاد آشنا نیستند میتواند یک چالش باشد. وجود انواع مختلف مدلها نیز در مقایسه با پیشنهادهای ابری، و تصمیم گوگل برای پشتیبانی از مدلهای SafetEnsor (که تقریباً 100٪ از کل مدلهای موجود در اینترنت را تشکیل میدهد) گیجکننده است.
آزمایشی از گوگل نشان داد که شرکت به سمت تغییر فلسفه استقرار هوش مصنوعی در محیط های خصوصی حرکت می کند. به جای اینکه کاربران را مجبور به انتخاب بین هوش مصنوعی قدرتمند و حریم خصوصی کند، گوگل اکنون قصد دارد هر دو را همزمان ارائه دهد، حتی اگر این تجربه هنوز کاملاً فراهم نشده باشد.
گالری AI Edge تجربهای فوقالعادهی با کیفیت برای اجرای برنامههای هوش مصنوعی در دستگاههای محلی است. بهینهسازی Google نشان میدهد که این گالری بهترین رابط کاربری برای اجرای مدلهای هوش مصنوعی بر روی دستگاهها را فراهم میکند.
اضافه کردن حمایت از فایلهای .safetensor امکان باز کردن اکوسیستم گستردهای از مدلهای موجود را فراهم میکند و میتواند یک برنامه کاربردی عالی را به یک ابزار اساسی برای کاربران هوش مصنوعی با توجه به حریم خصوصی تبدیل کند.
به ویرایش توسط جاش کویتنر و سباستین سینکلر اطلاق میشود وقتی دو نفر با همکاری تلاش میکنند تا یک نوشته را بهبود ببخشند و از جوانب مختلف آن مرتبط با محتوا، دستور زبانی و سبک نگارشی بهره مند شوند. این فرآیند به منظور ارتقای کیفیت و روون شدن متن انجام میشود.
نظرات کاربران