گوگل به دنیای جدید جمینی خوش آمدی Google I/O 2024: یک I/O برای نسل جدید GEMINI

بازدید: 157 بازدید
گوگل به دنیای جدید جمینی خوش آمدی Google I/O 2024: یک I/O برای نسل جدید
5/5 - (3 امتیاز)

Google I/O 2024: یک I/O برای نسل جدید

یادداشت Sundar Pichai مدیر گوگل : در زیر متن ویرایش شده ای از اظهارات ساندار پیچای در I/O 2024 آمده است، که برای گنجاندن بیشتر مواردی که روی صحنه اعلام شده است، اقتباس شده است. تمام اطلاعیه های مجموعه ما را ببینید.

گوگل به طور کامل در دوران جمینی GEMINI است.

قبل از اینکه وارد آن شویم، می‌خواهم به لحظه‌ای که در آن هستیم فکر کنم. ما بیش از یک دهه است که روی هوش مصنوعی سرمایه‌گذاری کرده‌ایم – و در هر لایه از پشته نوآوری کرده‌ایم: تحقیق، محصول، زیرساخت، و ما امروز در مورد آن صحبت خواهم کرد

با این حال، ما در روزهای اولیه تغییر پلت فرم هوش مصنوعی هستیم. ما فرصت های زیادی را در پیش داریم، برای سازندگان، برای توسعه دهندگان، برای استارتاپ ها، برای همه. کمک به هدایت این فرصت‌ها چیزی است که دوران جمینی GEMINI ما در مورد آن است. پس بیایید شروع کنیم.

فهرست گوگل به دنیای جدید جمینی خوش آمدی Google I/O 2024: یک I/O برای نسل جدید GEMINI

 

گوگل – به عصر جمینی GEMINI خوش آمدید


دوران جوزا


یک سال پیش در مرحله I/O ما برای اولین بار برنامه های خود را برای Gemini به اشتراک گذاشتیم: یک مدل مرزی که از ابتدا به صورت بومی چندوجهی ساخته شده بود، که می توانست بر روی متن، تصاویر، ویدئو، کد و موارد دیگر استدلال کند. این یک گام بزرگ در تبدیل هر ورودی به هر خروجی – یک “I/O” برای نسل جدید است.

از آن زمان، ما اولین مدل های جمینی را معرفی کردیم، که تواناترین مدل های خود تا اون لحظه است. آنها عملکردی پیشرفته را در هر معیار چند وجهی نشان دادند. دو ماه بعد، Gemini 1.5 Pro را معرفی کردیم که پیشرفت بزرگی در زمینه طولانی ایجاد کرد. این می تواند 1 میلیون توکن تولید کند، به طور مداوم، بیش از هر مدل پایه در مقیاس بزرگ دیگر.

ما می خواهیم همه از کارهایی که جمینیGEMINI  می تواند انجام دهد بهره مند شوند. بنابراین ما به سرعت کار کرده ایم تا این پیشرفت ها را با همه شما به اشتراک بگذاریم. امروزه بیش از 1.5 میلیون توسعه‌دهنده از مدل‌های Gemini در ابزارهای ما استفاده می‌کنند. شما از آن برای اشکال زدایی کد، دریافت بینش جدید و ساختن نسل بعدی برنامه های کاربردی هوش مصنوعی استفاده می کنید.

ما همچنین قابلیت‌های موفقیت‌آمیز Gemini را به روش‌های قدرتمند در محصولات خود آورده‌ایم. امروز نمونه‌هایی را در جستجو، عکس‌ها، فضای کاری، Android و موارد دیگر نشان خواهیم داد.

پیشرفت محصول


امروزه، همه 2 میلیارد کاربر ما از Gemini در محصولات گوگل استفاده می کنند.

و همچنین تجربیات جدیدی را معرفی کرده‌ایم، از جمله در تلفن همراه، که در آن افراد می‌توانند مستقیماً از طریق برنامه با Gemini تعامل داشته باشند، اکنون در Android و iOS موجود است. و از طریق Gemini Advanced که دسترسی به توانمندترین مدل های ما را فراهم می کند. بیش از 1 میلیون نفر ثبت نام کرده اند تا آن را فقط در سه ماه امتحان کنند، و همچنان حرکت قوی خود را نشان می دهد.

گسترش مرورهای هوش مصنوعی در جستجو


یکی از هیجان انگیزترین تحولات Gemini در جستجوی گوگل بوده است.

در سال گذشته، به‌عنوان بخشی از تجربه تولیدکننده جستجو، به میلیاردها پرسش پاسخ داده‌ایم. مردم از آن برای جستجو به روش‌های کاملاً جدید استفاده می‌کنند، و انواع جدیدی از سؤالات، سؤالات طولانی‌تر و پیچیده‌تر را می‌پرسند، حتی با عکس‌ها جستجو می‌کنند و بهترین چیزی را که وب ارائه می‌کند را به دست می‌آورند.

ما این تجربه را خارج از آزمایشگاه آزمایش کرده‌ایم. و ما تشویق می‌شویم که نه تنها شاهد افزایش استفاده از جستجو، بلکه افزایش رضایت کاربران نیز باشیم.

گوگل به دنیای جدید جمینی خوش آمدی Google I/O 2024: یک I/O برای نسل جدید
گوگل به دنیای جدید جمینی خوش آمدی Google I/O 2024: یک I/O برای نسل جدید

من مشتاقم اعلام کنم که این هفته این تجربه کاملاً اصلاح شده، مرورهای هوش مصنوعیGemini  ، را برای همه در ایالات متحده آغاز خواهیم کرد. و به زودی آن را به کشورهای بیشتری خواهیم آورد.

نوآوری های زیادی در جستجو اتفاق می افتد. به لطف Gemini می‌توانیم تجربیات جستجوی بسیار قدرتمندتری از جمله در محصولات خود ایجاد کنیم.

معرفی Ask Photos


یک نمونه Google Photos است که تقریباً 9  سال پیش راه اندازی شد. از آن زمان، مردم از آن برای سازماندهی مهم ترین خاطرات خود استفاده کردند. امروزه این رقم به بیش از 6 میلیارد عکس و ویدیو در هر روز آپلود می شود.

و مردم دوست دارند از Photos برای جستجو در سراسر زندگی خود استفاده کنند. با Gemini ما این کار را بسیار ساده تر می کنیم.

میخواهید که در پارکینگ پرداخت قبض را انجام دهید ، اما نمی توانید شماره پلاک خود را به خاطر بیاورید. پیش از این، می‌توانید عکس‌ها را برای کلمات کلیدی جستجو کنید و سپس در عکس‌های سال‌ها پیمایش کنید و به دنبال پلاک خودرو بگردید. اکنون، می‌توانید به سادگی از Photos بپرسید. ماشین‌هایی را که اغلب ظاهر می‌شوند را می‌شناسد، انتخاب می‌کند که کدام یک مال شماست، و شماره پلاک را به شما می‌گوید.

و Ask Photos می تواند به شما کمک کند خاطرات خود را به روشی عمیق تر جستجو کنید. برای مثال، ممکن است در حال یادآوری نقاط عطف اولیه دخترتان مریم یا هر فرزند دیگری باشید. اکنون می توانید از Photos بپرسید: “مریم چه زمانی شنا را یاد گرفت؟”

پیشرفت جستجو در تصاویر با هوش مصنوعی ask google
پیشرفت جستجو در تصاویر با هوش مصنوعی ask google

و می‌توانید چیز پیچیده‌تری را دنبال کنید: «به من نشان بده شنای مریم چگونه پیشرفت کرده است».

در اینجا، جمینی فراتر از یک جستجوی ساده است و زمینه‌های مختلف را تشخیص می‌دهد – از دویدن در استخر، غواصی در اقیانوس، تا متن و تاریخ‌های گواهینامه‌های شنا. و Photos همه آن‌ها را در یک خلاصه جمع‌آوری می‌کند، بنابراین شما واقعاً می‌توانید همه آن‌ها را در نظر بگیرید و خاطرات شگفت‌انگیزی را دوباره زنده کنید. ما در تابستان امسال Ask Photos را با قابلیت‌های بیشتری عرضه می‌کنیم.

رابط کاربری عکس‌ها در تلفن همراه همراه با درخواست «به من نشان بده شنا مریم چگونه پیشرفت کرده است». پاسخ مجموعه ای از عکس های یک دختر را نشان می دهد که در حال شنا در محیط های مختلف است.


باز کردن دانش بیشتر با چندوجهی و زمینه طولانی


باز کردن قفل دانش ( یعنی در هر بخشی بتواند دانش خود را ارتقا دهد )  در تمامی موارد دلیلی است که ما Gemini را به گونه‌ای ساخته‌ایم که از ابتدا چندوجهی multimodal from  باشد. این یک مدل است، با تمام روش‌های داخلی. بنابراین نه تنها هر نوع ورودی را درک می‌کند – و ارتباط بین آنها را پیدا می‌کند.

در مدل چندوجهی به طور اساسی سوالاتی را که می توانیم بپرسیم را گسترش می دهد و پاسخ هایی را که به آنها خواهیم رسید. زمینه طولانی این را یک گام فراتر می‌برد و ما را قادر می‌سازد تا اطلاعات بیشتری را به ارمغان بیاوریم: صدها صفحه متن، ساعت‌ها صدا یا یک ساعت ویدیو، کل مخزن کد… یا، هر چیز دیگر  اگر بخواهید.

مانند 96 منوهای کارخانه کیک پنیر

برای این تعداد منو، به یک پنجره زمینه یک میلیون توکن نیاز دارید که اکنون با Gemini 1.5 Pro امکان پذیر است. توسعه دهندگان از آن به روش های بسیار جالبی استفاده کرده اند.

ویدئویی درباره نحوه استفاده توسعه دهندگان از پنجره زمینه 1 میلیون توکن Gemini 1.5 Pro

https://www.youtube.com/watch?v=WsEQjeZoEng


ما در چند ماه گذشته Gemini 1.5 Pro را با زمینه طولانی در پیش نمایش عرضه کرده ایم. ما یک سری بهبودهای کیفی را در زمینه ترجمه، کدنویسی و استدلال انجام داده ایم. این به‌روزرسانی‌ها را از امروز در مدل منعکس می‌کنید.

اکنون مشتاقم اعلام کنم که این نسخه بهبودیافته Gemini 1.5 Pro را برای همه توسعه دهندگان در سراسر جهان می آوریم. علاوه بر این، امروز Gemini 1.5 Pro با 1 میلیون زمینه در Gemini Advanced به طور مستقیم برای مصرف کنندگان در دسترس است. این را می توان در 35 زبان استفاده کرد.

گسترش به 2 میلیون توکن در پیش نمایش خصوصی
یک میلیون توکن در حال باز کردن امکانات کاملاً جدیدی است. هیجان‌انگیز است، اما فکر می‌کنم می‌توانیم خودمان را بیشتر از این هم جلو ببریم.

بنابراین امروز، ما پنجره زمینه را به 2 میلیون توکن گسترش می دهیم و آن را در پیش نمایش خصوصی برای توسعه دهندگان در دسترس قرار می دهیم.

شگفت انگیز است که به گذشته نگاه کنیم و ببینیم که در چند ماه چقدر پیشرفت کرده ایم. و این نشان دهنده گام بعدی در سفر ما به سمت هدف نهایی از زمینه بی نهایت است.

آوردن Gemini 1.5 Pro به Workspace


تا کنون، ما در مورد دو پیشرفت فنی صحبت کرده ایم: چندوجهی و زمینه طولانی. هر کدام به تنهایی قدرتمند هستند. اما با هم، قابلیت‌های عمیق‌تر و هوش بیشتر را باز می‌کنند.

این با Google Workspace زنده می شود.

مردم همیشه ایمیل های خود را در جیمیل جستجو می کنند. ما در تلاش هستیم تا با Gemini آن را بسیار قدرتمندتر کنیم. بنابراین، به عنوان مثال، به عنوان یک والدین، می‌خواهید از هر چیزی که در مدرسه فرزندتان می‌گذرد مطلع باشید. جمینی می تواند به شما کمک کند تا ادامه دهید.

اکنون می‌توانیم از Gemini بخواهیم تمام ایمیل‌های اخیر مدرسه را خلاصه کند. در پس‌زمینه، ایمیل‌های مرتبط را شناسایی می‌کند، و حتی پیوست‌ها را مانند فایل‌های PDF تجزیه و تحلیل می‌کند. خلاصه ای از نکات کلیدی و موارد اقدام را دریافت می کنید. شاید این هفته در سفر بودید و نتوانستید در جلسه PTA شرکت کنید. ضبط جلسه یک ساعت است. اگر از Google Meet است، می‌توانید از Gemini بخواهید نکات برجسته را به شما ارائه دهد. یک گروه والدین وجود دارد که به دنبال داوطلب هستند و شما آن روز آزاد هستید. بنابراین مطمئناً، جمینی می تواند یک پاسخ را پیش نویس کند.

مثال‌های بی‌شماری دیگر وجود دارد که چگونه این می‌تواند زندگی را آسان‌تر کند. Gemini 1.5 Pro امروز در Workspace Labs در دسترس است. آپارنا بیشتر به اشتراک می گذارد.

خروجی های صوتی در NotebookLM


ما فقط به یک مثال با خروجی متن نگاه کردیم. اما با یک مدل چند وجهی، ما می توانیم کارهای بیشتری انجام دهیم.

ما در اینجا پیشرفت می کنیم، با موارد بیشتری در آینده. Audio Overviews در NotebookLM پیشرفت را نشان می دهد. از Gemini 1.5 Pro استفاده می کند تا منابع شما را بگیرد و یک مکالمه صوتی شخصی و تعاملی ایجاد کند.

این فرصت با چندوجهی است. به زودی می‌توانید ورودی‌ها و خروجی‌ها را ترکیب و مطابقت دهید. وقتی می گوییم I/O برای نسل جدید است، منظور ما این است. اما چه می شد اگر بتوانیم حتی فراتر برویم؟

با عوامل هوش مصنوعی جلوتر بروید
حتی فراتر از این یکی از فرصت هایی است که با عوامل هوش مصنوعی می بینیم. من در مورد آنها به عنوان سیستم های هوشمندی فکر می کنم که استدلال، برنامه ریزی و حافظه را نشان می دهند. آن‌ها می‌توانند چندین قدم جلوتر «فکر کنند»، و در نرم‌افزارها و سیستم‌ها کار کنند، همه برای انجام کاری از طرف شما، و مهم‌تر از همه، تحت نظارت شما.

ما هنوز در روزهای اولیه هستیم، اما اجازه دهید انواع موارد استفاده را به شما نشان دهم که برای حل آنها سخت کار می کنیم.

بیایید با خرید شروع کنیم. خرید کفش بسیار سرگرم کننده است و بازگرداندن آنها در صورت عدم تناسب بسیار کمتر سرگرم کننده است.

تصور کنید اگر Gemini بتواند تمام مراحل را برای شما انجام دهد:

در حال جستجوی صندوق ورودی شما برای رسید…

پیدا کردن شماره سفارش از ایمیل شما…

پر کردن فرم بازگشت …

حتی برنامه ریزی برای پیکاپ یو پی اس.

این خیلی راحت تر است، درست است؟

بیایید مثال دیگری بزنیم که کمی پیچیده تر است.

بگو تازه به شیکاگو نقل مکان کردی. می‌توانید تصور کنید که Gemini و Chrome با هم کار می‌کنند تا به شما کمک کنند تا چندین کار را انجام دهید تا آماده شوید – سازماندهی، استدلال، ترکیب کردن از طرف شما.

برای مثال، می‌خواهید شهر را کاوش کنید و خدماتی را در این نزدیکی پیدا کنید – از خشک‌شویی گرفته تا سگ‌گردی. و باید آدرس جدید خود را در ده ها وب سایت به روز کنید.

جمینی می‌تواند روی این وظایف کار کند و در صورت نیاز اطلاعات بیشتری را از شما می‌خواهد – بنابراین همیشه کنترل را در دست دارید.

این بخش واقعاً مهم است – همانطور که ما این تجربیات را نمونه سازی می کنیم، به سختی به این فکر می کنیم که چگونه آن را به روشی خصوصی، ایمن و برای همه انجام دهیم.

اینها موارد استفاده ساده هستند، اما با ساختن سیستم‌های هوشمندی که از جانب شما به آینده فکر می‌کنند، استدلال می‌کنند و برنامه‌ریزی می‌کنند، حس خوبی از انواع مشکلاتی که می‌خواهیم حل کنیم به شما می‌دهند.

 

برای مأموریت ما چه معنایی دارد


قدرت Gemini – با چندوجهی بودن، زمینه طولانی و عوامل – ما را به هدف نهایی خود نزدیکتر می کند: مفید کردن هوش مصنوعی برای همه.

ما این را اینگونه می بینیم که چگونه در برابر ماموریت خود بیشترین پیشرفت را خواهیم داشت: سازماندهی اطلاعات جهان در هر ورودی، در دسترس قرار دادن آن از طریق هر خروجی، و ترکیب اطلاعات جهان، با اطلاعات موجود در دنیای شما، به گونه ای که واقعا مفید باشد. برای شما.

شکستن ساختارهای جدید


برای درک کامل پتانسیل هوش مصنوعی، باید زمینه جدیدی را ایجاد کنیم. تیم Google DeepMind روی این موضوع سخت کار کرده است.

ما هیجان زیادی را در مورد 1.5 Pro و پنجره زمینه طولانی آن دیده ایم. اما ما همچنین از توسعه دهندگان شنیدیم که آنها چیزی سریعتر و مقرون به صرفه تر می خواهند. بنابراین فردا، Gemini 1.5 Flash را معرفی می‌کنیم، یک مدل سبک‌تر که برای مقیاس ساخته شده است. برای کارهایی بهینه شده است که تاخیر و هزینه کم بیشترین اهمیت را دارند. 1.5 Flash در AI Studio و Vertex AI در روز سه شنبه در دسترس خواهد بود.

با نگاهی به آینده، ما همیشه می خواستیم یک عامل جهانی بسازیم که در زندگی روزمره مفید باشد. Project Astra، درک چندوجهی و قابلیت‌های مکالمه بلادرنگ را نشان می‌دهد.

نسخه‌ای که در آن یک آزمایش‌کننده با نمونه اولیه عوامل هوش مصنوعی که توسط مدل پایه چندوجهی ما، Gemini پشتیبانی می‌شود، تعامل می‌کند.
ما همچنین در زمینه تولید ویدئو و تصویر با Veo و Imagen 3 پیشرفت کرده‌ایم و Gemma 2.0، نسل بعدی مدل‌های باز خود را برای نوآوری هوش مصنوعی مسئول معرفی کردیم. از دمیس حسابیس بیشتر بخوانید.

زیرساخت برای عصر هوش مصنوعی: معرفی Trillium


آموزش مدل های پیشرفته نیاز به قدرت محاسباتی زیادی دارد. تقاضای صنعت برای محاسبات ML در شش سال گذشته 1 میلیون افزایش یافته است. و هر سال ده برابر می شود.

گوگل برای این کار ساخته شده است. برای 25 سال، ما در زیرساخت های فنی در سطح جهانی سرمایه گذاری کرده ایم. از سخت‌افزار پیشرفته‌ای که به جستجو کمک می‌کند تا واحدهای پردازش تانسور سفارشی ما که به پیشرفت‌های هوش مصنوعی ما کمک می‌کنند.

Gemini به طور کامل در TPU های نسل چهارم و پنجم ما آموزش دیده و خدمت کرده است. و دیگر شرکت‌های پیشرو هوش مصنوعی، از جمله Anthropic، مدل‌های خود را روی TPU‌ها نیز آموزش داده‌اند.

امروز، ما هیجان زده هستیم که نسل ششم TPU های خود را به نام Trillium معرفی کنیم. Trillium کارآمدترین و کارآمدترین TPU ما تا به امروز است که نسبت به نسل قبلی، TPU v5e، 4.7 برابر بهبود عملکرد محاسباتی در هر تراشه را ارائه می دهد.

ما Trillium را در اواخر سال 2024 در دسترس مشتریان Cloud خود قرار خواهیم داد.

در کنار TPU های خود، ما مفتخریم که CPU و GPU را برای پشتیبانی از هر حجم کاری ارائه می دهیم. این شامل پردازنده‌های جدید Axion است که ماه گذشته معرفی کردیم، اولین CPU سفارشی مبتنی بر Arm که عملکرد پیشرو در صنعت و کارایی انرژی را ارائه می‌دهد.

ما همچنین مفتخریم که یکی از اولین ارائه دهندگان Cloud هستیم که پردازنده های گرافیکی پیشرفته بلک ول انویدیا را ارائه می دهیم که در اوایل سال 2025 در دسترس هستند. ما خوش شانس هستیم که همکاری طولانی مدت با NVIDIA داریم و هیجان زده هستیم که قابلیت های پیشرفت Blackwell را به مشتریان خود ارائه دهیم. .

تراشه ها بخش اساسی از سیستم یکپارچه سرتاسر ما هستند. از سخت افزار بهینه شده برای عملکرد و نرم افزار باز تا مدل های مصرف انعطاف پذیر. همه اینها در ابررایانه هوش مصنوعی ما، یک معماری ابررایانه پیشگامانه، گرد هم آمده است.

کسب‌وکارها و توسعه‌دهندگان از آن برای مقابله با چالش‌های پیچیده‌تر استفاده می‌کنند، با بیش از دو برابر کارایی نسبت به خرید سخت‌افزار خام و تراشه‌ها. پیشرفت های ابررایانه هوش مصنوعی ما تا حدی به دلیل رویکرد ما به خنک کننده مایع در مراکز داده ما امکان پذیر شده است.

ما این کار را برای نزدیک به یک دهه انجام می‌دهیم، مدت‌ها قبل از اینکه به پیشرفته‌ترین صنعت تبدیل شود. و امروزه مجموع ظرفیت ناوگان مستقر ما برای سیستم های خنک کننده مایع تقریباً 1 گیگاوات است و در حال رشد است – که نزدیک به 70 برابر ظرفیت هر ناوگان دیگر است.

زیربنای این مقیاس بزرگ شبکه ما است که زیرساخت های ما را در سطح جهانی به هم متصل می کند. شبکه ما بیش از 2 میلیون مایل فیبر زمینی و زیردریایی را در بر می گیرد: بیش از 10 برابر (!) دسترسی ارائه دهنده ابر پیشرو بعدی.

ما به سرمایه گذاری های لازم برای پیشبرد نوآوری هوش مصنوعی و ارائه قابلیت های پیشرفته ادامه خواهیم داد.

هیجان انگیزترین فصل جستجو تاکنون


یکی از بزرگ‌ترین زمینه‌های سرمایه‌گذاری و نوآوری ما در محصول موسس ما، جستجو است. 25 سال پیش جستجو را ایجاد کردیم تا به مردم کمک کنیم امواج اطلاعاتی را که به صورت آنلاین در حال حرکت هستند درک کنند.

با هر جابجایی پلتفرم، پیشرفت‌هایی را برای کمک به پاسخگویی بهتر به سؤالات شما ارائه کرده‌ایم. در تلفن همراه، انواع جدیدی از پرسش‌ها و پاسخ‌ها را باز کردیم – با استفاده از زمینه بهتر، آگاهی از موقعیت مکانی و اطلاعات هم‌زمان. با پیشرفت در درک زبان طبیعی و بینایی رایانه، راه‌های جدیدی را برای جستجو، با صدا یا زمزمه برای یافتن آهنگ مورد علاقه جدید شما فعال کردیم. یا با تصویری از آن گلی که در پیاده روی خود دیدید. 

البته «جستجو در عصر جمینی» با ترکیبی از نقاط قوت زیرساخت، آخرین قابلیت‌های هوش مصنوعی، نوار بالای کیفیت اطلاعات و چندین دهه تجربه ما در اتصال شما به غنای وب، این را به سطح جدیدی می‌برد. نتیجه محصولی است که کار را برای شما انجام می دهد.

جستجوی گوگل یک هوش مصنوعی مولد در مقیاس کنجکاوی انسان است. و این هیجان‌انگیزترین فصل جستجوی ما تاکنون است. درباره دوران جمینی جستجو از لیز رید بیشتر بخوانید.

تجارب باهوش تر جوزا
جمینی چیزی بیش از یک چت بات است. طراحی شده است تا دستیار شخصی و مفید شما باشد که می تواند به شما کمک کند کارهای پیچیده را انجام دهید و از طرف شما اقداماتی انجام دهید.

تعامل با جوزا باید محاوره ای و شهودی باشد. بنابراین، ما یک تجربه جدید Gemini را اعلام می‌کنیم که ما را به آن چشم‌اندازی به نام Live نزدیک‌تر می‌کند که به شما امکان می‌دهد با استفاده از صدای خود یک گفتگوی عمیق با Gemini داشته باشید. همچنین در اواخر سال جاری، 2 میلیون توکن را به Gemini Advanced می‌آوریم که آپلود و تجزیه و تحلیل فایل‌های بسیار متراکم مانند ویدیو و کد طولانی را ممکن می‌سازد. Sissie Hsiao بیشتر به اشتراک می گذارد.

جمینی در اندروید
با میلیاردها کاربر اندروید در سرتاسر جهان، ما هیجان زده ایم که Gemini را عمیق تر در تجربه کاربری ادغام کنیم. Gemini به عنوان دستیار هوش مصنوعی جدید شما اینجاست تا در هر زمان و هر مکان به شما کمک کند. و ما مدل‌های Gemini را در اندروید گنجانده‌ایم، از جمله آخرین مدل روی دستگاه خود: Gemini Nano با Multimodality، که متن، تصاویر، صدا و گفتار را پردازش می‌کند تا تجربه‌های جدید را باز کند و در عین حال اطلاعات را در دستگاه شما خصوصی نگه می‌دارد. Sameer Samat اخبار اندروید را اینجا به اشتراک می گذارد.

رویکرد مسئولانه ما به هوش مصنوعی


ما همچنان جسورانه و با احساس هیجان به هوش مصنوعی فرصت نزدیک می شویم. ما همچنین مطمئن می شویم که این کار را مسئولانه انجام می دهیم. ما در حال توسعه یک تکنیک پیشرفته هستیم که به آن تیم قرمز با کمک هوش مصنوعی می‌گوییم، که از پیشرفت‌های بازی Google DeepMind مانند AlphaGo برای بهبود مدل‌هایمان استفاده می‌کند. بعلاوه، ما SynthID، ابزار واترمارکینگ خود را که شناسایی محتوای تولید شده توسط هوش مصنوعی را آسان‌تر می‌کند، به دو روش جدید گسترش داده‌ایم: متن و ویدیو. جیمز مانیکا بیشتر به اشتراک می گذارد.

آینده را با هم بسازیم


همه اینها پیشرفت مهمی را نشان می دهد زیرا ما رویکردی جسورانه و مسئولانه برای مفید کردن هوش مصنوعی برای همه داریم.

ما برای مدت طولانی در رویکرد خود اولین هوش مصنوعی بوده ایم. دهه‌ها رهبری تحقیقاتی ما پیشگام بسیاری از پیشرفت‌های مدرن بوده است که پیشرفت هوش مصنوعی را برای ما و صنعت تقویت می‌کند. علاوه بر آن ما داریم:

زیرساخت پیشرو در جهان که برای عصر هوش مصنوعی ساخته شده است
نوآوری پیشرفته در جستجو که اکنون توسط Gemini ارائه شده است
محصولاتی که در مقیاس فوق العاده کمک می کنند – از جمله 15 محصول با نیم میلیارد کاربر
و پلتفرم هایی که به همه – شرکا، مشتریان، سازندگان و همه شما – امکان می دهد آینده را اختراع کنند.
این پیشرفت فقط به دلیل جامعه توسعه دهندگان باورنکردنی ما امکان پذیر است. شما از طریق تجربیات و برنامه هایی که هر روز می سازید، آن را واقعی می کنید. بنابراین، برای همه افرادی که اینجا در Shoreline هستند و میلیون‌ها نفر دیگر که در سراسر جهان تماشا می‌کنند، در اینجا به فرصت‌های پیش رو و ایجاد آنها با هم می‌پردازیم.

مطالعه بیشتر