شناسهٔ خبر: 63980376 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: عصر ایران | لینک خبر

گوگل با Gemini روی هوش مصنوعی جدیدی برای بیان داستان زندگی کاربران کار می‌کند

این مدل جدید پروژه المان (Project Ellmann) نام دارد و هدف آن این است که «داستان زندگی شما» را روایت کند.

صاحب‌خبر -

تیمی از دانشمندان گوگل درحال بررسی ایده خلاقانه دیگری برای هوش مصنوعی هستند که با وجود آن می‌توان با استفاده از داده‌های موبایل کاربران مانند عکس‌ها و جستجو‌ها، داستان زندگی هر فرد را روایت کرد.

به گزارش دیجیاتو، گوگل حتی روی ایده چت‌باتی با اطلاعات زندگی شما کار می‌کند که می‌تواند به سؤالات مختلف درباره شما پاسخ دهد.

پروژه گوگل با احترام به یک زندگی‌نامه‌نویس و منتقد ادبی با نام «ریچارد دیوید المان»، پروژه المان (Project Ellmann) نامیده شده است. ایده اصلی پروژه این است که از LLMهایی مانند Gemini برای جمع‌آوری نتایج جستجو، پیداکردن الگو در عکس‌های کاربر و ایجاد چت‌بات برای پاسخ‌دادن به «سؤالات غیرممکن قبلی» استفاده شود. به بیان ساده‌تر، هدف المان این است که «داستان زندگی شما» باشد.

گوگل با Gemini روی هوش مصنوعی جدیدی برای بیان داستان زندگی کاربران کار می‌کند

هنوز مشخص نیست که آیا غول موتور جستجو قصد دارد این برنامه را در گوگل فوتوز یا هر محصول دیگری پیاده‌سازی کند یا شاهد برنامه جدیدی برای آن خواهیم بود.

البته براساس اسناد مشاهده‌شده توسط CNBC، ظاهراً یکی از مدیران محصول گوگل به‌تازگی در جریان یک جلسه داخلی، Project Ellmann را به تیم گوگل فوتوز ارائه کرده است. تیم گوگل چند ماه گذشته را درحال بررسی این موضوع بوده که مدل‌های زبانی بزرگ فناوری ایده‌آلی برای ارائه این رویکرد و ساخت داستان زندگی انسان‌هاست یا خیر.

محققان همچنین به‌صورت داخلی از چت‌باتی به نام Ellmann Chat رونمایی و آن را به‌عنوان مدلی شبیه به ChatGPT توصیف کرده‌اند که «تمام اطلاعات مربوط به زندگی شما را از قبل می‌داند.» برای مثال، می‌توانید از این چت‌بات بپرسید که چه شهرهایی شبیه به شهر محل تولد شما وجود دارد.

Project Ellmann تنها یکی از پروژه‌هایی محسوب می‌شود که گوگل در آن به‌دنبال ایجاد یا بهبود فناوری هوش مصنوعی است. روز چهارشنبه، این شرکت از پیشرفته‌ترین مدل هوش مصنوعی خود با نام Gemini رونمایی کرد که در برخی موارد بهتر از مدل GPT-4 شرکت OpenAI کار می‌کند.

این شرکت هم‌اکنون قصد دارد مجوز استفاده از Gemini را به طیف گسترده‌ای از مشتریان خود ارائه کند تا آن‌ها بتوانند در برنامه‌های خود از آن استفاده کنند. یکی از ویژگی‌های مهم و برجسته Gemini چندوجهی‌بودن آن است، به این معنی که می‌تواند اطلاعاتی فراتر از متن، مانند تصویر، ویدیو و صدا را پردازش و درک کند.

نظر شما