تکنولوژِی

رونمایی از قابلیت‌های صوتی و تصویری جدیدی برای ChatGPT

OpenAI از قابلیت‌های صوتی و تصویری جدیدی برای ChatGPT رونمایی کرد. به‌عنوان مثال، اکنون می‌توانید مسائل ریاضی که به‌صورت کتبی نوشته شده‌اند را به این چت‌بات هوش مصنوعی ارائه کنید تا ChatGPT آن را به‌صورت مرحله‌به‌مرحله حل کند.

به گزارش دیجیاتو، بخشی از رویداد امروز OpenAI به قابلیت‌های جدید ChatGPT اختصاص داده شد. در ابتدا قابلیت‌های صوتی این چت‌بات نمایش داده شد و مهندسین OpenAI از آن خواستند تا یک داستان درباره ربات‌ها بسازد و آن را تعریف کند. نکته قابل‌توجه دیگر اینکه در طول تعریف این داستان، «میرا موراتی»، مدیر ارشد فناوری OpenAI از آن خواست تا داستان را با صدای یک ربات واقعی تعریف کند و ChatGPT نیز بلافاصله صدای خود را تغییر داد.

بهبود بینایی هوش مصنوعی ChatGPT با دسترسی به دوربین

قابلیت‌های صوتی و تصویری جدیدی برای ChatGPT معرفی شدند

علاوه بر این، هوش مصنوعی ChatGPT اکنون به دوربین گوشی کاربران نیز دسترسی دارد و می‌تواند براساس محتوا‌هایی که از طریق دوربین تماشا می‌کند، وظایفی را انجام دهد. برای نمایش این قابلیت، تیم OpenAI معادله ریاضی را روی کاغذ نوشتند و آن را به ChatGPT نشان دادند تا به حل آن کمک کند. در پاسخ، ChatGPT به جای ارائه پاسخ نهایی، آن‌ها را راهنمایی کرد تا به‌صورت گام‌به‌گام پاسخ مسئله خود را پیدا کنند.

قابلیت‌های صوتی و تصویری جدیدی برای ChatGPT معرفی شدند

در ادامه رویداد، قابلیت‌های بینایی ChatGPT در محیط دسکتاپ برای مشاهده کد‌ها و تجزیه‌و‌تحلیل آن‌ها به‌نمایش گذاشته شد. OpenAI که در همین رویداد از نسخه دسکتاپ ChatGPT رونمایی کرده بود، در این آزمایش به سراغ قابلیت‌های مربوط به کدنویسی چت‌بات خود رفت و این مدل هوش مصنوعی توانست درباره کد‌های در حال نوشتن در محیط دسکتاپ، اطلاعاتی ارائه کند و مشکلات احتمالی موجود در آن‌ها را به کاربر اعلام کند.

علاوه بر این، چت‌بات همچنین قادر به بررسی چارت‌ها و ارائه بازخورد و اطلاعات واقعی درباره آن‌ها است.

قابلیت‌های صوتی و تصویری جدیدی برای ChatGPT معرفی شدند

پس از آن، نوبت به قابلیت‌های ترجمه ChatGPT رسید که با بهبود‌های جدیدی همراه شده است.

در طول این رویداد، تیم OpenAI توانایی‌های ChatGPT به‌عنوان یک ابزار ترجمه همزمان را نشان دادند. هوش مصنوعی این شرکت، ابتدا کلماتی را به زبان ایتالیایی از موراتی دریافت کرد و سپس آن‌ها را به انگلیسی تبدیل کرد. پس از آن نیز موراتی یک پاسخ انگلیسی به آن ارائه کرد و ChatGPT پاسخ او را به زبان ایتالیایی شرح داد.

به‌نظر می‌رسد که OpenAI با ارائه این قابلیت، یک دستیار ترجمه مهم برای مسافران ارائه کرده است.

قابلیت‌های صوتی و تصویری جدیدی برای ChatGPT معرفی شدند

یکی از دیگر ویژگی‌های معرفی‌شده مهم ChatGPT امکان تشخیص احساسات مانند شاد یا غمگین‌بودن با نگاه‌کردن به چهره کاربران از طریق دوربین است. البته این قابلیت طی چند هفته آینده عرضه خواهد شد.

قابلیت‌های صوتی و تصویری جدیدی برای ChatGPT معرفی شدند

OpenAI در طول این رویداد، همچنین از مدل هوش مصنوعی GPT-۴o رونمایی کرد. طبق ادعای OpenAI، این مدل در درک و بحث در مورد تصاویری که توسط کاربران به اشتراک می‌گذارند بسیار بهتر از مدل‌های موجود دیگر عمل می‌کند. به‌عنوان مثال، با آن می‌توان از یک منو به زبان دیگری عکس گرفت و از GPT-۴o درخواست کرد تا آن را ترجمه کند.

در آینده نیز با کمک این مدل می‌توان در موارد جالب‌توجه دیگری نیز کمک گرفت. به‌عنوان مثال، می‌توان به ChatGPT یک بازی ورزشی زنده را نشان داد تا قوانین آن را برای شما توضیح دهد.

fararu.com منبع خبر

نوشته های مشابه

دکمه بازگشت به بالا