حالا دیگر GPT، 4o می تواند علاوه بر متن، صدا و عکس را تحلیل کند و به صورت بی درنگ چت صوتی کند

به گزارش مجله لیست پیوند، پلتفرم ChatGPT نسخه نو GPT-4o را که دیشب رونمایی شد، بسیار تعاملی تر نموده. با این ارتقا، تصویر و یا متن هم می تواند تجزیه و تحلیل گردد و چت صوتی با حالتی بسیار شبیه به تبادل نظر با یک انسان با آن انجام گردد.

حالا دیگر GPT، 4o می تواند علاوه بر متن، صدا و عکس را تحلیل کند و به صورت بی درنگ چت صوتی کند

GPT-4o دوشنبه (13 مه) در یک رویداد آنلاین رونمایی شد. میرا موراتی، مدیر ارشد فناوری OpenAI آن را معرفی کرد و از آن به عنوان گامی به سوی تعامل طبیعی تر انسان و کامپیوتر یاد کرد. o در نام آن مخفف omni یا همه چیز است.

حالا دیگر کاربران سرویس رایگان، سرعتی به مقدار نسخه پولی GPT-4 Turbo را پردازش متن و ورودی کد تجربه می نمایند. در API چت جی پی تی بسیار سریع تر و 50 درصد مقرون به صرفه تر شده (یعنی با هزینه کمتری می گردد برنامه های متفرقه ثالث با موضوع ChatGPT نوشت.)

کاربران با یک فرمان صوتی ساده Hey, ChatGPT می توانند آغاز نمایند و پاسخ گفتاری دریافت می نمایند. کاربران می تواتند با استفاده از زبان گفتاری ساده، یا متن، صدای الحاقی و تصاویر هم با ChatGPT ارتباط برقرار نمایند. حتی می گردد یک فید زنده از دوربین گوشی برای ChatGPT فرستاد.

هنگام برقراری ارتباط با صدا، هوش مصنوعی به طور میانه با تاخیر ناچیز 320 میلی ثانیه پاسخ می دهد، یعنی زمان مشابه زمان پاسخ انسان در مکالمه معمولی و روتین. علاوه بر این، سیستم ChatGPT در حال حاضر به بیش از 50 زبان مسلط است.

فعلا پاسخ های صوتی محترمانه هستند و نمی توانند سناریوهایی مانند پاسخ های HAL 9000 در دنیای علمی تخیلی را در فکر ما زنده نمایند.

چیز دیگری که در رویداد نمایش داد، توانایی نسخه آزمایشی GPT-4o، به عنوان مترجم ایتالیایی-انگلیسی بود. این نسخه حتی توانست پرسش معادله جبر، آن هم به صورت دست نویس را متوجه گردد و حل نماید. تجزیه و تحلیل بخش های انتخابی کدهای برنامه نویسی و حتی تبلیغ یک داستان رباتیک، از نکات دیگر رونمایی دیشب بودند.

GPT-4o در حال حاضر برای استفاده عمومی در دسترس است. (به تدریج برای همه فعال خواهد شد) ویژگی های بیشتری قرار است طی چند هفته آینده اعلام گردد.

منبع: یک پزشک
انتشار: 25 اردیبهشت 1403 بروزرسانی: 25 اردیبهشت 1403 گردآورنده: lalink.ir شناسه مطلب: 1687

به "حالا دیگر GPT، 4o می تواند علاوه بر متن، صدا و عکس را تحلیل کند و به صورت بی درنگ چت صوتی کند" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "حالا دیگر GPT، 4o می تواند علاوه بر متن، صدا و عکس را تحلیل کند و به صورت بی درنگ چت صوتی کند"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید