Pada 13 Mei 2024, OpenAI merilis model kecerdasan buatan terbaru mereka, yaitu GPT-4o. Perilisan ini bersamaan dengan pembaruan user interface untuk ChatGPT desktop. Acara peluncuran ini diumumkan melalui live streaming dari kantor OpenAI di San Francisco, oleh Mira Murati, Chief Officer Technology (CTO) OpenAI.
GPT-4o dikembangkan sebagai upaya mereka untuk memperluas penggunaan ChatGPT dengan meningkatkan pengalaman interaksi manusia dengan mesin. Versi ini memiliki kemampuan untuk memproses teks, video, dan audio dengan kecepatan yang lebih tinggi serta tingkat kecerdasan yang sebanding dengan GPT-4. Salah satu fitur utama dari GPT-4o adalah kemampuannya yang memungkinkan pengguna melakukan video chat langsung dengan ChatGPT. Model AI tidak hanya merespons lewat teks, tetapi juga dapat berbicara dan mendengarkan pengguna secara real time. Fitur ini menciptakan pengalaman yang lebih personal dan dinamis serta interaksi yang lebih mendalam.
Keunggulan GPT-4o juga terlihat pada kemampuannya dalam pengolahan gambar dan teks. Model ini dapat mengekstrak teks dari gambar dengan akurasi yang tinggi dan memberikan deskripsi konten visual secara detail. Selain itu, versi ini juga memungkinkan GPT untuk dapat melihat dan menerjemahkan gambar dalam berbagai bahasa dengan performa yang unggul dalam 50 bahasa.
“Ini adalah kali pertama kami benar-benar membuat langkah besar ke depan dalam hal kemudahan penggunaan”, kata Mira Murati. Pembaruan menghadirkan peningkatan pada fitur voice mode dengan model text-to-speech yang lebih canggih dan responsif. Pengguna dapat berinteraksi dengan ChatGPT secara lebih alami, bahkan memberikan interupsi saat berbicara atau menyampaikan nuansa emosional melalui suara mereka, bahkan hingga bernyanyi. Selain itu, model ini mampu mengenali konteks percakapan dengan lebih baik, memungkinkan tanggapan yang lebih relevan dan tepat waktu. Hal ini membuat pengalaman pengguna menjadi lebih lancar dan intuitif, seolah-olah berbicara dengan manusia nyata.
GPT-4o sudah tersedia dalam tier gratis sejak peluncurannya, serta untuk pengguna berlangganan ChatGPT Plus dan Team dengan batasan pesan yang 5 kali lebih tinggi. ChatGPT akan beralih secara otomatis ke GPT-3.5 saat pengguna mencapai batas penggunaan. Ini berarti pengguna gratis masih dapat menikmati kemampuan GPT-4o hingga batas tertentu sebelum dialihkan ke versi yang lebih lama. Dengan demikian, pengguna berlangganan dapat memanfaatkan sepenuhnya potensi GPT-4o tanpa gangguan yang signifikan dalam penggunaan sehari-hari mereka.
GPT-4o juga tersedia melalui OpenAI’s API dan Microsoft’s Azure OpenAI Service. Model ini memiliki kecepatan dua kali lipat dibandingkan GPT-4 Turbo dengan harga yang lebih terjangkau dan batasan yang lebih tinggi. Pengembang dapat dengan mudah mengintegrasikan GPT-4o ke dalam aplikasi mereka dan memanfaatkan peningkatan kinerja untuk berbagai keperluan. Hal ini memungkinkan bisnis untuk menyediakan layanan yang lebih responsif dan efisien tanpa mengkhawatirkan tagihan biaya yang membengkak.
Meskipun demikian, fitur audio tidak termasuk dalam API GPT-4o untuk semua pelanggan. OpenAI masih meneliti risiko penyalahgunaan dan sedang merencanakan pembaruan fitur audio untuk “sekelompok mitra terpercaya” dalam beberapa minggu mendatang. Perbaikan pada pengalaman suara ChatGPT yang didukung oleh GPT-4o akan segera tersedia dalam versi alpha untuk pengguna Plus dalam waktu sekitar satu bulan, bersamaan dengan opsi yang ditujukan untuk perusahaan.
Penulis : Mutiara Noor Fauzia
Editor : Yudhistira Azhar Haryono Putra, Melatie Raghyl Putri
Sumber Referensi:
https://www.cnbc.com/2024/05/13/openai-launches-new-ai-model-and-desktop-version-of-chatgpt.html
https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/