GPT-4o คืออะไร หลังเมื่อคืนวันที่ 13 พฤษภาคม 2024 OpenAI ผู้พัฒนา ChatGPT เปิดตัว GPT-4o (โฟร์-โอ) ที่นับว่าพัฒนาอีกก้าวที่สำคัญ ที่ AI สามารถใช้เหตุผลได้ทั้งเสียง ภาพ และข้อความ ตอบสนองต่ออินพุตเสียงได้เร็วเหมือนมนุษย์ และยังเข้าใจภาพและเสียงได้ดีกว่าโมเดลก่อนหน้า
GPT-4o คืออะไร
GPT-4o คือโมเดลภาษาใหม่ที่พัฒนาโดย OpenAI ที่มีความสามารถในการประมวลผลและตอบสนองต่อข้อมูลทั้งรูปแบบเสียง ภาพ และข้อความแบบเรียลไทม์ ถือเป็นก้าวสำคัญสู่การโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ที่เป็นธรรมชาติมากขึ้น
GPT-4o สามารถตอบสนองต่ออินพุตเสียงได้รวดเร็วภายในเวลาเพียง 232 มิลลิวินาที ซึ่งใกล้เคียงกับเวลาตอบสนองของมนุษย์ โมเดลนี้ทำงานได้อย่างมีประสิทธิภาพในงานที่เกี่ยวข้องกับข้อความ การใช้เหตุผล และการเขียนโค้ด และยังสร้างมาตรฐานใหม่สำหรับความสามารถในการรองรับหลายภาษา เสียง และภาพ
ความสามารถอันโดดเด่นของ GPT-4o มีดังนี้
- ตอบสนองต่ออินพุตเสียง
- เข้าใจและแปลภาษา
- เขียนเนื้อหาสร้างสรรค์ในรูปแบบต่างๆ เช่น บทกวี โค้ด สคริปต์ และบทเพลง
- ตอบคำถามของคุณอย่างมีเหตุผล แม้ว่าจะเป็นคำถามปลายเปิด ท้าทาย หรือแปลกประหลาด
- เห็น จดจำและเข้าใจวัตถุและฉากในภาพ
GPT-4o คือก้าวล่าสุดของ OpenAI ในการก้าวข้ามขีดจำกัดของการเรียนรู้เชิงลึก มุ่งสู่การใช้งานจริง นักพัฒนาใช้ความพยายามอย่างมากในช่วงสองปีที่ผ่านมาเพื่อปรับปรุงประสิทธิภาพในทุกเลเยอร์ของสแต็ก จากผลแรกของการวิจัยนี้ เราสามารถสร้างแบบจำลองระดับ GPT-4 ได้ในวงกว้างมากขึ้น
GPT-4o เริ่มเปิดตัวและใช้งานแล้ววันนี้ใน ChatGPT ฟรีสำหรับทุกคน
ในส่วนพัฒนาสามารถเข้าถึง GPT-4o API ในรูปแบบข้อความและการมองเห็นได้แล้ว GPT-4o เร็วขึ้น 2 เท่า ถูกกว่าครึ่งหนึ่ง และมีขีดจำกัดอัตราที่สูงกว่า 5 เท่า เมื่อเทียบกับ GPT-4 Turbo
OpenAI วางแผนที่จะเปิดตัวการสนับสนุนความสามารถด้านเสียงและวิดีโอใหม่ของ GPT-4o ให้กับพันธมิตรกลุ่มเล็กๆ ที่เชื่อถือได้ใน API ในอีกไม่กี่สัปดาห์ข้างหน้า
เรียกได้ว่า GPT-4o เป็นก้าวสำคัญสู่ปัญญาประดิษฐ์ที่ความสามารถใกล้เคียงกับมนุษย์ เป็นโมเดลภาษาที่ฉลาดที่สุดเท่าที่เคยมีมา
อ่านรายละเอียดเพิ่มเติมได้ที่ https://www.it24hrs.com/2024/openai-announcement-gpt-4o-what-is-gpt-4o/