GPT-4o คืออะไร หลังเมื่อคืนวันที่ 13 พฤษภาคม 2024 OpenAI ผู้พัฒนา ChatGPT เปิดตัว  GPT-4o (โฟร์-โอ) ที่นับว่าพัฒนาอีกก้าวที่สำคัญ ที่ AI สามารถใช้เหตุผลได้ทั้งเสียง ภาพ และข้อความ ตอบสนองต่ออินพุตเสียงได้เร็วเหมือนมนุษย์ และยังเข้าใจภาพและเสียงได้ดีกว่าโมเดลก่อนหน้า

GPT-4o คืออะไร
OpenAI

GPT-4o คืออะไร

GPT-4o คือโมเดลภาษาใหม่ที่พัฒนาโดย OpenAI ที่มีความสามารถในการประมวลผลและตอบสนองต่อข้อมูลทั้งรูปแบบเสียง ภาพ และข้อความแบบเรียลไทม์ ถือเป็นก้าวสำคัญสู่การโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ที่เป็นธรรมชาติมากขึ้น

GPT-4o สามารถตอบสนองต่ออินพุตเสียงได้รวดเร็วภายในเวลาเพียง 232 มิลลิวินาที ซึ่งใกล้เคียงกับเวลาตอบสนองของมนุษย์ โมเดลนี้ทำงานได้อย่างมีประสิทธิภาพในงานที่เกี่ยวข้องกับข้อความ การใช้เหตุผล และการเขียนโค้ด และยังสร้างมาตรฐานใหม่สำหรับความสามารถในการรองรับหลายภาษา เสียง และภาพ

ความสามารถอันโดดเด่นของ GPT-4o มีดังนี้

  • ตอบสนองต่ออินพุตเสียง
  • เข้าใจและแปลภาษา
  • เขียนเนื้อหาสร้างสรรค์ในรูปแบบต่างๆ เช่น บทกวี โค้ด สคริปต์ และบทเพลง
  • ตอบคำถามของคุณอย่างมีเหตุผล แม้ว่าจะเป็นคำถามปลายเปิด ท้าทาย หรือแปลกประหลาด
  • เห็น จดจำและเข้าใจวัตถุและฉากในภาพ

GPT-4o คือก้าวล่าสุดของ OpenAI ในการก้าวข้ามขีดจำกัดของการเรียนรู้เชิงลึก มุ่งสู่การใช้งานจริง นักพัฒนาใช้ความพยายามอย่างมากในช่วงสองปีที่ผ่านมาเพื่อปรับปรุงประสิทธิภาพในทุกเลเยอร์ของสแต็ก จากผลแรกของการวิจัยนี้ เราสามารถสร้างแบบจำลองระดับ GPT-4 ได้ในวงกว้างมากขึ้น

GPT-4o เริ่มเปิดตัวและใช้งานแล้ววันนี้ใน ChatGPT ฟรีสำหรับทุกคน

ในส่วนพัฒนาสามารถเข้าถึง GPT-4o  API ในรูปแบบข้อความและการมองเห็นได้แล้ว GPT-4o เร็วขึ้น 2 เท่า ถูกกว่าครึ่งหนึ่ง และมีขีดจำกัดอัตราที่สูงกว่า 5 เท่า เมื่อเทียบกับ GPT-4 Turbo

OpenAI วางแผนที่จะเปิดตัวการสนับสนุนความสามารถด้านเสียงและวิดีโอใหม่ของ GPT-4o ให้กับพันธมิตรกลุ่มเล็กๆ ที่เชื่อถือได้ใน API ในอีกไม่กี่สัปดาห์ข้างหน้า

เรียกได้ว่า GPT-4o เป็นก้าวสำคัญสู่ปัญญาประดิษฐ์ที่ความสามารถใกล้เคียงกับมนุษย์ เป็นโมเดลภาษาที่ฉลาดที่สุดเท่าที่เคยมีมา

อ่านรายละเอียดเพิ่มเติมได้ที่ https://www.it24hrs.com/2024/openai-announcement-gpt-4o-what-is-gpt-4o/