Gemini – Chat bot AI จาก Google ที่เหนือกว่า Chat GPT 4.0
Riki Kimura
Digital Marketing Executive at Wisible
ในปีที่ผ่านมา บริษัทยักษ์ใหญ่หลายเจ้า ไม่ว่าจะเป็น Open AI, Microsoft, Meta, Google, และบริษัทอื่นๆอีกมากมายได้เปิดตัว Chatbot ของตัวเองเป็นที่เรียบร้อย เรียกได้ว่าเป็นปีแห่งสงคราม Chatbot AI เลยก็ว่าได้
ล่าสุด Google ได้เปิดตัว AI ตัวใหม่ “Gemini” ที่ทาง Google เองเคลมว่าเหนือกว่าและดีกว่า GPT4.0 ด้วย “ความสามารถในการตัดสินใจ” ให้คำตอบได้ดีกว่า และ “ความสามารถในการคิดอย่างรอบคอบ” เมื่อต้องตอบคำถามที่ยากขึ้นและสับซ้อนขึ้น
Gemini ดีกว่า GPT4.0 ยังไง?
Gemini เป็น Multi-modal Large Language model (LLM) ที่จะมาแทน LaMDA และ PaLM 2 และด้วยความที่เป็น Multimodal จึงสามารถรองรับ Code, Text, Sound, Image, และ VDO ความฉลาดของ Gemini นั้นคือความสามารถตัดสินใจและตอบคำถามที่ซับซ้อน ไม่ว่าจะเป็นในเรื่องของ ฟิสิกส์ คณิตศาสตร์ เป็นต้น
จากตัวอย่างในรูป เมื่อใส่ promptว่า “จากรูป รถคันไหนจะไปได้เร็วกว่า” พร้อมกับแนบรูป ซึ่งเจ้าตัว Gemini ก็ได้ให้คำตอบมาว่า “รถในรูปทางขวาจะไปได้เร็วกว่า พร้อมกับให้เหตุผลด้วยว่าทำไมถึงไปได้เร็วกว่า”
และเมื่อลองให้ทายชื่อหนังจากรูปภาพคำไบ้ Gemini ก็ตอบได้ถูกต้องเช่นกัน นอกจากนี้แล้วความสามารถในการวิเคราะห์จากวิดีโอก็ทำได้เช่นกัน ตัวอย่างเช่น อัพโหลดวิดีโอพร้อมกับถามว่าจากแก้ว 3 ใบนี้มีลูกบอลซ่อนอยู่แก้วไหน
นอกจากความสามารถในการตอบคำถามที่ซับซ้อนแล้ว จุดเด่นของ Gemini ในข้อก็คือ Advanced Reasoning Capabilities หรือ ความสามารถในใช้เหตุผลในการตัดสินใจ เมื่อลองให้อ่าน ผลงานวิจัยจำนวนมากโดยใส่ prompt ว่า “อ่านวิจัยแล้วบอกว่าวิจัยนี้พูดถึงตัวแปรที่ไม่เข้ารหัสในจีโนมของมนุษย์นั้นมีส่วนเกี่ยวข้องกับโรคชนิดหนึ่ง หรือไม่”
ซึ่ง Gemini ก็ให้ตอบได้ถูกต้องและยังแยกงานวิจัยให้ด้วยว่า วิจัยไหนเกี่ยวข้อง วิจัยไหนไม่เกี่ยวข้อง และมีความเกี่ยวข้องเชื่อมโยงกันกี่เปอร์เซ็นต์
Gemini 1.0 จะมี 3 โมเดล ได้แก่ Ultra, Pro, Nano ซึ่งตัว Gemini Nano โมเดลขนาดเล็กแต่ประสิทธิภาพสูง เหมาะสำหรับ device หรือใช้งานบนโทรศัพท์ Gemini Pro โมเดลขนาดรองลงมา รองรับการใช้งานที่หลากหลาย และ Gemini Ultra โมเดลขนาดใหญ่ที่สุด รองรับข้อมูล 1T-2M พารามิเตอร์ ที่มีความซับซ้อนสูง
จากการทดสอบตามรายงานของ Google พิสูจน์ให้เห็นแล้วว่า Gemini Ultra แสดงประสิทธิภาพได้ดีกว่า GPT 4.0 ในแทบจะทุกด้านไม่ว่าจะเป็น MMLU (Massive Multitask Language Understanding) หรือ การเขียนโค้ดก็ตาม
Google ยืนยันแล้วว่าจะสามารถใช้งานโมเดล Gemini Nano และ Gemini Pro ใน Bard chatbot วันที่ 13 ธันวาคม 2566 นี้ ส่วน Gemini Ultra ยังอยู่ในขั้นตอนเปิดให้ทดลองใช้งาน โดยเตรียมจะเปิดให้ใช้งานในปีหน้า
เบื้องต้น Gemini 1.0 ยังรองรับแค่เฉพาะภาษาอังกฤษเท่านั้น ส่วนภาษาอื่นๆจะอัพเดทเข้ามาในภายหลัง ใครที่สนใจอยากศึกษาข้อมูลเพิ่มเติมว่า Gemini ทำอะไรได้อีกบ้างสามารถ เข้าไปดูได้บนเว็ปไซต์Gemini ได้เลยครับ