ถ้าคุณกำลังมองหาโมเดล AI สายวิชั่นที่มีขนาดเล็กแต่พอดีสำหรับการใช้งานจริง ที่ทำงานได้เหนือกว่าโมเดลใหญ่โตของ OpenAI และ Google อยู่ล่ะก็ ต้องรู้จักกับโมเดลใหม่ล่าสุดของ IBM ที่ชื่อ Granite Vision 3.3 2B กันหน่อยแล้ว เพราะมันทำคะแนนได้สูงสุดในกลุ่มโมเดลที่มีพารามิเตอร์ไม่เกิน 7 พันล้านรุ่นอื่นๆ ในการทดสอบ OCRBench ซึ่งเปรียบเสมือนสนามประลองความสามารถด้านการอ่านข้อมูลจากภาพ เรียกได้ว่าเจ๋งไม่ใช่เล่นในเวทีนี้เลยแหละ
รู้จัก Granite Vision 3.3 2B
โมเดลนี้เกิดจากโครงการใหญ่ของ IBM ที่ตั้งใจสร้าง AI ที่ไม่ใช่แค่เข้าใจภาษา แต่สามารถเข้าใจข้อมูลจากภาพได้ด้วย ไม่ว่าจะเป็นกราฟ ตาราง โน้ต หรือลายมือบนเอกสารที่เราใช้กันทุกวัน รวมถึงยังรองรับภาพถ่ายทั่วไปอีกด้วย ซึ่งนอกจากโมเดลนี้แล้ว IBM ยังส่งโมเดลจดจำเสียงใหม่แกะกล่องออกมาอีกด้วย ซึ่งก็ทำผลงานได้น่าประทับใจไม่น้อยเหมือนกัน
OCRBench คืออะไร ทำไมสำคัญ?
OCRBench เป็นมาตรฐานที่วงการ AI นิยมใช้วัดความสามารถของโมเดลในการตีความข้อมูลจากภาพ มีการถามคำถามเกี่ยวกับการอ่านข้อความจากภาพ 1,000 ข้อ ที่ครอบคลุมการอ่านตัวหนังสือ การจับใจความสำคัญ และแบบสอบถามขั้นสูงที่ต้องใช้ความเข้าใจลึกซึ้ง เช่น คณิตศาสตร์ลายมือหรือการตอบคำถามจากภาพต่างๆ
และที่น่าสนใจสุดๆ คือ Granite Vision 3.3 2B ทำคะแนนได้ดีมากในด้านการอ่านคณิตศาสตร์ลายมือ และตอบคำถามเกี่ยวกับภาพฉากต่างๆ แซงหน้าชื่อใหญ่ๆ อย่าง Google, OpenAI และ Meta ไปได้ สะท้อนว่าการฝึกฝนและออกแบบโมเดลของ IBM นั้นได้ผลสุดๆ
ทำไม Granite Vision ถึงเจ๋งกว่า?
- IBM เพิ่ม encoder ใหม่เข้ามาในโมเดล ช่วยให้โมเดลเข้าใจข้อมูลจากภาพได้ดีขึ้น
- ใช้ข้อมูลตัวอย่างที่ตรงกับเรื่องเอกสารและการใช้งานธุรกิจจริง ทำให้โมเดลใช้งานได้ตรงใจและใช้งานได้จริงมากขึ้น
- โมเดลไม่ได้ใหญ่โตจนใช้ทรัพยากรมาก แต่มีประสิทธิภาพสูงและกินพลังงานน้อยกว่า
- ทำให้ใครที่ต้องการประหยัดต้นทุนหรืออยากได้เครื่องมือที่รันได้ไวๆ ใช้งานง่าย มีตัวเลือกที่ดีมาก
- มุมมองระยะยาว IBM มองว่าโมเดลรุ่นนี้จะสามารถคิดวิเคราะห์และทำงานเชิงภาพได้โดยไม่ต้องบรรยายคำสั่งซับซ้อนนัก
เอาไปใช้ยังไงดีสำหรับคน Gen Y – Gen Z ที่ทำงานหรือกำลังเริ่มต้นธุรกิจ
ถ้าคุณเป็นคนรุ่นใหม่ที่เพิ่งทำงานหรือกำลังจะเริ่มทำธุรกิจส่วนตัว หรือแม้แต่คนทำคอนเทนต์ ที่กำลังมองหา AI ตัวช่วยที่เก่งเรื่อง “เข้าใจภาพ” แต่ขนาดไม่ใหญ่กินสเปคเครื่องเกินไป Granite Vision 3.3 2B ถือเป็นตัวเลือกน่าสนใจมาก เพราะมันสามารถ:
- ช่วยทำความเข้าใจรูปภาพ กราฟ หรือตารางในเอกสารงาน หรือข้อมูลที่ซับซ้อนประจำวันได้
- ประหยัดเวลาและพลังงานเครื่อง เลยเหมาะกับการใช้งานแบบเวลาจริงหรือบนอุปกรณ์ที่ไม่ได้แรงเว่อร์
- ช่วยให้ทำงานกับข้อมูลเชิงภาพได้โดยไม่ต้องเขียนคำสั่งยาวๆ ให้ยุ่งยาก
- เป็น AI ที่ถูกออกแบบมาให้เหมาะกับการใช้งานจริงในธุรกิจและชีวิตประจำวัน ที่มีเอกสารและข้อมูลหลากหลายรูปแบบ
มองภาพรวมตลาดหุ้น IBM ตอนนี้
สำหรับคนที่สนใจลงทุน หุ้น IBM ตอนนี้นักวิเคราะห์ในตลาดวอลล์สตรีทมีมุมมอง “ซื้อค่อนข้างเเนะนำ” โดยมีสัดส่วนการให้คำแนะนำดังนี้:
- 7 ครั้ง แนะนำ “ซื้อ”
- 5 ครั้ง แนะนำ “ถือ”
- 2 ครั้ง แนะนำ “ขาย”
โดยเป้าราคาหุ้นเฉลี่ยอยู่ที่ 269.46 ดอลลาร์ต่อหุ้น ซึ่งหมายความว่ามีความเสี่ยงลดลงประมาณ 8.6% ทำให้การลงทุนใน IBM ยังน่าสนใจสำหรับคนที่มองหาโอกาสลงทุนที่มีความมั่นคงควบคู่ไปกับนวัตกรรม AI ใหม่ๆ
สรุปง่ายๆ ถ้าคุณเป็นคนรุ่นใหม่สายทำงาน หรือต้องการใช้ AI ที่เข้าใจภาพดีๆ ในชีวิตประจำวัน Granite Vision 3.3 2B ของ IBM ถือว่าปังและน่าใช้มาก แถมยังมาพร้อมกับประสิทธิภาพที่เหนือชั้นแต่ไม่กินสเปคเครื่องด้วยนะ
ที่มาของข้อมูล https://www.tipranks.com/news/heres-how-ibms-small-ai-vision-model-outperformed-openai-and-google-googl














