Amazon SageMaker รองรับการรันงานเทรน Machine Learning ในคลัสเตอร์ Kubernetes

Amazon SageMaker เป็นบริการเทรนโมเดล machine learning (ML) บนเครื่องของ AWS โดยรองรับเฟรมเวิร์คยอดนิยมอย่าง TensorFlow, Apache MXNet, PyTorch, Chainer, Scikit-learn, SparkML, Horovod, Keras, Gluon

ในงาน re:Invent 2019 ประจำปีนี้ AWS เพิ่มฟีเจอร์ให้ SageMaker สามารถไปรันบนคลัสเตอร์ Kubernetes ได้ง่ายขึ้นด้วย

AWS บอกว่าลูกค้าจำนวนมากของตัวเองรัน Kubernetes อยู่แล้ว แต่การนำงาน ML ไปรันบน Kubernetes ต้องปรับแต่งเองเยอะ (เช่น คอนฟิกให้ Kubernetes ทำงานกับ GPU ได้ดีขึ้น เพราะงาน ML ส่วนใหญ่มักรันบน GPU)

AWS จึงอำนวยความสะดวกให้ลูกค้าด้วย Amazon SageMaker Operators for Kubernetes ที่แก้ปัญหาเหล่านี้มาให้แล้ว การรันงานเทรนนิ่ง SageMaker บน Kubernetes จึงพร้อมใช้ทันที

AWS ยังปรับแต่งประสิทธิภาพการใช้เครื่องมาเป็นอย่างดี เครื่องจะเปิดและ provision เมื่อถูกร้องขอเท่านั้น และปิดให้อัตโนมัติเมื่องานเทรนนิ่งเสร็จตามที่กำหนด ช่วยให้ลูกค้าประหยัดค่าเครื่องในระบบ AWS ลงได้ด้วย

ที่มา – AWS Blog

from:https://www.blognone.com/node/113468