คลังเก็บป้ายกำกับ: COMPUTER_VISION

MIT โชว์หุ่นยนต์เล่นเกมตึกถล่ม Jenga ที่ทำได้ทั้งดัน ดึง และวางบล็อกไม้

MIT เปิดตัวหุ่นยนต์เล่นเกม Jenga ซึ่งประกอบด้วยแขนกลสำหรับจับแท่งไม้, ส่วนสำหรับดันแท่งไม้ และกล้องภายนอกเพื่อประเมินสถานการณ์ของตัวต่อทั้งหมดที่วางอยู่

อธิบายแบบรวดเร็วสำหรับคนที่ไม่รู้จักเกม Jenga หรืออาจเคยเล่นแต่ไม่รู้ว่าเรียก Jenga มันคือเกมที่มีชิ้นท่อนไม้ 54 ชิ้น ต่อเรียงกันเป็นตึก ผู้เล่นผลัดกันดึงแท่งไม้ออกหนึ่งชิ้น แล้วไปวางไว้ด้านบนสุด โดยไม่ทำให้ตึกถล่มลงมา ใครทำถล่มคนนั้นแพ้

ขั้นตอนการทำงานของหุ่นยนต์นี้ จะประเมินว่าแท่งไม้ไหนที่ควรดึงออกมา โดยใช้แขนดันออกมาก่อน แล้วใช้แขนหนีบดึงชิ้นไม้ออกมา และสุดท้ายหามุมวางที่เหมาะสมไม่ให้ตึกถล่ม หุ่นยนต์มีการเรียนรู้ โดยหากไม้ชิ้นใดที่ดันแล้วรู้สึกว่าฝืดเกินไป ก็จะเลี่ยงไม่ดันชิ้นนั้น

Alberto Rodriguez อาจารย์ของ MIT อธิบายว่าเกม Jenga มีความซับซ้อนกว่าโกะหรือหมากรุก เพราะต้องใช้ทักษะทางกาย เช่น การประเมินสภาพ, การดึง, การดัน, การวาง และการจัดเรียง ซึ่งสถานการณ์เปลี่ยนได้ตลอดเวลาและมีตัวแปรที่ซับซ้อน ส่วนการต่อยอดเทคโนโลยีของหุ่นยนต์นี้สามารถใช้ในงานที่ต้องมีการสัมผัสหยิบจับวัตถุ แต่ก็ต้องการความละเอียดอ่อน เช่นการแยกชิ้นส่วนรีไซเคิล หรือการประกอบวัตถุบางประเภท

ที่มา: MIT ผ่าน Interesting Engineering

alt="Jenga Robot"

from:https://www.blognone.com/node/107912

โฆษณา

LINE เปิดตัว Character Effect เปลี่ยนหน้าผู้ใช้เป็นการ์ตูนขณะวิดีโอคอลล์

ช่วงหลังเราเห็นฟีเจอร์แปลงใบหน้าเป็นการ์ตูนแอนิเมชันจากฝั่งผู้ผลิตมือถือ เช่น Animoji ของแอปเปิล หรือ AR Emoji ของซัมซุง

ฝั่งแพลตฟอร์มแชทอย่าง LINE ก็ประกาศออกฟีเจอร์แบบเดียวกันชื่อว่า Character Effect หลักการก็ไม่ต่างอะไรกัน ใช้เทคนิค computer vision มาช่วยแปลงใบหน้าของผู้ใช้เป็นการ์ตูน และขยับตามใบหน้าของผู้ใช้

จุดเด่นของ LINE Character Platform ย่อมหนีไม่พ้นการใช้คาแรกเตอร์ที่เรารู้จักกันดีจาก LINE Friends อย่างในตัวอย่างที่นำมาโชว์บนจอเป็นกระต่าย Cony ที่น่าจะเรียกความสนใจของผู้ใช้ได้อย่างมาก

No Description

Topics: 

from:https://www.blognone.com/node/106545

แนะนำ 10 โมเดลของ Deep Learning สำหรับงานด้าน Computer Vision

คงเป็นเรื่องยากที่เราจะเริ่มต้นเทรนโมเดลด้าน Deep Learning ด้วยตัวเองตั้งแต่เริ่มต้นในเวลาอันจำกัด วันนี้เราได้พบกับเว็บไซต์ที่นำเสนอโมเดลด้าน Computer Vision ที่ถูกเทรนมาแล้วให้ผู้สนใจสามารถนำไปต่อยอดได้ โดยจะแบ่งเป็น 4 หมวด คือ Object Detection, Facial Recognition และ Regeneration, Segmentation และสุดท้าย Miscellaneous

Object Detection

1.Mask R-CNN เป็น Framework ที่ออกแบบมาสำหรับการตรวจจับวัตถุได้อย่างยืดหยุ่น โดยสร้างจาก Python และ Keras (Neural Network API) ซึ่งในโปรเจ็คนี้จะสร้างขอบของแต่ละวัตถุในภาพ (ดูภาพตัวอย่างด้านบน) สามารถติดตามได้ที่นี่ https://github.com/matterport/Mask_RCNN

2.YOLOv2 เป็นที่นิยมในการทำ Deep Learning อีกตัวหนึ่ง โดยสร้างได้จาก Keras เช่นกัน และมีการทดลองนำไปใช้กับงาน เช่น ตรวจเซลล์เม็ดเลือดแดง รถยนต์ขับเคลื่อนอัตโนมัติ แต่โมเดลที่ถูกเทรนไว้แล้วจะอยู่ในส่วนของการตรวจหาภาพของแรคคูน (สามารถดาวน์โหลดชุดข้อมูลภาพแรคคูนได้ ที่นี่ ) ผู้สนใจสามารถติดตามค่า Weight ของโมเดลได้ ที่นี่ เนื้อหาของโปรเจ็คบน GitHub อยู่ที่ https://github.com/experiencor/keras-yolo2

credit : .analyticsvidhya.com

3.MobileNet เป็นโมเดลที่ถูกออกแบบมาสำหรับมือถือโดย Google นั่นเองโดยมาพร้อมกับ Weight ของโมเดลด้วยข้อมูลจากฐานข้อมูล ImageNet ที่ภายในรวบรวมภาพจำนวนหลายล้าน ซึ่งโมเดลนี้รองรับงานได้หลากหลาย (ดูจากภาพตัวอย่างด้านล่าง) สามารถติดตามได้ที่ https://keras.io/applications/#mobilenet

credit : .analyticsvidhya.com

4.Ripe/Unripe Tomato Classification โปรเจ็คนี้ใช้ Deep Learning เพื่อหาว่ามะเขือเทศสุกหรือยัง โดยโมเดลนี้ถูกเทรนข้อมูลด้วยรูปภาพของมะเขือเทศที่กว่า 390 ภาพ ลองหาทดสอบได้ที่ https://github.com/fyrestorm-sdb/tomatoes

credit : .analyticsvidhya.com

5.Car Classification หลายคนต้องสนใจโปรเจ็คนี้อยู่แน่ๆ คือการจำแนกรถโดยอาศัยภาพจาก Standford กว่า 16,185 ภาพจาก 196 ประเภท ติดตามได้ที่ https://github.com/michalgdak/car-recognition

credit : .analyticsvidhya.com

Facial Recognition และ Regeneration

เราคงคุ้นเคยกับคำว่า Facial Recognition เพราะมันคือการจดจำใบหน้านั่นเองแต่เมื่อพูดถึง Regeneration ในส่วนนี้ทางผู้เขียนบทความต้นฉบับหมายถึงการสร้างโมเดล 3 มิติของหน้าจากรูปหน้าขึ้นมาใหม่ซึ่งเป็นความท้าทายอย่างยิ่ง เช่น อุตสาหกรรมภาพยนต์ หรือ เกม เป็นต้น

credit : .analyticsvidhya.com

1.VGG-Face Model โมเดลนี้ถูกเทรนข้อมูลจาก VGG-Face ที่มีตัวตนหน้าอย่างมีลักษณะเฉพาะกว่า 2 ล้านรูป โดยการเทรนโมเดลถูกออกแบบตาม 2 ขั้นตอนคือ vgg-face-keras (การแปลงโมเดล vgg-face ไปยัง keras โมเดล) และ vgg-face-keras-fc (แปลงโมเดล  vgg-face Caffe ไปยังโมเดล mxnet และแปลงไปยังโมเดล keras อีกทีหนึ่ง) ผู้สนใจสามารถติดตามได้ที่ https://gist.github.com/EncodeTS/6bbe8cb8bebad7a672f0d872561782d9

2.3D Face Reconstruction from a Single Image โมเดลนี้เริ่มแรกพัฒนาด้วย Torch (ดาวน์โหลดโปรเจ็คต้นฉบับ) และแปลงเป็น Keras อีกทีหนึ่งเพื่อสร้างหน้า 3 มิติจากรูปภาพ ติดตามได้ที่ https://github.com/dezmoanded/vrn-torch-to-keras

credit : .analyticsvidhya.com

Segmentation

credit : .analyticsvidhya.com

1.Semantic Image Segmentation – Deeplabv3+ ทางด้านเจ้าของบทความได้ให้ความหมายของคำว่า Semantic Image Segmentation หมายถึงการให้ความหมายของทุกพิเซลในภาพเพื่อแบ่งประเภทว่าเป็นวัตถุใด เช่น ท้องฟ้า รถยนต์ หรืออื่นๆ ในส่วนของ Deeplabv3+ คือโมเดลจาก Google ซึ่งต้นฉบับเป็น TensorFlow ที่ถูกสร้างเป็น Keras อีกทีหนึ่ง โดยบน GitHub มีวิธีการและขั้นตอนนำไปใช้อย่างละเอียด ติดตามได้ที่ https://github.com/bonlime/keras-deeplab-v3-plus

2.Robot Surgery Segmentation โมเดลนี้พยายามแก้ปัญหาการผ่าตัดโดยใช้หุ่นยนต์เข้ามาช่วย ซึ่งปัญหาแบ่งเป็น 2 ส่วนคือ ต้องแยกแยะระหว่างเครื่องมือและพื้นหลัง อีกส่วนหนึ่งคือการแยกแยะเครื่องมือหลายส่วน ตัวโมเดลนี้ถูกเทรนด้วยเฟรมความละเอียดสูงของระบบภาพ 3 มิติ สามารถติดตามได้ที่ https://github.com/ternaus/robot-surgery-segmentation

credit : .analyticsvidhya.com

Miscellaneous

Image Captioning เป็นการผสานระหว่าง NLP และ Computer Vision ซึ่งความยากคือต้องการชุดข้อมูลขนาดใหญ่ที่ต้องไม่เอนเอียงไปทางใดทางหนึ่งด้วย ดังนั้นโซลูชันนี้จึงใช้การป้อนรูปภาพและคำอธิบายที่มีความหมายสั้นๆ โดยส่วนของ Encoder ที่ใช้คือ CNN นั่นเอง ส่วนฝั่ง Decoder คือการใช้ long Short-term memory network (LSTM) เพื่อทำนายคำอธิบายของรูปสามารถติดตามได้ที่ https://github.com/boluoyu/ImageCaption

credit : .analyticsvidhya.com

ที่มาและเครดิตรูปภาพ : https://www.analyticsvidhya.com/blog/2018/07/top-10-pretrained-models-get-started-deep-learning-part-1-computer-vision/

from:https://www.techtalkthai.com/10-pre-trained-deep-learning-models-in-computer-vision/

แนะนำ 6 คอร์สออนไลน์ฟรีด้าน AI, Machine Learning และ Deep Learning โดย Forbes

Forbes ได้ออกมาแนะนำ 6 คอร์สออนไลน์ฟรีๆ ที่สอนด้านเทคโนโลยี AI, Machine Learning, Deep Learning จากบริษัทและมหาวิทยาลัยชั้นนำ จึงขอนำมาสรุปให้เป็นประโยชน์แก่ผู้อ่านทุกท่านดังต่อไปนี้

 

Credit: ShutterStock.com

 

1. Learn with Google AI

คอร์สนี้เปิดอยู่ที่ https://ai.google/education/ โดย Gogole ได้จัดคอร์สเรียนฟรีด้าน Machine Learning และการใช้เครื่องมืออย่าง TensorFlow ในการทำ AI โดยเหมาะกับผู้เรียนที่ยังไม่มีพื้นด้าน Machine Learning มาก่อนเลย และยังสามารถเลือกเรียนคอร์สที่สนใจก่อนได้ด้วย

 

2. Google: Machine Learning

คอร์สนี้เปิดอยู่ที่ https://www.class-central.com/course/udacity-deep-learning-5681 โดยเหมาะกับผู้ที่มีพื้นฐานด้าน Machine Learning มาบ้างอยู่แล้วไปจนถึงมีความคุ้นเคยกับแนวคิดของการทำ Supervised Learning มาก่อน เหมาะสำหรับผู้ที่ต้องการจะเป็น Data Analyst หรือ Data Scientist ที่ต้องการลงลึกด้าน Machine Learning และ Deep Learning ให้มากยิ่งขึ้น

 

3. Stanford University: Machine Learning

คอร์สนี้เปิดอยู่ที่ https://www.coursera.org/learn/machine-learning โดยเป็นคอร์สบน Coursera ที่สอนโดย Andrew Ng ผู้โด่งดัง ซึ่งผู้เรียนสามารถเลือกที่จะจ่ายเงินอัปเกรดคอร์สเพื่อให้ได้รับ Certificate เมื่อเรียนจบได้ด้วย ซึ่งเนื้อหาจะครอบคลุมถึงการประยุกต์นำ Machine Learning มใช้จริงในกรณีต่างๆ เช่นการทำ Speech Recognition ไปจนถึงการปรับปรุงระบบ Web Search และยังลงลึกด้านเนื้อหาเชิงเทคนิคและสถิติหรือคณิตศาสตร์ด้วย

 

4. Columbia University: Machine Learning

คอร์สนี้เปิดอยู่ที่ https://www.class-central.com/course/edx-machine-learning-7231 และเป็นอีกคอร์สหนึ่งที่สามารถจ่ายเงินอัปเกรดเพื่อรับ Certificate ตอนที่เรียนจบได้ โดยจะเน้นเรื่องของการฝึก Model, การใช้วิธีการต่างๆ ในการแก้ไขปัญหา ครอบคลุมทั้งการทำ Supervised Learning และ Unsupervised Learning

 

5. NVIDIA: Fundamentals of Deep Learning for Computer Vision

คอร์สนี้เปิดอยู่ที่ https://www.class-central.com/course/fundamentals-of-deep-learning-for-computer-vision-10730 โดยเหมาะสำหรับผู้ที่สนใจจะเจาะลึกด้านการทำ Computer Vision โดยเฉพาะ ซึ่งเนื้อหาจะครอบคลุมพื้นฐานเชิงเทคนิคด้านการทำ Cmputer Vision เพื่อทำ Object Recognition และ Image Classification โดยเฉพาะ รวมถึงยังมีการสอนเนื้อหาเกี่ยวกับการประยุกต์นำ GPU มาใช้เพื่อเร่งความเร็วในการประมวลผลให้สูงขึ้นด้วย

 

6. MIT: Deep Learning for Self Driving Cars

คอร์สนี้เปิดอยู่ที่ https://selfdrivingcars.mit.edu/ โดยจะเน้นสอนเทคโนโลยีที่เกี่ยวข้องกับการสร้างรถยนต์ไร้คนขับโดยเฉพาะ ซึ่งเนื้อหาจะครอบคลุมทั้งการนำ AI มาใช้วิเคราะห์ภาพ, ข้อมูลจาก Sensor ไปจนถึงการแปลงสัญญาณจากสมอง, ตา, หู และการสัมผัส เพื่อใช้ในการควบคุมรถยนต์

 

ที่มา: https://www.forbes.com/sites/bernardmarr/2018/04/16/the-6-best-free-online-artificial-intelligence-courses-for-2018/#219758bf59d7

from:https://www.techtalkthai.com/free-6-ai-machine-learning-deep-learning-online-courses-by-forbes/

Flippy หุ่นยนต์ทำเบอร์เกอร์ ที่ไม่ได้เป็นแค่แขนกลตั้งเวลาย่างเนื้อ

ถึงตอนนี้ทุกคนคงรู้ดีกันอยู่แล้วว่าหุ่นยนต์สามารถทำงานแทนคนได้หลายอย่าง ไม่ว่าจะเป็นงานสายการผลิตในโรงงาน, งานประชาสัมพันธ์และต้อนรับในโรงแรม แน่นอนว่ามีแม้กระทั่งหุ่นยนต์ปรุงอาหารในร้านอาหาร และ Flippy หุ่นยนต์นักทำเบอร์เกอร์ ผลงานการพัฒนาโดย Miso Robotics ก็คือหนึ่งในนั้น มันไม่ได้เป็นแค่หุ่นยนต์แขนกลธรรมดาที่ย่างเบอร์เกอร์ไปวันๆ มันมองเห็น คิดเป็น และถูกออกแบบมาให้ทำงานร่วมกับคนได้

ในบรรดาหุ่นยนต์สารพัดประเภท หุ่นยนต์แบบแขนกลเป็นประเภทที่พบเจอได้บ่อยมากในสายการผลิตต่างๆ ของโรงงานอุตสาหกรรม ด้วยการเคลื่อนไหวที่แม่นยำ ทรงพลังด้วยแรงขับจากลมและไฟฟ้า ทำงานได้อย่างเที่ยงตรง ทำซ้ำได้เหมือนกันแทบไม่ผิดเพี้ยนเลยทุกรอบที่มันทำงาน มันจึงรับหน้าที่ทำงานแทนคนในหลายตำแหน่งที่ต้องขยับและเคลื่อนไหวซ้ำๆ

Flippy เองที่แม้จะเป็นหุ่นยนต์แบบแขนกลเช่นกัน หากแต่มันเองมีความสามารถพิเศษที่แตกต่างออกไป ในขณะที่หุ่นยนต์แขนกลที่ใช้กันโดยมากในสายการผลิตจะเคลื่อนไหวด้วยรูปแบบไม่กี่รูปแบบตามโปรแกรมที่ถูกตั้งเอาไว้ ด้วยเงื่อนจังหวะและสัญญาณที่เข้ามาจากเซ็นเซอร์ แต่ Flippy มีการทำงานที่ยืดหยุ่นมากกว่าเพราะมันมี “ดวงตา” วิเคราะห์ภาพที่มันมองเห็น

เป้าหมายของ Miso Robotics คือพัฒนา Flippy เพื่อรับบทบาทเป็นผู้ช่วยคนครัวเรื่องงานย่างเนื้อและส่วนประกอบอื่นๆ บนเตาเหล็กร้อน ด้วยกล้องถ่ายภาพที่ติดอยู่เหนือแขนกลทำงานร่วมกับซอฟต์แวร์วิเคราะห์ภาพ Flippy จะรู้ได้ว่าสิ่งที่อยู่บนเตานั้นคืออะไร เนื้อเบอร์เกอร์, เนื้อไก่, ขนมปัง, หรือชีส? มันยังรู้ระดับความสุกของเนื้อได้จากการวิเคราะห์ภาพด้วย ทำให้มันสามารถกลับด้านเนื้อได้ในช่วงเวลาที่เหมาะสม และตักส่วนประกอบเบอร์เกอร์ออกจากเตา

Flippy ยังไม่สามารถเตรียมเบอร์เกอร์ได้ด้วยตนเองทุกขั้นตอน การนำวัตถุดิบขึ้นเตา, การจัดเรียงวัตถุุดิบซ้อนกันเป็นเบอร์เกอร์ รวมทั้งการปรุงรสต่างๆ ยังต้องอาศัยคนในการทำงาน แต่การที่มี Flippy ช่วยแบ่งเบางานหน้าเตา ก็น่าจะทำให้สามารถเพิ่มความเร็วในการทำงานโดยรวมได้

ล่าสุด Flippy ได้เริ่มงานจริงแล้วที่ร้าน CaliBurger ใน California แต่หลังเริ่มทำงานไม่นาน Miso Robotics ก็ตัดสินใจที่จะให้ Flippy พักงานชั่วคราวเพื่อรับการอัพเกรดเพิ่มเติม แม้ในการทำงานจริง Flippy จะยังไม่ดูฉลาดเหมือนในวิดีโอโปรโมตมันนัก การตักเบอร์เกอร์ใส่ถาดเตรียมยังดูขาดๆ เกินๆ อยู่บ้าง แต่ก็ต้องนับว่า Flippy เป็นหุ่นยนต์ที่ทำงานในครัวได้จริงแล้ว

ที่มา – The Verge

from:https://www.blognone.com/node/100551

เปิดตัว Facebook Detectron โครงการ Open Source สำหรับทำ Object Detection

Facebook AI Research (FAIR) ได้ออกมาประกาศเปิด Open Source ให้กับ Detectron ซึ่งเป็น Platform สำหรับการทำ Object Detection ในรูปภาพโดยเฉพาะ

Credit: Facebook

 

Detectron นี้เป็นโครงการที่ริเริ่มกันมาตั้งแต่เดือนมิถุนายน 2016 เพื่อสร้างระบบ Object Detection ที่มีความเร็วสูงและนำไปใช้งานได้อย่างยืดหยุ่น โดยพัฒนาต่อยอดมาจาก Caffe2 จนปัจจุบันได้กลายเป็นเบื้องหลังให้กับโครงการต่างๆ ภายใน Facebook เองเป็นจำนวนมาก ทั้ง Mask R-CNN และ Focal Loss for Dense Object Detection โดยอัลกอริธึมเหล่านี้บน Detectron จะสามารถช่วยสร้าง Model ที่จำเป็นต่องานทางด้าน Computer Vision ได้อย่างรวดเร็วและแม่นยำ

นอกจากนี้ภายใน Facebook เองก็ยังได้มีการนำ Detectron ไปใช้ต่อยอดกับระบบ Augmented Reality (AR) และการทำ Community Integrity ด้วย โดย Model ที่ได้มาจาก Detectron นี้สามารถนำไปใช้ได้ทั้งบน Cloud และในอุปกรณ์ Mobile

เป้าหมายของ Facebook ในการออกมาเปิด Open Source ให้กับ Detectron ก็คือการช่วยเร่งให้โครงการวิจัยทั่วโลกนั้นสามารถก้าวหน้าต่อไปได้อย่างรวดเร็วยิ่งขึ้น โดย License ที่ใช้ในการเปิด Open Source ครั้งนี้คือ Apache 2.0 ส่วนผู้ที่สนใจสามารถศึกษารายละเอียดเพิ่มเติมได้ที่ https://github.com/facebookresearch/Detectron ครับ

 

ที่มา: https://research.fb.com/facebook-open-sources-detectron/

from:https://www.techtalkthai.com/facebook-detectron-object-detection-is-now-an-open-source-project/

ล้ำไปอีกขั้น Pornhub นำปัญญาประดิษฐ์เข้ามาช่วยจัดการเนื้อหาให้ดียิ่งขึ้น

Pornhub ผู้ให้บริการเนื้อหาภาพยนต์สำหรับผู้ใหญ่เบอร์หนึ่งของโลก นำปัญญาประดิษฐ์มาช่วยเพิ่มประสิทธิภาพในการจัดการเนื้อหาบนเว็บไซต์ โดยติดป้ายกำกับเพื่อจัดหมวดหมู่ให้เหมาะสม

เป้าหมายหลักของการนำปัญญาประดิษฐ์มาใช้คือ เพิ่มความแม่นยำในการค้นหาภาพยนต์ให้แก่ผู้ใช้งาน และลดความยากลำบากในการตรวจสอบความถูกต้องของป้ายกำกับ เนื่องยอดอัพโหลดวิดีโอที่มีมากกว่า 10,000 เรื่องต่อวัน งานหลักเท่าที่เผยแพร่ออกมามีสองชิ้นคือ ตรวจจับดาราหนังเพื่อระบุและกำกับรายชื่อนักแสดง และตรวจจับลักษณะท่าทางการร่วมรักเพื่อติดป้ายกำกับแนวภาพยนต์

เทคนิคการทำงานเปิดเผยรายละเอียดมาเพียงคร่าว ๆ ว่าระบบจะนำวิดีโอมาสแกนภาพทุก ๆ เฟรม แล้วส่งไปให้ตัวแบบแยกแยะออกมาว่าวิดีโอที่กำลังประมวลผลอยู่นั้นอยู่ในหมวดหมู่ใด โดยตัวแบบแต่ละตัวจะถูกฝึกมาจากข้อมูลหลายพันตัวอย่างที่ประกอบไปด้วย ชื่อ ภาพใบหน้าของดาราคนนั้น และท่าทางขณะกำลังร่วมรัก ต้นทางระบุว่าระบบของทางเว็บไซต์สามารถแสดงผลลัพธ์การแยกแยะชื่อและท่าทางการร่วมรักออกมาได้หลายแบบพร้อม ๆ กันขณะกำลังทำงาน

alt="ภาพประกอบจาก Engadget"(ภาพจำลองการทำงานของระบบคร่าว ๆ ในฉบับ Pornhub)

alt="ภาพประกอบจาก DIUS"(ภาพตัวอย่างการทำงานของตัวแบบด้วยเทคนิค Faster R-CNN ทาง Pornhub ไม่ได้ระบุมาว่าใช้เทคนิคตัวไหนนะครับ)

อย่างไรก็ดี ตัวแบบยังไม่สามารถแยกแยะนักแสดงที่ถูกการบดบังวิสัยทัศน์ของใบหน้าและท่าทางนักแสดงมากเกินไป เช่นวิดีโอประเภท การลงโทษโดยมีพันธนาการ เนื่องจากมีอุปกรณ์มากมายนั่นเอง รวมถึงวิดีโอที่มีเพียงภาพบางส่วนของร่างกาย เช่น วิดีโอที่มีแต่เท้า ซึ่งตัวแบบจะไม่สามารถระบุได้ว่าใครคือนักแสดง

มากไปกว่านั้นทางเว็บก็จะเปิดให้ผู้ใช้มาร่วมด้วยช่วยกันฝึกตัวแบบคนละไม้คนละมือ โดยยืนยันความถูกต้องของตัวแบบด้วยการโหวต (คล้ายกับที่เราฝึกตัวแบบให้ Google Capcha โดยการระบุภาพให้ตรงคำบรรยาย)

ทางเว็บไซต์วางแผนไว้ว่าจะนำวิดีโอทั้งหมดราว 5 ล้านเรื่องมาตรวจสอบจนครบภายในปีหน้า

ที่มา – Engadget, Pornhub

ส่วนตัวคิดว่าอาการเมาวิดีโอของทีมงานก็จะลดลงไปพอสมควรด้วยเช่นกัน

from:https://www.blognone.com/node/96245