คลังเก็บป้ายกำกับ: DATA_SCIENCE

แนะนำ 15 Certificate ด้าน Data Science

สำหรับวันนี้เราขอนำเสนอบทความจาก CIO ที่ได้แนะนำเรื่อง Certificate สำหรับด้าน Data Science ซึ่งหากใครกำลังพิจารณาเพื่อเปลี่ยนสายงานไปทำอาชีพที่ว่ากันว่าเป็นอาชีพที่ ‘Sexy’ สุดๆ ในยุคนี้ หวังว่าบทความนี้จะช่วยประกอบการตัดสินใจของท่านได้ครับ

Credit: ShutterStock.com

1.Applied AI with Deep Learning, IBM Watson IoT Data Science Certificate

การได้มาซึ่ง Certificate ตัวนี้ผู้เรียนสมควรจะมีความรู้พื้นฐานในการเขียนโปรแกรมมาก่อน ถ้าจะให้ดีก็ควรเป็น Python อย่างไรก็ตามความรู้คณิตศาสตร์ก็สำคัญไม่แพ้กันโดยเฉพาะ Linear Algebra อย่างไรก็ตามช่วงแรกในคอร์สจะครอบคลุมไว้อยู่แล้ว

ค่าใช้จ่าย : เรียนได้ผ่าน Coursera ประมาณ 49 ดอลล่าร์สหรัฐฯ ต่อเดือน

สถานที่ : ออนไลน์

ระยะเวลา : ไม่กำหนด

อายุของ Certificate : ไม่มี

2.Certified Analytics Professional (CAP)

เป็น Certificate ที่ไม่ผูกติดกับ Vendor รายใดซึ่งคาดหวังว่าเมื่อเรียนจบแล้วผู้เรียนจะสามารถแปลงข้อมูลที่ซับซ้อนให้ไปเป็นสิ่งที่มีคุณค่าต่อธุรกิจและสามารถนำไปใช้งานต่ออย่างเกิดประโยชน์ได้คือไม่ใช่แค่เข้าใจข้อมูลแต่สามารถมองภาพสรุปและสามารถอธิบายต่อผู้ถือหุ้นได้ว่าข้อมูลจุดไหนสำคัญอย่างไร สำหรับพวกมือใหม่แนะนำให้ไปสอบคอร์สพื้นฐานที่ aCAP (Associate) ก่อนแล้วค่อยมา CAP ต่อ

ค่าใช้จ่าย : สมาชิกของ INFORMS ราคา 495 ดอลล่าร์สหรัฐฯ, ไม่ใช่สมาชิก 695 ดอลล่าร์สหรัฐฯ (มีราคาสำหรับสอบหลายคนให้องค์กรด้วย)

สถานที่ : ศูนย์สอบ

ระยะเวลา : ไม่กำหนด

อายุของ Certificate : 3 ปี

3.Cloudera Certified Associate : Data Analyst

ใบประกาศตัวนี้ออกให้สำหรับผู้ที่มีความรู้พื้นฐานในฐานะของนักพัฒนา นักวิเคราะห์ข้อมูล และเป็นแอดมินของซอฟต์แวร์ระดับองค์กรของ Cloudera ได้ โดยเหมาะสำหรับนำไปโชว์ว่ามีความรู้พื้นฐานสำหรับ Data Scientist มาแล้ว

ค่าใช้จ่าย : 295 ดอลล่าร์สหรัฐฯ 

สถานที่ : ออนไลน์

ระยะเวลาของการเรียน : ไม่กำหนด

อายุของ Certificate : 2 ปี

4.Cloudera Certified Associate : CCP Data Engineer

ผู้สอบต้องผ่านตัวที่ 3 (Data Analyst) มาก่อนและทาง Cloudera คุยว่าการสอบเป็นแบบ ‘Performance-based’ ซึ่งผู้สอบต้องมีประสบการณ์เชิงลึกเกี่ยวกับการพัฒนาโซลูชันฝั่ง Data Engineering และความรู้ขั้นสูงในทักษะ Data Science โดยโจทย์คือให้แก้ปัญหาของลูกค้า 8 ถึง 12 ข้อด้วย Clouder Enterprise Cluster ในเวลา 120 นาทีกับเกณฑ์ผ่านขั้นต่ำ 70%

ค่าใช้จ่าย : 600 ดอลล่าร์สหรัฐฯ ต่อการสอบตัวนี้ (ภายในมี 3 สอบย่อย)

สถานที่ : ออนไลน์

ระยะเวลา : ไม่กำหนด

อายุของ Certificate : 3 ปี

5.Data Science Council of America (DASCA)

Certificate ตัวนี้ตั้งใจวัดความเชี่ยวชาญขั้นสูงสำหรับการผู้ที่สามารถบริหารจัดการและเป็นผู้นำด้านกลยุทธ์ Big Data ที่จำเป็นต่องค์กร โดยภายใน Track แบ่งเป็น 2 ส่วนคือ Senior Data Scientist (SDS) และ Principal Data Scientist (PDS) ซึ่งผู้สอบจะต้องมีประสบการณ์ด้าน Big Data Analytics อย่างน้อย 6 ปี เพื่อสอบ SDS และ 10 ปีสำหรับ PDS ซึ่งตัวข้อสอบจะเป็นแบบหลายตัวเลือกจำนวน 85-100 ข้อในระยะเวลา 100 นาที

ค่าใช้จ่าย : 520 ดอลล่าร์สหรัฐฯ 

สถานที่ : ออนไลน์

ระยะเวลา : ไม่กำหนด

อายุของ Certificate : 5 ปี

6.Dell EMC Data Scientist Associate (EMCDSA)

ใบประกาศสำหรับมือใหม่ที่อยากเรียนรู้หรือกำลังมองหาโอกาสเปลี่ยนสายงานมาทาง Data Scientist ทำให้ตัวข้อสอบไม่ได้หวังว่าผู้เข้าสอบจะต้องมีความรู้แน่นด้าน Machine Learning, สถิติ, คณิตศาสตร์หรือการวิเคราะห์ อีกทั้งเป็นใบรับรองพื้นฐานก่อนเข้าสอบในใบที่ 7 ด้วย (ด้านล่าง)

ค่าใช้จ่าย : 230 ดอลล่าร์สหรัฐฯ ไม่รวมค่าซื้อหนังสือหรือสิ่งจำเป็นในคอร์สรายการอื่นๆ

สถานที่ : ออนไลน์ผ่าน Pearson VUE

ระยะเวลา : ไม่กำหนด

อายุของ Certificate : 3 ปี

7.Dell EMC Data Scientist Advance Analytics Specialist (EMCDS)

เป็นเนื้อหาต่อยอดมาจากระดับ Associate อีกทีและเพิ่มความรู้ทั่วไปสำหรับการทำ Big Data Analytics ในแต่ละอุตสาหกรรมและเทคโนโลยีต่างๆ อย่างไม่เฉพาะเจาะจงไปที่ผลิตภัณฑ์หรืออุตสาหกรรมใดๆ โดยจะครอบคลุมในเรื่อง Advanced Analytics Method, Social Network Analysis, Natural Language Processing, Data Visualization Method และเครื่องมือยอดฮิตอย่าง Hadoop, Pig, Hive และ HBase เป็นต้น

ค่าใช้จ่าย : 230 ดอลล่าร์สหรัฐฯ ไม่รวมค่าซื้อหนังสือหรือสิ่งจำเป็นในคอร์สรายการอื่นๆ

สถานที่ : ออนไลน์ผ่าน Pearson VUE

ระยะเวลา : ไม่กำหนด

อายุของ Certificate : 2 ปี

8.HDP Data Science

คอร์สจาก Hotonworks ที่ครอบคลุมหัวข้อด้าน Data Science เช่น Machine Learning และ Neural Language Processing ไปจนถึงคอนเซปต์และอัลกอรึทึมสำหรับ Classification, Regression, Clustering, Dimensionality, Reduction และ Neural Network พร้อมกันนี้ยังมีเครื่องมือและ Framework ใหม่ๆ อย่าง Python, NumPy, Pandas, SciPy, Sckikit-learn, NLTK, TensorFlow, Jupyter, Spark MLib, Standford CoreNLP, TensorFlowOnSpark/Horovod/MLEap และ Apache Zepprlin ซึ่งครึ่งหนึ่งของคอร์สจะเป็นการบรรยาย ส่วนที่เหลือเป็น Lab ซึ่งผู้เรียนจะเจอทั้งหมดก่อนเข้าสอบ

ค่าใช้จ่าย : 250 ดอลล่าร์สหรัฐฯ 

สถานที่ : ออนไลน์

ระยะเวลา : 4 วัน

อายุของ Certificate : 2 ปี 

9.IBM Certified Data Architect

สำหรับใครที่มั่นใจว่าเจ๋งแล้วคอร์สจาก IBM ต้องการคุณสมบัติของผู้เข้าสอบสูงมาก เช่น Cluster Management, Data modeling, Data Linage และ Governance, LDAP Security และ Best Practice สำหรับ Big Data ทั่วไป และอื่นๆ อีกมากมายที่นี่ รวมไปถึงควรมีประสบการณ์กับซอฟต์แวร์อย่าง BigInsights, BigSQL, Hadoop และ Cloudant (NoSQL) มาก่อนด้วย โดยข้อสอบมี 55 ข้อแบ่งเป็น 5 การวัดความรู้คือ Requirement, Use cases, Apply Technoligies, Recoverability ซึ่งการสอบใช้เวลา 90 นาที อย่างไรก็ตาม IBM มีการจัดเทรนผ่านเว็บหรือห้องเรียนจริงเพื่อสอน InfoSphere BigInsights, BigInsights Analytics for Programmer และ Big SQL for Developer ด้วย

ค่าใช้จ่าย : 200 ดอลล่าร์สหรัฐฯ 

สถานที่ : ออนไลน์

ระยะเวลา : 90 นาที

อายุของ Certificate : ไม่มี

10.Microsoft MCSE : Data Management and Analytics

Certificate ของไมโครซอฟต์จะครอบคลุมกว้างๆ ด้าน IT Specialist ที่มี Data Science เป็นส่วนหนึ่งในนั้น ซึ่งภายในมีความเชี่ยวชาญพิเศษเป็น 2 คอร์สคือ Business Application กับคอร์ส Data Management และ Analytics อย่างไรก็ตามก่อนจะสอบ MSC(E) ต้องไปดูข้อกำหนดพื้นฐานจากหน้าเว็บไมโครซอฟต์กันเสียก่อน (ว่าต้องผ่านวิชาอะไร)

ค่าใช้จ่าย : 165 ดอลล่าร์สหรัฐฯ 

สถานที่ : ออนไลน์

ระยะเวลา : ไม่กำหนด

อายุของ Certificate : 3 ปี

11.Microsoft Certified Azure Data Scientist Associate

การสอบตัวนี้มุ่งหวังในการวัดผู้เข้าสอบว่าสามารถ Train, Evaluate และ Deploy Model เพื่อแก้ปัญหาของธุรกิจได้หรือไม่ ซึ่งผู้สอบจะต้องถูกทดสอบเรื่อง Machine Learning, โซลูชันด้าน AI, Natural Language Processing, Computer Vision และ Predictive Analytics

ค่าใช้จ่าย : 165 ดอลล่าร์สหรัฐฯ 

สถานที่ : ออนไลน์

ระยะเวลา : ไม่กำหนด

อายุของ Certificate : 3 ปี

12.Microsoft Professional Program in Data Science

เน้นด้าน Data Science 8 หัวข้อคือ T-SQL, Microsoft Excel, PowerBI, Python, R, Azure Machine Learning, HDInsight และ Spark โดยทางไมโครซอฟต์อ้างว่ามีงานกว่า 1.5 ล้านตำแหน่งต้องการผู้มีทักษะเหล่านี้ นอกจากนี้คอร์สจะเริ่มทุกไตรมาสผู้เรียนไม่จำเป็นต้องทำตามลำดับขอเพียงแค่เข้าเรียนสัปดาห์ละ 2-4 ชั่วโมงก็พอ

ค่าใช้จ่าย : ต้องมีเครดิตผ่านทาง EdX , เครื่องมือจำเป็นบางส่วนฟรี

สถานที่ : ออนไลน์

ระยะเวลา : 6 สัปดาห์

อายุของ Certificate : 3 ปี

13.SAS Certified Advanced Analytics Professional

โปรแกรมคอร์สครอบคลุมเรื่อง Machine Learning, เทคนิคด้าน Predictive Modeling, การทำงานกับ Big data sets, การค้นหารูปแบบ, เทคนิคการทำ Data Optimizing และ Time series forecasting โดยภายในจะแบ่งเป็น 9 คอร์สย่อยและสอบ 3 ครั้ง ทั้งนี้คาดหวังว่าผู้เข้าร่วมต้องมีประสบการณ์อย่างต้อง 6 เดือนในการเขียนโปรแกรม SAS หรือภาษาอื่น รวมถึงควรปีประสบการณ์กับการใช้งานคณิตศาสตร์หรือการตั้งค่าสถิติในธุรกิจมาแล้วอย่างน้อย 6 เดือนเช่นกัน

ค่าใช้จ่าย : 299 ดอลล่าร์สหรัฐฯ ต่อการเรียนหนึ่งเดือน 

สถานที่ : ออนไลน์

ระยะเวลา : ไม่กำหนด

อายุของ Certificate : ไม่มี

14.SAS Certified Big Data Professional

การเรียนมี 2 โมดูลซึ่งแบ่งเป็น 9 คอร์สย่อยกับสอบ 2 ครั้งจะครอบคลุมในหัวข้อทักษะการเขียนโปรแกรม SAS, การทำงานกับข้อมูล, การเพิ่มคุณภาพข้อมูล, พื้นฐานสำคัญของสถิติและวิเคราะห์, Data Visualization และเครื่องมือยอดฮิตอย่าง Hadoop, Hive, Pig, SAS เช่นกันผู้เข้าร่วมต้องมีประสบการณ์อย่างต้อง 6 เดือนในการเขียนโปรแกรม SAS หรือภาษาอื่น

ค่าใช้จ่าย : 299 ดอลล่าร์สหรัฐฯ ต่อการเรียนหนึ่งเดือน 

สถานที่ : ออนไลน์

ระยะเวลา : ไม่กำหนด

อายุของ Certificate : ไม่มี

15.SAS Certified Data Scientist

ผู้เข้าร่วมโปรแกรม Certificate ตัวนี้ต้องผ่านคอร์ส Big Data Professional และ Advanced Analytics Professional มาเสียก่อน สำหรับเนื้อหาจะกล่าวถึงเรื่อง ทักษะการเขียนโปรแกรม การบริหารจัดการและเพิ่มคุณภาพข้อมูล วิธีการทำงานกับเครื่องมือ Data Visualization ยอดนิยมต่างๆ และการประเมินข้อมูล

ค่าใช้จ่าย : 299 ดอลล่าร์สหรัฐฯ ต่อการเรียนหนึ่งเดือน 

สถานที่ : ออนไลน์

ระยะเวลา : ไม่กำหนด

อายุของ Certificate : ไม่มี

ที่มา : https://www.cio.com/article/3222879/15-data-science-certifications-that-will-pay-off.html

from:https://www.techtalkthai.com/15-data-science-certificates/

โฆษณา

รีวิวคอร์สออนไลน์ Data Science Pathway โดย Chula Mooc Achieve ราคา 5,500 บาท คุ้มค่าแค่ไหน? ได้เรียนอะไรบ้าง?

ยุคนี้ถือว่าเป็น Digital Disruption ที่ดิจิทัลเข้ามาป่วนกระแสแห่งการพัฒนา ซึ่งได้สร้างความปั่นป่วนไปแทบทุกวงการ ทุกสายวิชาชีพ รวมทั้งการศึกษา หลายคนมองไปไกลเกินไปบอกว่า AI หรือหุ่นยนต์มันมาสอนแทนครูจริง ๆ ไม่ได้หรอก!! ความจริงแล้วไม่ต้องถึงขั้นนั้นเลยครับ Digital Disruption จะป่วนวงการการศึกษาด้วยสิ่งง่าย ๆ อย่างการเรียนการสอนออนไลน์ แม้ตลาดตอนนี้จะเป็นเพียงการสื่อสารทางเดียว นั่นคือ เราเรียนด้วยตัวเอง ผ่านคลิปวิดีโอการสอน แต่มันก็มาพร้อมแพลตฟอร์มที่ออกแบบมาสนับสนุนให้เกิดการเรียนรู้ให้มากที่สุด เช่น มีคำถามให้ผู้เรียนตอบระหว่างการดูคลิปการสอน การทำแบบฝึกหัด การบ้าน แบบทดสอบ รวมทั้งสร้างคอมมูนิตี้เพื่อเป็นช่องทางในการสื่อสารระหว่างผู้สอนและผู้เรียน และมีการพัฒนาขึ้นเรื่อย ๆ ซึ่งเทคโนโลยีปัจจุบันมันไปไกลจนสามารถโต้ตอบกันได้แบบเรียลไทม์ใกล้เคียงกับการเรียนการสอนในห้องแล้ว เพียงตอนนี้มยังไม่ใช้ในเชิงพาณิชย์เท่านั้นเอง ซึ่งปัจจุบันตลาดมันเติบโตขึ้นเรื่อย ๆ สักวันก็จะมีความแพร่หลายมากขึ้น ให้เราลองนึกภาพครูที่สอนเก่ง ๆ สื่อสารกับนักเรียนได้ดีผ่านคลิปวิดีโอ มีทีมงานช่วยกันตอบคำถามผ่านเฟซบุ๊ก ไลน์ และสื่อสังคมอออนไลน์อื่น ๆ หากนำไปเปรียนเทียบกับการเรียนการสอนในห้อง ที่ครูขาดแคลนทั้งในแง่จำนวนและความรู้ที่เติบโตเร็วกว่าการพัฒนาตนเองของครู ระบบการศึกษามันจะเอนเอียงไปทางไหน?

🙂 นอกเรื่องอีกสักย่อหน้านะครับ ฮ่า ๆ!! ผมขอพูดในฐานะเป็นอาจารย์ที่สอนอยู่ในระดับอุดมศึกษา ที่มองเห็นอนาคตเรื่องนี้พอสมควร ที่ต่อไปปริญญาจะไม่มีความหมาย สิ่งสำคัญคือความรู้และทักษะที่งานต้องการจากคน เชื่อว่าทุกคนที่อ่านเห็นด้วยกับผม? เมื่อปริญญาไม่มีความหมาย นักศึกษาจะมาเรียนในมหาวิทยาลัยที่บังคับให้เรียนวิชาอะไรไม่รู้ที่ไม่เกี่ยวกับความรู้และทักษะที่งานต้องการ ทำไม? เสียเวลาเข้ามาเช็คชื่อทำไม? เสียเวลาเข้ามาทำกิจกรรมทำไม? หลายคนมองว่ามันคือการจำลองสังคม เรียนรู้ชีวิต แล้วมันจะไม่ดีกว่าเหรอหากเราเรียนรู้จากสังคมจริงไปเลย? ผลสรุปมันจะมาลงเอยที่ว่า มหาวิทยาลัยอาจต้องปรับตัว อย่างที่มหาวิทยาลัยระดับโลกเขาไปไกลแล้ว ที่สามารถทำการเรียนการสอนออนไลน์ไปเลย และได้รับปริญญาเมื่อเรียนครบตามที่กำหนด ซึ่งมหาวิทยาลัยในไทยก็เริ่มขยับกันแล้ว อย่างมหาวิทยาลัยธรมศาสตร์ กำลังเปิดตัวปริญญาโทออนไลน์ 100% และจุฬาลงกรณ์มหาวิทยาลัย ก็สร้าง MOOC ที่เป็นคอร์สเรียนออนไลน์ออกมามากมาย ซึ่งผมจะรีวิวหนึ่งในคอร์สเหล่านั้นในบทความนี้นั่นเอง นอกจากนี้มหาวิทยาลัยในโลกออฟไลน์ ก็ควรปรับตัว ลองนึกภาพว่ามหาวิทยาลัยไม่บแยกเป็นคณะหรือสาขาวิชา แต่เมื่อนักศึกเข้าไปเรียนจะมีรายวิชามากมายกองอยู่ให้นักศึกได้เลือกเรียนตามใจชอบ และหากเรียนครบตามที่หลักสูตรใดหลักสูตรหนึ่งกำหนดก็จะได้รับปริญญาของหลักสูตรนั้นไปเลย(โดยหลักสูตรก็ต้องปรับรายวิชาให้เหมาะในการนำไปใช้งานได้จริง ๆ) ทำให้เราสามารถเลือกเรียนให้ได้หลายปริญญาไปพร้อม ๆ กันได้ เรียนไม่จบก็มีใบรับรองว่าเรียนวิชาอะไรมาแล้วบ้าง เมื่อนำไปสมัครงาน นายจ้างก็จะดูรายวิชาที่เรียนมาเป็นหลัก ไม่ใช่ดูแค่ปริญญาหรือมหาวิทยาลัยอย่างในปัจจุบัน

อย่างที่ผมกล่าวมาข้างต้น เพื่อจะบอกว่าผมอินกับการเรียนคอร์สเรียนออนไลน์เป็นอย่างมากครับ มันคือการศึกษาตลอดชีวิต ทีเรียนเข้าไปเพิ่มเติมและทบทวนความรู้ตัวเองได้เป็นอย่างดี ซึ่งตอนนี้เรียนมาแล้วหลายคอร์สและมีอีกหลายคอร์สยังเรียนไม่จบ โดยบทความนี้จะเลือกคอร์ส Data Science Pathway โดย Chula Mooc Achieve มารีวิวกันครับ ว่าเป็นอย่างไรบ้าง คุ้มค่าที่จะเข้าไปเรียนกับค่าลงทะเบียน 5,500 บาท หรือไม่?

ด้านเนื้อหาของคอร์สเรียน

Data Science Pathway เป็นชุดวิชาเกี่ยวกับ Data Science หรือภาษาไทยก็คือ วิทยาศาสตร์ข้อมูล เนื้อหาของหลักสูตรประกอบด้วย 4 รายวิชา 34 บทใหญ่ 96 คลิปย่อย รวม 30 ชั่วโมง ซึ่ง 4 รายวิชานั้น ได้แก่

  1. Competing in a Data-Driven World: Understand and Know-How
  2. Data Analytics & Big Data
  3. Practical Data Analytics Using RapidMiner
  4. Python for Data Science

รายวิชาที่ 1 อย่าง Competing in a Data-Driven World: Understand and Know-How จะเน้นให้เข้าใจโดยภาพรวมในระดับองค์กร เหมาะสำหรับผู้บริหารเสียมากกว่า ซึ่งสอนโดยอาจารย์ภาควิชาสถิติ คณะพาณิชยศาสตร์และการบัญชี รายวิชาที่ 2 Data Analytics & Big Data จะเป็นการสอนให้เข้าใจการวิเคราะห์ข้อมูลและ Big Data ในภาพรวม ยังไม่ลงลึกในเนื้อหา แต่มี Workshop(สอนทำตาม step by step) การวิเคราะห์ข้อมูลด้วย RapidMiner เพื่อให้เข้าใจลักษณะการวิเคราะห์ข้อมูล ลักษณะการสอนจะมีการสลับกันพูดระหว่างอาจารย์ภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ ถือว่าเป็นการเกริ่นที่ดีสำหรับผู้บริหารก่อนที่จะเข้าเนื้อหาเชิงลึกในรายวิชาที่ 3 แต่สำหรับผู้เรียนที่ต้องทักษะแบบเน้น ๆ ก็ถือว่ารายวิชาที่ 2 นี้เรียกน้ำย่อยได้ดีพอสมควร โดยเฉพาะในช่วง Workshop ที่ทำให้มองเห็นภาพเทคนิคการวิเคราะห์ข้อมูลและการนำไปใช้งานจริง แต่รายวิชาที่ผมให้คะแนนมากที่สุด ก็คือ รายวิชาที่ 3 Practical Data Analytics Using RapidMiner ซึ่งเป็นการเข้าเรื่องแบบเต็มที่ สอนการวิเคราะห์ข้อมูลด้วยโปรแกรม RapidMiner โดยมี  Wokrshop ประมาณ 80% อีก 20% จะเป็นการสอนการเชื่อมต่อ RapidMiner เข้ากับ Big Data ซึ่งมันเป็นงานระดับเซิฟเวอร์จึงไม่สามารถ Workshop ในคอร์สนี้ได้ ส่วนรายวิชาที่ 4 Python for Data Science สอนการใช้ภาษา Python สำหรับวิทยาศาสตร์ข้อมูล ผ่าน Google Colab ทำให้เรามองเห็นประโยชน์ของการใช้ ภาษา Python ที่ทำงานได้หลากหลายมากกว่าโปรแกรมสำเร็จรูป แต่สำหรับคนที่ไม่รู้ภาษา Python เรียนเสร็จก็ทำได้แค่รู้ ลอกคำสั่งตามอาจารย์ แต่ยังไม่บรรลุ จนผมต้องไปขวานขวยหาคอร์สเรียน Python ต่อ ซึ่งผู้เรียนคนอื่นก็ไม่ต่างกันครับ จะเห็นได้จากคะแนนการทดสอบแต่ละรายวิชา  90%+, 80%+, 70%+, 60%+ ตามลำดับ

หากจะให้สรุปสั้น ๆ เกี่ยวกับเนื้อหาทั้งชุดวิชา ก็คือ ได้รู้และเข้าใจเกี่ยวกับวิทยาศาสตร์ข้อมูลแบบกว้าง ๆ การขับเคลื่อนองค์กรด้วยวิทศาสตร์ข้อมูล เข้าใจลึกซึ้งเกี่ยวกับการวิเคราะห์ข้อมูลด้วย RapidMiner ส่วนภาษา Python ได้เพียงรู้แต่ยังไม่เข้าใจมากนัก

ส่วนรายละเอียดเนื้อหาอื่น ๆ ทางคอร์สได้อธิบายไว้ชัดเจนแล้วครับ ลองเข้าไปศึกษาดูได้ที่ >> https://www.chulamoocachieve.com/pathway/data-science

บรรยากาศการเรียนการสอน

ลักษณะการเรียนการสอนนั้น แยกออกเป็นส่วนการบรรยายและ Workshop ซึ่งการบรรยารายวิชาแรกจะเป็นการสลับกันไปมาระว่างหน้าอาจารย์ที่พูดอยู่โดยแบล็คกราวด์เป็นสถานที่ภายในจุฬาลงกรณ์มหาวิทยาลัย กับภาพเอฟเฟ็กต์ข้อความแสดงข้อมูลตามที่อาจารย์พูด ส่วนรายวิชาหลัง ๆ เหมือนเปลี่ยนคนตัดต่อ ทำให้การใส่เอฟเฟ็กต์ข้อความดูดีขึ้นมาก อาจารย์จะพูดไปแล้วข้อความ รูปภาพ แผนภูมิ ก็จะขึ้นมาเลยด้านข้าง โดยใช้แบล็คกราวด์เป็นสถานที่ภายในจุฬาลงกรณ์มหาวิทยาลัยไปเลย ไม่มีการสลับเนื้อหากับผู้พูด ส่วน Workshop จะแสดงเฉพาะหน้าจอคอมพิวเตอร์ของอาจารย์แล้วเราก็ทำตามได้เลย ซึ่ง 2 คลิปต่อไปนี้ เป็นหนึ่งในคลิปที่ใช้สอนในห้องเรียนเลยในส่วนของการบรรยาย ดังนั้นหากอยากรู้บรรยากาศเป็นอย่างไรบ้าง ลองดูได้เลยครับว่าชอบไหม แต่คลิปในส่วนของ Workshop ไม่มีนะครับ ซึ่งในส่วนนั้นไม่มีปัญหาเลย ทั้งเรื่องความชัดเจนในการสอน ความเข้าใจผู้เรียนที่จะปฏิบัติตาม และคุณภาพของวิดิโอ

นอกจากนี้ในแต่ละรายวิชาจะมีแบบทดสอบก่อนเรียน และแบบทดสอบหลังเรียน ที่จะทำได้เพียงครั้งเดียว ซึ่งสำคัญมาก เพราะหากเราได้คะแนนทดสอบเหล่านี้น้อยกว่า 70% เราจะไม่สามารถทำแบบทดสอบรวมของชุดวิชาได้ ซึ่งจะทำให้เราไม่ได้ใบ Cer. นั่นเอง และในแต่ละบทของการเรียนก็จะมีแบบทดสอบด้วยครับ ซึ่งอันนี้จะทำได้หลายครั้งเลย ผมก็ทำจนถูกหมดทุกข้อนั่นหละ ฮ่า ๆ

อีกสิ่งหนึ่งที่ต้องพูดถึง นั่นคือ กลุ่มในเฟซบุ๊ก ซึ่งสร้างขึ้นมาเพื่อผู้เรียนได้แลกเปลี่ยนพูดคุย รวมทั้งปรึกษาหารือต่าง ๆ กับทีมงานและอาจารย์ผู้สอน ซึ่งจะรับเข้ากลุ่มเฉพาะคนที่ลงทะเบียนเรียนเรียบร้อยแล้ว ซึ่งถือว่าช่วยในการเรียนการสอนได้เป็นอย่างมาก และถือว่าเป็นสร้างคอนเนคชั่นของนักวิทยาศาสตร์ข้อมูลได้เป็นอย่างดีครับ

การส่งเสริมการเรียนรู้และประเมินผล

สิ่งที่เหนือกว่าคอร์สเรียนทั่วไป ก็คือ ระหว่างการเรียนการสอน ทางทีมงานจะจัดกิจกรรมดูงาน โดยจะประสานกับบริษัท องค์กร ต่าง ๆ ที่ใช้วิทยาศาสตร์ข้อมูลในการขับเคลื่อนองค์กร พาเราไปดูงานถึงที่ อันนี้ก็ถือว่าเป็นข้อได้เปรียบที่จุฬาฯ มีมากกว่าคอร์สเรียนทั่วไปที่หาคอนเนคชั่นระดับนี้ยาก ซึ่งจะมีมาเรื่อย ๆ ครับ อย่างเช่นล่าสุดก็ไปดูงานที่ Shopee ที่มีความโดดเด่นในการใช้วิทยาศาสตร์ข้อมูลเป็นอย่างมาก และมีการจัดงานพบประแลกเปลี่ยนประสบการณ์ระหว่างกัน เพื่ออัพเดตความรู้ใหม่ ๆ อยู่เรื่อย ๆ ฟรี!! แต่งานที่เสียเงินอย่าง Workshop จริงจังก็มีครับ เช่น Workshop ภาษา Python ที่จะเจอกันในการอบรมเลย 1 วันเต็ม ๆ 8.00 น. – 18.00 น. แต่จะลดราคาให้สมาชิกกลุ่มจาก 5,900 บาท เหลือ 2,900 บาทเท่านั้น นอกจากนี้ในกลุ่มเฟซบุ๊ก ก็จะมีการนำความรู้มาแบ่งปันกันอยู่เสมอ เป็นสังคมแห่งการเรียนรู้ที่ดีมากครับ

การประเมินผลอย่างที่บอกไปครับ ในแต่ละรายวิชาจะมีแบบทดสอบก่อนเรียน และแบบทดสอบหลังเรียน รวมทั้งแบบทดสอบของแต่ละบท ซึ่งเราต้องทำให้ได้คะแนนมากกว่า 70% จึงจะสามารถทำแบบประเมินผลการเรียนรู้ของชุดวิชา(Pathway Test) ได้ เพื่อนำคะแนนไปพิจารณาการให้ใบรับรอง Certificate โดยหากเราทำคะแนนได้น้อยกว่า 50 คะแนน จะได้แค่ระดับ Participation ถ้าได้ 50-64 คะแนน จะได้เหรียบทองแดง 65-79 คะแนน จะได้เหรียญเงิน และ 80 คะแนนขึ้นไป จะได้เหรียญทอง โดยหน้าตาใบ Certificate จะเป็นแบบนี้ครับ

ซึ่งหลังจากเราทำการทดสอบเสร็จสิ้นและทราบผลคะแนนแล้ว ต้องรอให้คณะกรรมการฯ พิจารณาและอนุมัติเสียก่อน ซึ่งใช้เวลารอประมาณ 1 เดือนครับ สิ่งหนึ่งที่สำคัญ ที่ผมเห็นจากกลุ่มในเฟซบุ๊ก ก็คือ หลายคนสอบ Pathway Test ไม่ได้เพราะคะแนนทดสอบย่อยไม่ถึง 70% แต่อันนี้ก็ทำเรื่องขออนุโลมได้ครับ และอีกกรณีก็คือหมดเวลาในการเรียนเสียก่อน ดังนั้นเราต้องเรียนและทดสอบให้เสร็จก่อนหมดเวลาที่หลักสูตรมอบให้ คือ 3 เดือน โดยยึดเวลาสมัครเรียนเป็นสำคัญ ไม่ใช่เที่ยงคืนนะครับ อันนี้ต้องระวัง

สรุปการรีวิว Data Science Pathway โดย Chula Mooc Achieve

คะแนนด้านเนื้อหา ผมให้ 70% เรียนทั้งชุดวิชา มันเลยกว้างไปหน่อย เหมือนหว่านแหที่ใครมาเรียนก็ได้ แต่รายวิชาที่ 1 แม้จะบรรยาล้วน ๆ แต่ก็จำเป็น ทำให้เราเข้าใจภาพรวม รายวิชาที่ 2-3 เป็นเนื้อหาเต็ม ๆ ได้ความรู้เรื่อง Rapidminer เป็นสำคัญ ซึ่งก็น่าเสียดายที่ไม่มีโปรแกรมอื่น ส่วนรายวิชาที่ 4 ช่วยเปิดตาให้เรารู้จักความสามารถของภาษา Python แต่ยังปฏิบัติจริงไม่ได้ สรุปว่าเป็นจุดเริ่มต้นที่ได้ เพื่อให้เราไปศึกษาต่อในคอร์สอื่น ๆ จะทำงานเลยก็ได้แต่เราก็จะมีเพียงเครื่องมือ Rapidminer โปรแกรมอื่น ๆ ต้องศึกษาเอง และน่าเสียดายถ้ามีภาษา R ด้วยจะดีมาก เอาแค่ให้รู้เหมือนภาษา Python ก็ได้ ปัญหาอีกอย่างด้านเนื้อหาคือ โปรแกรม Rapidminer มันมีอัพเดตเรื่อย ๆ แต่คลิปการสอนน่าจะ 1-2 ปีแล้ว ทำให้เนื้อหาที่สอน แบบทดสอบที่ทำ มีหน้าตาและได้ผลลัพธ์ที่ต่างกัน ควรพยายามอัพเดตคลิปวิดีโอให้บ่อยขึ้น

คะแนนด้านบรรยากาศการเรียน ผมให้ 80% คลิปวิดีโอที่อาจารย์สอนเข้าใจและชัดเจนมาก ๆ คุณภาพการตัดต่อระดับดีมาก มีการสนับสนุนการเรียนรู้ผ่านกลุ่มเฟซบุ๊กได้เป็นอย่างดี เสียดายที่แพลตฟอร์มที่ใช้ยังไม่สมบูรณ์แบบ หากมีระบบคำถามจากผู้สอนเด้งขึ้นมาเหมือน Coursera ระหว่างเรียน ก็อาจกระตุ้นได้มากขึ้น มากกว่านั้นถ้ามีบอทคอยตอบคำถามระหว่างเรียนได้น่าจะแจ่มเลยครับ

การส่งเสริมการเรียนและประเมินผล ผมให้ 85% ด้วยกิจกรรรมส่งเสริมการเรียนนอกห้องเรียน ทั้งการดูงาน การสร้างสังคมแห่งการเรียนรู้ผ่านกลุ่มเฟซบุ๊ก ก็ถือว่าทำได้ดีมาก การประเมินผลที่ใช้ระดับของใบ Cer. มาช่วยกระตุ้นการเรียนรู้ก็ทำได้ดีครับ จึงได้คะแนนเยอะหน่อยที่ 85%

เฉลี่ยคะแนนทั้งหมด คือ 78.3% ถือว่าอยู่ในเกณฑ์ดี แต่ยังไม่ถึงขั้นดีมาก น่าเสียดายที่แม้จะเป็นคอร์สเรียนออนไลน์แทนที่จะใช้ข้อเด่นที่คนจะเรียนอะไรก็ได้อย่างที่เขาต้องการ แต่กลับบังคับให้เรียนเรื่องอื่นที่ผู้วางหลักสูตรคิดเองว่าเราควรรู้ นี่ไม่ต่างจากหลักสูตรปกติที่เปิดสอนในมหาวิทยาลัยเลย นั่นก็อาจเป็นเพราะทีมงานคือคนจากสถาบันการศึกษาที่มีอยู่เดิม จึงมองผู้เรียนเหมือนนักศึกษาทั่วไป ไม่ใช่ผู้เรียนที่มีความต้องการจำเพาะ ไม่เหมือนกับเว็บไซต์คอร์สเรียนออนไลน์อื่น ที่เข้าใจผู้เรียนมากกว่า แต่ก็ไม่ถือว่าเรื่องใหญ่นะครับ ได้คะแนนไปตั้ง 78.3% ก็ถือว่าเยอะแล้ว เพราะผมคิดว่าเราได้เรียนรายวิชาที่หลากหลายก็โอเค ดีกับเราเองนั่นหละ อาจเสียที่ผลการประเมินแต่ละคนอาจน้อยเพราะหัวเรื่องมันกว้างเกินไป

ข่าว: รีวิวคอร์สออนไลน์ Data Science Pathway โดย Chula Mooc Achieve ราคา 5,500 บาท คุ้มค่าแค่ไหน? ได้เรียนอะไรบ้าง? มีที่มาจาก: แอพดิสคัส.

from:https://www.appdisqus.com/2019/03/20/reviews-online-data-science-pathway.html

Mozilla เปิดตัว Iodide, IDE สำหรับ Data Scientist คู่แข่ง Jupyter และ R-Studio

Mozilla เปิดตัวโครงการ Iodide สภาพแวดล้อมสำหรับพัฒนา (IDE) งานประเภท data science คล้ายกับ Jupyter และ R-Studio แต่มีจุดต่างที่ซอฟต์แวร์ทั้งหมดรันอยู่บนเบราว์เซอร์

Iodide ใช้ WebAssembly ดึงเอา Python, Numpy, Pandas, Matplotlib, และแพ็กเกจอื่นๆ มาทำงานในจาวาสคริปต์ ทำให้กระบวนการพัฒนาโดยรวมเหมือนการพัฒนาเว็บ สามารถเขียน Markdown ลงไปใน notebook แล้วปรับแต่งการแสดงผลด้วย CSS การใช้ WebAssembly ทำให้ประสิทธิภาพโดยรวมช้าลงบ้างแต่ก็ยังอยู่ในระดับใช้งานได้

ตอนนี้โครงการยังอยู่ในขั้นอัลฟ่า โดยมีแผนการพัฒนาทั้งการใช้งานที่จะสามารถคอมเมนต์แบบ Google Docs และช่วยกันพัฒนาหลายคนได้ รวมถึงการ fork และ merge เหมือนการเขียนโค้ดใน GitHub ขณะที่ภาษาในตัวก็มีแผนจะชวนโครงการ R และ Julia ให้พอร์ตภาษามาเป็น WebAssembly

ที่มา – Mozilla

No Description

Topics: 

from:https://www.blognone.com/node/108655

108 Data Science: วิทยาศาสตร์ข้อมูล Data Science คืออะไร? ต้องเริ่มต้นศึกษาอย่างไร?

จากข้อมูลการวิเคราะห์วิจัยหลากหลายสำนักต่างได้ผลออกไปในทางเดียวกันว่า หนึ่งในทักษะที่ปัจจุบันตลาดงานต้องการมากที่สุด ก็คือ วิทยาศาสตร์ข้อมูล หรือ Data Science  ซึ่งโดยส่วนตัวผมมองว่าไม่ใช่แค่ต้องเรียนรู้เพื่อหางานที่มีรายได้และความต้องการสูง แต่มันคือทักษะที่เราต้องมีเพื่อพัฒนาตัวเองและองค์กรของเราในปัจจุบันด้วย

วิทยาศาสตร์ข้อมูล มันมีมานานแล้วครับ แต่ทุกคนหันมาให้ความสนใจมากช่วงนี้ สืบเนื่องมาจากเราเข้าสู่ยุคของอินเทอร์เน็ตและสังคมออนไลน์ มันทำให้มีปริมาณข้อมูลมหาศาลเกิดขึ้น หน่วยงานและองค์กรที่มีข้อมูลเหล่านี้จึงจำเป็นต้องใช้ศาสตร์ในการวิเคราะห์ข้อมูล เพื่อนำผลการวิเคราะห์มาวางแผนการดำเนินงาน การปรับปรุงและพัฒนาผลิตภัณฑ์และการบริการ หรือ การตัดสินใจต่าง ๆ ที่สำคัญ มีคนเคยเปรียบเทียบว่า ข้อมูล(data) ก็เปรียบดังทองคำ มันมีค่ามหาศาล แต่เราจะนำมันไปใช้ไม่ได้หากขาดความรู้ที่จะดึงสารสนเทศออกมาจากข้อมูลเหล่านั้นได้ นั่นก็คือ  วิทยาศาสตร์ข้อมูล นั่นเอง

วิทยาศาสตร์ข้อมูล(data science) คืออะไร?

วิทยาศาสตร์ข้อมูล คือ ศาสตร์ที่เกี่ยวกับการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัย และนำเสนอผลการวิเคราะห์ข้อมูลเพื่อนำไปสู่ความรู้ที่สามารถนำไปใช้งานได้จริง (Actionable knowledge) หรือหากจะพูดง่าย ๆ วิทยาศาสตร์ข้อมูล ก็คือ ความรู้เกี่ยวกับวิธีในการเปลี่ยนข้อมูลให้เป็นสารสนเทศที่สามารถนำไปใช้งานต่อได้นั่นเอง ตัวอย่างเช่น การนำข้อมูลต่าง ๆ ของสโมสรฟุตบอลไปทำนายผลการแข่งขันด้วยโปรแกรมคอมพิวเตอร์ การนำข้อมูลลูกค้าบริษัทบริการเครือข่ายโทรศัพท์ไปประเมินว่ามีใครบ้างจะย้ายค่ายบ้าง บริษัทจะได้โทรหาเพื่อนำเสนอโปรโมชั่นดึงดูดใจให้อยู่กับบริษัทต่อ เป็นต้น ซึ่งปริมาณข้อมูลมีมหาศาลเกินกว่าที่เราจะมาวิเคราะห์ด้วยการประชุมระดมความคิด เราต้องใช้เครื่องมือเข้ามาช่วย ณ ที่นี้ ก็คือ โปรแกรมคอมพิวเตอร์นั่นเอง ซึ่งมีหลากหลายอย่าง หลากหลายตัว ตัวอย่างเช่น Rapidminer Spark QlikView ภาษาคอมพิวเตอร์ Python ภาษาคอมพิวเตอร์ R เป็นต้น เครื่องหลายตัวไม่จำเป็นต้องมีพื้นฐานด้านการเขียนโปรแกรมด้วยซ้ำ ดังนั้น ใคร ๆ ก็เริ่มได้ครับ กับ วิทยาศาสตร์ข้อมูล

จะเริ่มต้นศึกษา วิทยาศาสตร์ข้อมูล(data science) อย่างไร?

หลายคนอาจยังนึกภาพรวมเกี่ยวกับการศึกษาวิทยาศาสตร์ข้อมูลไม่ออก ถ้าอยากเริ่มต้นศึกษาควรเริ่มต้นอย่างไร? ความจริงแล้วไม่ได้กำหนดตายตัวแน่นอนครับ อาจเริ่มต้นด้วยการศึกษาโปรแกรมสำเร็จรูปที่ไม่ต้องมีพื้นฐานการเขียนโปรแกรมเลยอย่าง Rapidminer ก็เป็นตัวเลือกที่ดี แต่หากเราต้องการเป็นนักวิทยาศาสตร์ข้อมูลมืออาชีพที่ประสบความสำเร็จได้จริง ๆ เราขอนำแนวทางการศึกษาที่แนะนำโดยเว็บไซต์ analytics vidhya ที่ผมเองก็เจริญรอยตามและถือว่าเป็นคำแนะนำที่ดีเยี่ยมเลยครับ ที่เราจะทำตามบ้าง

1. ระดับเริ่มต้น (Beginner Level)

สำหรับมือใหม่ที่สนใจจะเริ่มต้นศึกษาเกี่ยวกับวิทยาศาสตร์ข้อมูล สิ่งสำคัญคือพื้นฐานที่มั่นคง มันจะทำให้เราศึกษาเรื่องต่าง ๆ ในขั้นตอนอื่นได้ง่าย รวดเร็ว และมีประสิทธิภาพมากขึ้นได้ โดยแนะนำให้ศึกษาสิ่งต่อไปนี้

1.1 เรียนภาษาโปรแกรมคอมพิวเตอร์ Python และ R

อันดับแรกให้เลือกมาสักภาษาหนึ่งครับ แล้วทำการศึกษาให้เข้าใจอย่างลึกซึ้ง เพราะทั้ง Python และ R เป็นภาษาที่นิยมนำมาใช้ในวิทยาศาสตร์ข้อมูลมากที่สุด แต่ Python จะง่ายกว่า ใครสนใจศึกษาอาจหาหนังสืออ่านด้วยตัวเองหรือคอร์สเรียนออนไลน์ที่ปัจจุบันมีอยู่มากมายครับ ค้นหาเจอได้ง่าย ๆ ใน Google เลย ส่วนหนังสือผมมีมาแจกฟรีครับ คลิก!! ที่ >> https://www.cp.eng.chula.ac.th/books/python101/?fbclid=IwAR3DJObm_k-CwUbyjvyNDIq9Lya_EcNIhE-Ie-yoyXGCB1d5Piw-4EK0f1s

1.2 เรียนคณิตศาสตร์และสถิติ

ศึกษาความรู้ด้านคณิตศาสตร์และสถิติที่เกี่ยวข้อง เช่น พีชคณิตเชิงเส้น หรือสถิติพื้นฐานต่าง ๆ เพื่อนำความรู้ไปใช้ในการวิเคราะห์ข้อมูลผ่านโปรแกรมคอมพิวเตอร์

1.3 เรียนคอร์สออนไลน์เกี่ยวกับวิทยาศาสตร์ข้อมูล

คอร์สออนไลน์เกี่ยวกับวิทยาศาสตร์ข้อมูล ที่เป็นภาษาไทย ปัจจุบันมีให้เลือกเรียนเยอะมากครับ เอาจริง ๆ นั่งเลือกที่เรียนเครียดกว่าตอนที่เรียนอีกครับ ซึ่งหลังจากผมเลือกและได้ทดลองเรียนมาแล้ว จึงมีคำแนะนำง่าย ๆ คอร์สเดียวจบเลย นั่นคือ Data Science Pathway ของจุฬาลงกรณ์มหาวิทยาลัยครับ เพราะจะสอนตั้งแต่มุมมองนักธุรกิจจนถึงนักวิทยาศาสตร์ข้อมูลเลยครับ จะทำให้เราเข้าใจวิทยาศาสตร์ข้อมูลในหลากหลายมิติอย่างครบถ้วน .

1.4 พยายามมีส่วนร่วม ค้นคว้า คลุกคลีกับ Data Science

เนื่องจากเทคโนโลยีเปลี่ยนแปลงไปอย่างรวดเร็วจนเราอาจตามไม่ทัน จึงจำเป็นที่คุณควรจะมีส่วนร่วมในการอภิปราย พบปะพูดคุยกับผู้เชี่ยวชาญที่มีประสบการณ์ ติดตามบล็อก เข้าร่วมกรุ๊ป และอ่านหนังสือเกี่ยวกับวิทยาศาสตร์ข้อมูลให้มาก และทำอยู่เสมอครับ

2. ระดับกลาง (Intermediate Level)

ในระดับนี้เราต้องมุ่งมั่นและพยายามพอสมควร โดยเฉพาะคนที่ต้องศึกษาด้วยตัวเอง ซึ่งมีขั้นตอนดังต่อไปนี้

2.1 ศึกษา Machine Learning

Machine Learning คืออนาคตของวิทยาศาสตร์ข้อมูล และเป็นเทคโนโลยี ที่ผู้ที่มีทักษะนี้กำลังเป็นที่ต้องการอย่างมาก ท่องเอาไว้ว่า สร้างทักษะ สร้างงาน สร้างเงิน ให้กับตัวเอง ด้วย Machine Learning ตัวนี้หละครับ

2.2 ศึกษา โดยการลองเล่น Spark, NoSQL และเครื่องมือ Big Data อื่น ๆ

ในขั้นตอนนี้ เราจะเริ่มต้นเดินทางไปสู่ Big Data เครื่องมืออย่าง Spark หรือ NoSQL คือเครื่องมือในการจัดการข้อมูล Big Data ดังนั้นควรศึกษาและลองเล่นกันดูครับ เช่นเดียวกับ Machine Learning คนที่มีทักษะเกี่ยวกับ Big Data ก็เป็นที่ต้องการตัวอย่างมหาศาลเลยครับ

2.3 แบ่งปันความรู้

ขั้นตอนนี้มีความสำคัญไม่แพ้ขั้นตอนอื่น ๆ เพราะการแบ่งปันความรู้จะทำให้ตัวเราเองรู้เพิ่มมากขึ้น เข้าใจอย่างลึกซึ้งมากขึ้น ผ่านการเข้าไปตอบตามเว็บบอร์ด กรุ๊ปต่าง ๆ หรือเขียนบล็อกแชร์ประสบการณ์ ให้กับคนที่พยายามศึกษาวิทยาศาสตร์ข้อมูลเหมือนกับเรา อันนี้ทั้งเว็บในไทยและต่างประเทศนะครับ

2.4 การเข้าร่วมการแข่งขัน

เข้าร่วมการแข่งขันตามเวทีต่าง ๆ ที่หน่วยงานรัฐ สถาบันการศึกษา และเอกชน ที่จัดการแข่งขันเกี่ยวกับวิทยาศาสตร์ข้อมูล จะทำให้เรารู้ข้อดีข้อเสียของตัวเอง และเป็นแรงบันดาลใจในการพัฒนาตัวเองให้มีทักษะที่สูงขึ้นตามไปด้วย

3. ระดับสูง (Advanced Level)

เมื่อเรากลายเป็นผู้เชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลแล้ว ผมแนะนำให้ทำ 3 สิ่งต่อไปนี้ เพื่อเพิ่มพูนทักษะของตัวเองให้ยกระดับขึ้นไปอีกได้ นั่นคือ

3.1 สร้างโมเดล Deep Learning

3.2 คืนความรู้สู่สังคม

.3.3 ลอง Reinforcement Learning

สำหรับ Reinforcement Learning เป็นส่วนที่มีประสิทธิภาพมากที่สุด แต่เป็นอีกแง่มุมหนึ่งของ Machine Learning ที่ยังไม่ค่อยมีการค้นพบนัก ปีนี้ลองทำการวิจัยในด้านนี้ รับรองว่าคุ้มค่ากับการพยายามอย่างแน่นอน รถยนต์ไร้คนขับและโดรนสอดแนม ก็เป็นผลจากการเรียนแบบเสริมกำลังนี้ แล้วคุณจะเข้าสู่วงการ AI ไปโดยอัตโนมัติเลยครับ

ตอนต่อไป

ทั้งหมดนี้ เป็นเพียงคำแนะนำเบื้องต้น ตอนต่อไปของ 108 Data Science จะมีอะไรบ้างติดตามกันได้ทางแฟนเพจ Appdisqus หรือกดติดตามข่าวสารของเว็บไซต์ Appdisqus ได้เลยนะครับ ซึ่งผมจะนำข้อมูลเฉพาะทางมากขึ้นมาแนะนำนะครับ

 

ที่มา:

  1. https://www.cp.eng.chula.ac.th/books/python101/?fbclid=IwAR3DJObm_k-CwUbyjvyNDIq9Lya_EcNIhE-Ie-yoyXGCB1d5Piw-4EK0f1s
  2. https://www.analyticsvidhya.com/blog/2015/12/special-year-resolutions-data-scientist/?fbclid=IwAR1KaTydGvyNJwFA5qNb0t4EPUoXNFQs4EMX_bMGkV6xGAMlq4GMoIfA9v8
  3. https://www.analyticsvidhya.com/blog/2015/10/job-comparison-data-scientist-data-engineer-statistician/?utm_source=facebook.com&utm_medium=social&fbclid=IwAR0l027bg1gjFpYp6SBjLIZhLxI9zudqLNBzQdZOdyzXlrOp0XFz3pG3QUE

 

ข่าว: 108 Data Science: วิทยาศาสตร์ข้อมูล Data Science คืออะไร? ต้องเริ่มต้นศึกษาอย่างไร? มีที่มาจาก: แอพดิสคัส.

from:https://www.appdisqus.com/2019/03/12/108-data-science-what-how-to-learning.html

คอร์สเรียนออนไลน์เพื่อพัฒนาทักษะอาชีพ: ของฟรีมีในโลก!! CHULA MOOC

          ปัจจุบันการศึกษาในมหาวิทยาลัยต้องเผชิญกับความท้าทายอย่างหนัก เมื่อความรู้และเทคโนโลยีพัฒนาเร็วจนมหาวิทยาลัยเปลี่ยนแปลงตามไม่ทัน การปรับปรุงหลักสูตรที่ยุ่งยาก 5 ปีเปลี่ยนครั้ง มันทำให้องค์ความรู้ที่นำมาสอนนักศึกษามันล้าหลัง ไม่ทันโลก คำตอบของความท้าทายนี้จึงต้องพึ่งพาเทคโนโลยีสารสนเทศสมัยใหม่เข้ามาช่วย เมื่อความรู้พัฒนาเร็ว การเรียนการสอนก็ต้องเปลี่ยนและพัฒนาให้เร็วยิ่งกว่า

MOOC ย่อมาจาก Massive Open Online Courseware คือการเรียนออนไลน์แบบเปิด ที่ใคร ๆ ก็สามารถเข้าไปเรียนได้ เป็นคอร์สเรียนระยะสั้น และฟรี!! และเมื่อเรียนจบสามารถขอรับ Certificate of Completion ได้ เอาไว้ไปสมัครงานหรืออัพเกรดเงินเดือน อันนี้ก็แล้วแต่บุคคลครับ กลุ่มเป้าหมายหลักในช่วงเริ่มต้นจะเป็นกลุ่มคนทำงานที่ต้องการพัฒนาทักษะวิชาชีพของตัวเอง เพราะจะอาศัยเพียงความรู้ทีเรียนในมหาวิทยาลัยไม่ได้ และจะศึกษาด้วยตนเองก็มีข้อจำกัดแตกต่างกันไปในแต่ละคน ถือว่าเป็นการส่งเสริมการเรียนรู้ตลอดชีวิตอย่างแท้จริง

ก่อนที่จะผมจะไหลเรื่องวิชาการจนเกินไป เข้าเรื่องกันดีกว่าครับ ฮ่า ๆ !! วันนี้ผมจะมาแนะนำ MOOC เจ้านึง ที่ถือว่าเป็นผู้บุกเบิกการเรียนการสอนในลักษณะนี้จนประสบความสำเร็จ นั่นคือ CHULA MOOC ซึ่งปัจจุบันมีคอร์สเรียนกว่า 100 วิชา มีผู้ลงทะเบียนเรียนไปแล้วกว่า 1 แสนคน สิ่งเหล่านี้ช่วยตอกย้ำความสำเร็จของ MOOC ในประเทศไทยได้เป็นอย่างดี จนหลายมหาวิทยาลัยเริ่มวางแผนทำ MOOC ของตนเองเช่นเดียวกัน โดยเฉพาะในยุคที่จำนวนผู้เรียนตามวัยน้อยลงทุกวัน มหาวิทยาลัยต้องเปิดพื้นที่ดึงดูดวัยทำงานและวัยเกษียณให้เข้ามาเรียน คำตอบที่เหมาะสมที่สุดในตอนนี้ ก็คือ MOOC นั่นเอง

 

คอร์สเรียน CHULA MOOC มีตัวไหนน่าสนใจบ้าง?

การเปิดให้ลงทะเบียนเรียนของ CHULA MOOC จะเปิดเป็นช่วง ๆ ไม่เปิดทีเดียว 100 วิชา มีกำหนดเวลาชัดเจน แม้การเรียนออนไลน์จะเข้าเรียนได้ไม่จำกัด แต่ว่าในแต่ละคอร์สของ CHULA MOOC จะจำกัดจำนวนผู้เรียน และจำกัดระยะเวลาในการเรียนด้วย ถือเป็นเทคนิคในการทำให้เกิดการเรียนสำเร็จมากขึ้น(จากผลการวิจัยระบุว่าการเรียนออนไลน์มีเปอร์เซ็นต์การเรียนสำเร็จน้อยมาก ๆ) และสร้างกระแสตอบรับให้เกิดขึ้นอย่างแพร่หลาย ซึ่งเราจะเห็นว่าเมื่อมีการประกาศเปิดให้ลงทะเบียน ผู้เรียนจะเกิดการแย่งกันทะเบียนเรียนก่อนที่จะครบจำนวนที่กำหนดของแต่ละคอร์ส ส่วนคอร์สที่น่าสนใจและได้รับความนิยม ได้แก่

  • Introduction to Data Analytics and Big Data
  • ตั้งไข่ไวยกรณ์ : มหากาพย์ อังกฤษ อัพเกรด
  • ไวยกรณ์พร้อมรบ : มหากาพย์ อังกฤษ อัพเกรด
  • ทำอย่างไรให้สินค้า Go Inter ขายได้ขายดี และดังข้ามโลก
  • กฏหมายกับธุรกิจยุค Thailand 4.0 และภาษีกับธุรกิจ
  • การสร้างชิ้นงานจากโปรแกรมสร้างภาพสามมิติ
  • การสร้าง Infographics : What & How?
  • ภาษาอาหรับเบื้องต้น และภาษาอาหรับในชีวิตประจำวัน

นี่เป็นเพียงตัวอย่างหนึ่งในคอร์สการเรียนที่หลากหลายมากของ CHULA MOOC ใครที่อยากพัฒนาตัวเอง พัฒนาทักษะอาชีพ โดยอาจารย์ของจุฬาลงกรณ์มหาวิทยาลัยที่เชี่ยวชาญทั้งในการสอนและความรู้แน่น ๆ ก็สามารถเข้าไปศึกษาคอร์สเรียนต่าง ๆ ได้เลยครับ และใครที่อยากติดตามข่าวสารว่ามีการเปิดลงทะเบียนเมื่อไหร่ อย่างไรบ้าง ก็ติดตามได้จากแฟนเพจของ CHULA MOOC ครับ

 

ลักษณะการเรียนการสอนออนไลน์ของ CHULA MOOC เป็นอย่างไร?

ผมขอเริ่มตั้งแต่การลงทะเบียนนะครับ ซึ่งปกติแล้วผมจะติดตามข่าวสารการเปิดลงทะเบียนผ่านแฟนเพจ CHULA MOOC โดยจะเปิดให้ลงทะเบียนกันประมาณ 2 เดือน และรับจำนวนจำกัด 4,000 คน ระยะเวลาในการเรียน 1-3 เดือน แต่ละคอร์สจะมี 5-10 บทเรียน มีแบบทดสอบก่อนเรียน และแบบทดสอบหลังเรียน นอกจากนี้กลุ่มใน Facebook ที่เปิดไว้ให้พูดคุยสอบถามได้แยกตามรายวิชาในช่วงที่เปิดให้มีการเรียนการสอนเท่านั้น หากผู้เรียนทำตามเงือนไขได้ทั้งหมด เช่น เรียนอย่างน้อย 80% ของบทเรียน ทดสอบหลังเรียนผ่านเกณฑ์ที่กำหนด เราก็จะได้ Certificate of Completion เอาไว้ไปใช้ในการทำงานได้ แต่หากเรียนไม่จบก็ไม่เป็นไรครับ เราแค่เข้าไปเอาความรู้เท่าที่เราต้องการก็ได้ เพราะนี่คือการเรียนออนไลน์ มันขึ้นอยู่กับเราอยู่แล้ว

ตัวอย่างหน้าจอขณะเรียน

 

ลักษณะบทเรียน

ข้อสอบก่อนเรียน

แล้วมหาวิทยาลัยได้อะไร? เมื่อให้คนเรียนฟรีกันแบบนี้

ก็เหมือนบริการฟรีอื่น ๆ คือ อันดับแรกต้องสร้างฐานของผู้เรียนให้ใหญ่เพียงพอ ต่อไปจะทำอะไรก็มีแต่ได้กับได้ แต่ในเบื้องต้นนั้น ก็คือ การเปิดคอร์สที่ลึกและแน่นขึ้น แต่เราต้องจ่ายเงินในการเรียน ซึ่งผมก็โดนไปแล้ว 1 คอร์ส จากทีเรียนคอร์สฟรีอย่าง Introduction to Data Analytics and Big Data แล้วทำให้อยากเรียนอยากรู้มากขึ้น และอาจารย์ก็สอนดีมาก ๆ จึงต้องไปลงทะเบียนแบบจ่ายเงินให้กับคอร์ส DATA SCIENCE PATHWAY ซึ่งถือว่าคุ้มค่ามากครับ ตอนนี้ก็ต้องเร่งเรียนให้ต่อเนื่อง เพราะจำกัดเวลาในการเรียนแค่ 3 เดือน(ถ้าไม่เราเทเอง ก็เรียนจบแน่นอนครับ)

          ผมขอบอกไว้ก่อนว่า ผมไม่ได้เรียนที่นี่ที่เดียวครับ ยังมีอีกหลายคอร์สออนไลน์ที่ผมลงทะเบียนแบบจ่ายเงินเต็ม ทั้งเพื่อหาความรู้ใส่ตัวและเตรียมจะเปิดคอร์สของตัวเองด้วยครับ ซึ่งเอาไว้คราวหน้าผมจะมาแนะนำคอร์สที่น่าสนใจเหล่านั้นนะครับ รวมทั้งการรีวิวคอร์ส DATA SCIENCE PATHWAY ของจุฬาลงกรณ์มหาวิทยาลัยที่ผมเรียนอยู่ด้วยครับ และขอย้ำว่าทุกคอร์สได้ Certificate of Completion ทั้งหมด หากมีคนขอในคอมเม้นท์มาอาจเขียนให้เร็ว ๆ นี้เลย 🙂

 

ข่าว: คอร์สเรียนออนไลน์เพื่อพัฒนาทักษะอาชีพ: ของฟรีมีในโลก!! CHULA MOOC มีที่มาจาก: แอพดิสคัส.

from:https://www.appdisqus.com/2019/02/15/chula-mooc-reviews-online-course.html

สามกูรูวงการเทค เปิดมุมมอง “Data Science” ศาสตร์มาแรงของธุรกิจยุคดิจิทัล

ภาพจาก Shutterstock

ในยุคที่ดาต้ากำลังเข้ามามีบทบาทสำคัญในองค์กรต่างๆ ศาสตร์ที่มาแรงคงหนีไม่พ้น “Data Science” หรือ “วิทยาศาสตร์ข้อมูล” ที่คนทั่วไปอาจนึกภาพไม่ออกว่าคืออะไร และมีลักษณะอย่างไร ธุรกิจจะได้ประโยชน์อะไรจากศาสตร์นี้

ทรู ดิจิทัล พาร์ค โดย โอลิเวอร์ เบคเคอร์ หัวหน้าคณะผู้บริหาร ด้านคอมมูนิตี้ จึงจัดงานเสวนา “Tech Supper Club #2” หัวข้อ “Technology and Data Science for Business Growth” ได้ผู้เชี่ยวชาญจากวงการ Data Science ได้แก่ วิโรจน์ จิรพัฒนกุล กรรมการผู้จัดการใหญ่ Skooldio สถาบันสอนด้านการพัฒนาเทคโนโลยี และนักพัฒนาจาก กูเกิล, ชารินทร์ พลภาณุมาศ นักวิทยาศาสตร์ข้อมูล จาก BridgeAsia ธุรกิจที่ปรึกษาด้านเทคโนโลยีและบิสิเนสโซลูชั่นด้านการแพทย์ และ ชิตพล มั่งพร้อม ซีอีโอและผู้ก่อตั้ง Zanroo (แสนรู้) มาร์เทค (Marketing Technology) สตาร์ทอัพ

วิโรจน์ จิรพัฒนกุล
วิโรจน์ จิรพัฒนกุล

วิโรจน์ จิรพัฒนกุล มองว่า ความท้าทายคือ การไม่มีดาต้าหรือคลังข้อมูลที่ใหญ่พอจะพยากรณ์สิ่งที่ต้องการ และจะเก็บข้อมูลที่ตอบโจทย์ได้อย่างไร เช่น ธนาคารอาจต้องการนำเสนอบัตรเครดิตที่เหมาะสมกับลูกค้า ธนาคารจะต้องรู้อะไรบ้างเกี่ยวกับไลฟ์สไตล์การใช้ชีวิตของลูกค้า บางธนาคารอาจจะมีข้อมูลอยู่แล้ว แต่ที่สำคัญคือจะนำข้อมูลเหล่านั้นมาใช้ประโยชน์อย่างไร

“นักศึกษาด้านนี้บางคนไม่ทราบว่าจะวิเคราะห์ ตีความข้อมูลที่มีเพื่อใช้พยากรณ์ได้อย่างไร ซึ่งไม่ได้เป็นหน้าที่ของนักวิทยาศาสตร์ข้อมูลคนเดียวเท่านั้น ทุกคนในบริษัทควรจะมีไอเดียเรื่องข้อมูลแบบนี้ด้วย จึงจะเกิดประโยชน์”

ในยุคที่ดาต้ายิ่งทวีความสำคัญมากขึ้นเรื่อยๆ ทำให้สายงาน “นักวิทยาศาสตร์ข้อมูล” เป็นที่ต้องการ แต่พบว่าคนทำงานด้านนี้ยังขาดแคลน วิโรจน์ ให้ความเห็นว่าการพัฒนาคนต้องใช้เวลา แต่คนทำงานบางคนก็ต้องการทางลัด จึงไม่อยู่กับองค์กรนาน สิ่งแวดล้อมในบริษัทต้องเอื้ออำนวยด้วย เช่น มีโครงสร้างพื้นฐานและมีข้อมูล ควรมีทีมสื่อสารเรื่องดาต้ากับเขาเพื่อเปลี่ยนปัญหาทางธุรกิจให้เป็นโจทย์ที่เขาสามารถนำไปทำงานต่อได้

สำหรับผู้ที่สนใจสายงานด้านนี้ ต้องให้ความสำคัญกับประสบการณ์จริง และการนำความรู้ไปใช้ได้จริง ซึ่งทำได้โดยริเริ่มทำโปรเจ็คต่างๆ และเริ่มต้นทำตั้งแต่วันนี้

“บางคนมีความรู้มาก แต่ไม่รู้ว่าจะนำไปใช้จริงเมื่อไร ในชีวิตจริงต้องเริ่มตั้งแต่ จะหาดาต้าอย่างไร เมื่อได้แล้ว จะวางกรอบปัญหาอย่างไรให้ได้โซลูชั่นออกมา จึงแนะนำให้เลือกประเด็นในด้านที่สนใจก่อน ไม่ว่าจะเป็นอาหาร ภาพยนตร์ ฟุตบอล ฯลฯ ต้องตั้งคำถามและเริ่มทำงานโปรเจ็ค การเริ่มจากสิ่งที่เราชอบ ดีกว่าจะไปเรียนทฤษฎีโดยไม่มีทิศทาง”

ชารินทร์ พลภาณุมาศ
ชารินทร์ พลภาณุมาศ

ชารินทร์ พลภาณุมาศ บอกว่า ความท้าทายปัจจุบันคือ การขาดความเข้าใจเกี่ยวกับดาต้า ความสามารถในการเปลี่ยนความรู้ในสาขาต่างๆ ให้เป็นวิทยาศาสตร์ข้อมูล นอกจากนี้ จุดมุ่งหมายของการใช้เทคโนโลยีก็สำคัญ บางครั้งผู้บริหารอาจบอกว่า ต้องใช้ AI แต่ก็อธิบายไม่ได้ว่าทำไมต้องใช้ จะใช้เพื่อแก้ปัญหาอะไร จะใช้อย่างไร จะมีตัวชี้วัดอะไร

ในประเด็นบุคลากรด้านวิทยาศาสตร์ข้อมูล บริษัทหลายแห่งไม่ต้องการนักวิทยาศาสตร์ข้อมูลจำนวนมาก แต่ปัญหาในไทยคือการขาดข้อมูลและโครงสร้างข้อมูล สิ่งเหล่านี้ไม่ใช่ความเชี่ยวชาญของนักวิทยาศาสตร์ข้อมูล แต่ที่วงการต้องการก่อนคือ วิศวกรข้อมูล ผู้วางพื้นฐานต่างๆ ต้องมีการวางแผนข้อมูล มีโมเดล มีข้อมูลการใช้และความสัมพันธ์กับระบบ (Use Case) สิ่งที่สำคัญกว่าการรับคนที่ชอบทำงานวิเคราะห์ คือการเตรียมข้อมูลเพื่อนำไปวิเคราะห์

ชารินทร์ เน้นเรื่องการปฏิบัติ และย้ำถึงความสำคัญของข้อมูล หลักการของศาสตร์ที่เป็นพื้นฐาน ทั้งการตั้งข้อสังเกต การตั้งสมมติฐาน การทดสอบ การให้ผลย้อนกลับ เป็นต้น สิ่งเหล่านี้เป็นกระบวนการที่เกิดขึ้นเมื่อทำโปรเจ็ค ใส่ใจกับหลักการก่อนที่จะไปใช้เทคนิคที่ซับซ้อนตามกระแส

ชิตพล มั่งพร้อม
ชิตพล มั่งพร้อม

ดาต้ากับความท้าทายสำหรับเจ้าของธุรกิจอย่าง ชิตพล มั่งพร้อม มองว่าความท้าทายมีสองด้าน ด้านแรก คือคนมักไม่เข้าใจว่าอะไรคือดาต้าและบิ๊กดาต้าคืออะไร รวมทั้งนักวิทยาศาสตร์ข้อมูลบางคน ไม่มีแนวคิดด้านธุรกิจ อาจไม่สามารถมองได้ว่าจะแปรเปลี่ยนดาต้าให้เกิดผลทางธุรกิจได้อย่างไร

ด้านที่สองคือ การมีข้อมูลที่เชื่อมโยงกัน เพราะโลกปัจจุบันมุ่งที่ประสบการณ์ของลูกค้า ‘Customer experience is the king’ ลูกค้าซื้อเพราะได้รับการปฏิบัติอย่างดี และเมื่อลูกค้ามีปัญหา บริษัทก็ต้องเก็บข้อมูลส่วนนี้ด้วย เพื่อรักษาประสบการณ์ที่ดีไว้ให้ได้

ชิตพล ซึ่งประสบความสำเร็จจากการนำข้อมูลที่ได้เป็นเชิงลึกมาช่วยต่อยอดธุรกิจ และสร้างกิจการให้เติบโตขึ้นเรื่อยๆ กล่าวทิ้งท้ายว่า ถ้าคุณไม่ใช่เจ้าของกิจการ แต่เป็นนักวิทยาศาสตร์ข้อมูล ก็ควรพูดคุยกับซีอีโอให้มากขึ้น บางทีอาจจะมีช่องว่างระหว่างผู้บริหารอยู่ หรือถ้าเป็นเจ้าของกิจการอยู่แล้ว ก็แนะนำให้พูดคุยกับลูกค้าให้มากขึ้น

ติดตามข่าวสารจาก Brand Inside ได้จาก Facebook ของเรา

from:https://brandinside.asia/data-science-for-business/

NVIDIA เปิดตัวโครงการ RAPIDS ไลบรารีใช้ชิปกราฟิกเพื่องาน Data Science

งานวิทยาศาสตร์ข้อมูล (data science) มักนิยมภาษา R หรือไลบรารี Pandas ในไพธอนที่มองข้อมูลเป็น data frame ที่เป็นตาราง ตอนนี้ NVIDIA ก็หันมาจับตลาดนี้ด้วยการเปิดตัวโครงการ RAPIDS ที่เปิดให้นักวิทยาศาสตร์ข้อมูลสามารถใช้ชิปกราฟิกประมวลผลข้อมูลเหล่านี้ได้เร็วขึ้น

ตอนนี้ใน GitHub และเอกสารการใช้งานมีเฉพาะไลบรารี pygdf ไบรารีสำหรับโหลดข้อมูลแบบ data frame แต่เมื่อโครงการสมบูรณ์จะมีโครงการ cuML ที่เทียบเท่า scikit-learn และ cuGRAPH สำหรับงานประมวลผลกราฟ และไลบรารีสำหรับแสดงผลข้อมูลประสิทธิภาพสูงเพราะใช้ชิปราฟิกเรนเดอร์

โครงการยังไม่สมบูรณ์นัก แต่หาก NVIDIA บุกตลาดนี้โดยตรงก็นับว่าน่าจับตามอง

ที่มา – NVIDIA

No Description

from:https://www.blognone.com/node/105777