Data Engineering and Machine Learning with RapidMiner รุ่นที่ 8

วันที่ 18 – 19 พฤศจิกายน 2021

หลักการและเหตุผล

ในยุคที่ข้อมูลมีความสำคัญ มีความหลากหลาย และมีจำนวนมาก องค์กรต้องการการวิเคราะห์ข้อมูลที่สามารถนำไปต่อยอดในเชิงธุรกิจ อุตสาหกรรม หรืองานวิจัยได้อย่างมีคุณค่า จึงทำให้ Data Science หรือวิทยาการข้อมูล เป็นสาขาที่ได้รับความสนใจในหลากหลายภาคส่วน และ Data Mining หรือการทำเหมืองข้อมูลก็ถือว่าเป็นทักษะสำคัญที่ Data Scientist จำเป็นต้องมี
ในหลักสูตรนี้จะปูพื้นฐานให้ผู้อบรมได้เห็นภาพรวมของการทำวิทยาการข้อมูล Data Science และการวิเคราะห์ข้อมูลในมุมมองของการทำ Data Mining ด้วยโปรแกรม RapidMiner 

โดยจะเรียนรู้ตั้งแต่การเข้าใจกระบวนการทางธุรกิจในกรณีศึกษาที่ยกมาการนำเข้าข้อมูล การรวมข้อมูลจากหลายแหล่งข้อมูล การคัดเลือกและแปลงข้อมูลการใช้เทคนิค Data Mining และ Machine Learning ในการทำ Predictive Modeling เพื่อการทำนายผลลัพธ์ที่คาดว่าจะเกิดขึ้นในอนาคต
ในการอบรม จะมีทั้งกระบวนการแบบพื้นฐานและกระบวนการวิเคราะห์ข้อมูลแบขั้นสูงเพื่อให้ผู้อบรมได้เข้าใจรูปแบบของกระบวนการที่ใช้กันในชีวิตจริงได้

ดำเนินการสอนโดย ผศ.ดร.โษฑศ์รัตต ธรรมบุษดี มหาวิทยาลัยมหิดล และ RapidMiner Certified Analyst

วัตถุประสงค์

    1. ผู้เข้าอบรมเข้าใจหลักการและกระบวนการการวิเคราะห์ข้อมูลในรูปแบบ Data Science
    2. ผู้อบรมเข้าใจประเภทของการวิเคราะห์ข้อมูลแบบต่าง ๆ และเข้าใจหลักการตั้งโจทย์ด้าน Data Science จาก ปัญหาทางธุรกิจ และฝึกปฏิบัติด้วย Data Science Canvas
    3. ผู้อบรมเข้าใจกระบวนการที่สำคัญของ Data Engineering และฝึกปฏิบัติด้วยโปรแกรม RapidMiner Studio
    4. ผู้อบรมเข้าใจหลักการสำคัญของ Machine Learning ในการจำแนกข้อมูล (Classification) การวิเคราะห์ข้อมูลเชขิงตัวเลข (Regression) การจำแนกข้อมูล (Clustering) การวิเคราะห์ข้อมูลผิดปกติ (Outlier analysis) และฝึกปฏิบัติด้วยโปรแกรม RapidMiner Studio
    5. ผู้อบรมสามารถสร้าง Flow ของการวิเคราะห์ข้อมูลขั้นสูงได้โดยไม่ต้องเขียนโค้ดด้วยโปรแกรม RapidMiner Studio
    6. ผู้อบรมสามารถนำโมเดลที่สร้างมาหาทางเลือกที่ดีที่สุดได้ (Prescriptive Analytics)

หลักสูตรนี้เหมาะกับใครบ้าง

  • ผู้ใช้งานทั่วไป
  • ผู้ที่ต้องการเริ่มต้นเรียนรู้ด้าน Data Science 
  • ผู้ที่ต้องการเรียนรู้และเข้าใจกระบวนการด้าน Data Scince ขั้นพื้นฐานจนถึงขั้นสูง
  • ผู้ที่ต้องการใช้โปรแกรม RapidMiner ไปต่อยอดในกระบวนการทำงาน

ความรู้พื้นฐาน

ไม่ต้องมีความรู้พื้นฐาน

                                                                                                                   

Desktop system requirements 

Recommended

  • Quad core 3GHz or faster processor
  • 8GB RAM
  • >100GB free disk space

Operating System

  • Windows 7, Windows 8, Windows 8.1, Windows 10 (64-bit highly recommended)
  • Linux (64-bit only)
  • MacOS X 10.10 – 10.14

                                                                                                                   

18 – 19 พฤศจิกายน 2564

เวลา 9:00-16:00 น. ( 12 ชั่วโมง)

                                                                                                                   

 

3,625 บาท

                                                                                                                   

สถานที่ 

                                                                                                                   

กำหนดการ

วันที่ เวลา หัวข้อ

18 พฤศจิกายน

 

9.00 – 12.00

Module 1: Intro to Data Science and Data Analytics Types

– Data Science Essential

– Data Mining Process

– Data Analytics Types

– Data and Data Type

Module 2: Data Science Business Canvas

13.00 – 16.00

Module 3: Data Engineering Concepts and Workshop with RapidMiner Studio

– Data Engineering Concepts

– Introduction to RapidMiner Studio

– Data Ingestion

– Data Blending

– Missing Values Handling

– Data Transformation

– Data Joining

– Data Cleansing

– Aggregation & Pivoting

– Features generation

– Introduction to TurboPrep

19 พฤศจิกายน

 

9.00 – 12.00

Module 4: Machine Learning Concepts with RapidMiner Studio

  • Predictive Modeling and Performance Measurements
    • Decision Tree
    • K-Nearest Neighbors
    • Naïve Bayes
    • Linear Regression
    • Logistics Regression
    • Neural Network
    • Random Forests
  • Performance Measurements
  • Data Rebalancing
  • Outlier Detection
  • Clustering

Module 5: Advanced Process Flow

  • Macro
  • Subprocess and Condition branching
  • Looping
  • Parameter Tuning
  • Remember & Recall

13.00 – 16.00

Module 6 : Prescriptive Analytics

Module 7 : Automated Machine Learning with AutoModel

 

**โปรดนำ Notebook ส่วนตัวมาใช้ในวันอบรม***

                                                                                                                                                                                                                     

                                                                                                                   

สอบถามรายละเอียดเพิ่มเติมได้ที่

Email : Datalentteam@gmail.com

Facebook : Datalent Team 

Tel : 097-1135975 (คุณบอย)