Data Engineering and Machine Learning with RapidMiner Studio รุ่นที่ 7

วันที่ 9 – 11 พฤศจิกายน 2020

หนังสืออนุมัติโครงการ

หลักการและเหตุผล

ในยุคที่ข้อมูลมีความสำคัญ มีความหลากหลาย มีจำนวนมาก องค์กรต้องการการวิเคราะห์ข้อมูลที่สามารถนำไปต่อยอดในเชิงธุรกิจ อุตสาหกรรม หรืองานวิจัยได้อย่างมีคุณค่า จึงทำให้ Data Scienceหรือวิทยาการข้อมูล เป็นสาขาที่ได้รับความสนใจในหลากหลายภาคส่วน และ Data Mining หรือการทำเหมืองข้อมูลก็ถือว่าเป็นทักษะสำคัญที่ Data Scientist จำเป็นต้องมี
ในหลักสูตรนี้จะปูพื้นฐานให้ผู้อบรมได้เห็นภาพรวมของการทำวิทยาการข้อมูล Data Science และการวิเคราะห์ข้อมูลในมุมมองของการทำData Mining ด้วยโปรแกรม RapidMiner Studio 

โดยจะเรียนนรู้ตั้งแต่การเข้าใจกระบวนการทางธุรกิจในกรณีศึกษาที่ยกมาการนำเข้าข้อมูล การรวมข้อมูลจากหลายแหล่งข้อมูล การคัดเลือกและแปลงข้อมูลการใช้เทคนิค Data Mining และ Machine Learning ในการทำ Predictive Modeling เพื่อการทำนายผลลัพธ์ที่คาดว่าจะเกิดขึ้นในอนาคต
ในการอบรม จะมีทั้งกระบวนการแบบพื้นฐานและกระบวนการวิเคราะห์ข้อมูลแบขั้นสูงเพื่อให้ผู้อบรมได้เข้าใจรูปแบบของกระบวนการที่ใช้กันในชีวิตจริงได้
หลักสูตรนี้จะเป็น Interactive Online Course และมีผู้ช่วยสอนคอยดูแลผู้อบรมตั้งแต่เริ่มจนถึงการทำ Workshop ครับ

ดำเนินการสอนโดย ผศ.ดร.โษฑศ์รัตต ธรรมบุษดี (ดาวน์โหลดเอกสารประวัติวิทยากร) มหาวิทยาลัยมหิดล และ RapidMiner Certified Analyst

วัตถุประสงค์

    1. ผู้เข้าอบรมสามารถนำความรู้ด้าน Data Science ไปต่อยอดได้
    2. ผู้อบรมเข้าใจกระบวนการด้าน Data Science และสามารถนำไปประยุกต์ใช้ในการทำงานได้อย่างมีประสิทธิภาพ
    3. ผู้อบรมสามารถเข้าใจกระบวนการต่างๆด้าน Data Science เช่น ETL Processม, Predictive Modeling และ  Advanced Machine Learning Algorithms

หลักสูตรนี้เหมาะกับใครบ้าง

  • ผู้ใช้งานทั่วไป
  • ผู้ที่ต้องการเริ่มต้นเรียนรู้ด้าน Data Science 
  • ผู้ที่ต้องการเรียนรู้และเข้าใจกระบวนการด้าน Data Scince ขั้นพื้นฐานจนถึงขั้นสูง
  • ผู้ที่ต้องการใช้โปรแกรม RapidMiner ไปต่อยอดในกระบวนการทำงาน

ความรู้พื้นฐาน

ไม่ต้องมีความรู้พื้นฐาน

                                                                                                                   

Desktop system requirements 

Recommended

  • Quad core 3GHz or faster processor
  • 8GB RAM
  • >100GB free disk space

Operating System

  • Windows 7, Windows 8, Windows 8.1, Windows 10 (64-bit highly recommended)
  • Linux (64-bit only)
  • MacOS X 10.10 – 10.14

                                                                                                                   

9 – 11 พฤศจิกายน 2563

เวลา 9:00-16:00 น. ( 18 ชั่วโมง)

                                                                                                                   

 

6,900 บาท

** ศิษย์เก่า ITM – Mahidol ลด 15% เหลือ 5,865 บาท** 

                                                                                                                   

สถานที่ 

                                                                                                                  

กำหนดการ

วันที่ เวลา หัวข้อ

9 พฤศจิกายน

 

9.00 – 12.00

– Data Science Essential
– Data Mining Process
– Data Engineering Concepts
– Introduction to RapidMiner Studio
– Introduction to TurboPrep
– Data and Data Type
– Essential Data Engineering Functions with RapidMiner Operators
  • Data Ingestion
  • Data Blending
  • Missing Values Handling
  • Data Transformation

13.00 – 16.00

– RapidMiner Process Control
  • Looping
  • Macro 
– ETL Process (Basic)
  • Data Ingestion
  • Data Transformation
– ETL Process (Intermediate)
  • Looping multiple files
  • Data Joining
  • Data Cleansing
  • Feature weighting
– ETL Process (Advanced)
  • Aggregation & Pivoting
  • Features generation 

10 พฤศจิกายน

 

9.00 – 12.00

– Machine Learning Concepts

– Essential Machine Learning Functions

  • Predictive Modeling
  • Decision Tree
  • K-Nearest Neighbors
  • Naïve Bayes
  • Linear Regression
  • Performance Measurements
  • Data Rebalancing
  • Outlier Detection
  • Ensemble Methods 

– Predictive Modeling (Basic)

  • Basic process & algorithms
  • Parameters setting 

– Predictive Modeling (Intermediate)

  • Ensemble method
  • Outlier detection
  • Performance measurement
  • Imbalanced Data Handling
  • Cost measurement 

13.00 – 16.00

– Advanced Machine Learning Algorithms
  • Neural Network
  • Random Forest
  • Gradient Boosted Tree
  • Logistic Regression 
– Hyper parameter Tuning
– Predictive Modeling (Advanced)
  • Model comparison
  • Parameter Optimization 
– Unsupervised learning
  • Feature extraction
  • Clustering Methods 
 

11 พฤศจิกายน

9.00 – 12.00

– Optimization and Prescriptive analytics 
– Model simulation and explanation 

13.00 – 16.00

– Introduction to Auto Model 
– Predictive Modeling Operationalization 

**โปรดนำ Notebook ส่วนตัวมาใช้ในวันอบรม***

                                                                                                                                                                                                                     

                                                                                                                   

สอบถามรายละเอียดเพิ่มเติมได้ที่

Email : Datalentteam@gmail.com

Facebook : Datalent Team 

Tel : 097-1135975 (คุณบอย)