Learning Data Science Ecosystem and Data Mining with RapidMiner Studio

Code : DS-18-01

หลักการและเหตุผล

ในยุคที่ข้อมูลมีความสำคัญ มีความหลากหลาย มีจำนวนมาก องค์กรต้องการการวิเคราะห์ข้อมูลที่สามารถนำไปต่อยอดในเชิงธุรกิจ อุตสาหกรรม หรืองานวิจัยได้อย่างมีคุณค่า จึงทำให้ Data Scienceหรือวิทยาการข้อมูล เป็นสาขาที่ได้รับความสนใจในหลากหลายภาคส่วน และ Data Mining หรือการทำเหมืองข้อมูลก็ถือว่าเป็นทักษะสำคัญที่ Data Scientist จำเป็นต้องมี

ในหลักสูตรนี้จะปูพื้นฐานให้ผู้อบรมได้เห็นภาพรวมของ Data Science และการวิเคราะห์ข้อมูลในมุมมองของการทำ Data Mining ด้วยโปรแกรม RapidMiner Studio โดยจะเรียนนรู้ตั้งแต่การเข้าใจกระบวนการทางธุรกิจในกรณีศึกษาที่ยกมา การนำเข้าข้อมูล การรวมข้อมูลจากหลายแหล่งข้อมูล การคัดเลือกและแปลงข้อมูล การใช้เทคนิค Data Mining และ Machine Learning ในการทำ Predictive Modeling เพื่อการทำนายผลลัพธ์ที่คาดว่าจะเกิดขึ้นในอนาคต การทำ Classification และ Regression การแบ่งกลุ่มข้อมูลโดยวิธี Clustering การหาความสัมพันธ์ของข้อมูลด้วยวิธี Association Rules การวิเคราะห์ข้อมูลที่ผิดปกติโดยวิธี Outlier Analysis ไปจนถึงการวิเคราะห์ข้อมูลที่เป็นข้อความและเว็บเพจด้วยกระบวนการ Text Mining และ Web Mining โดยทั้งหมดนี้ ผู้อบรมไม่จำเป็นต้องเขียนโค้ดโปรแกรมสักบรรทัด เพราะเราเชื่อว่า Mindset ของการวิเคราะห์ข้อมูล สร้างยากและสำคัญกว่า Mindsetในการเขียนโปรแกรม

ยิ่งไปกว่านั้น หลักสูตรนี้ยังปูพื้นฐานการเชื่อมต่อกับข้อมูลหลากหลายรูปแบบ การดึงข้อมูล Big Data จาก Hadoop และประมวลผลด้วย Spark ผ่านเครื่องมือ RapidMiner Radoop เพื่อมองเห็นโอกาสในเพิ่มมูลค่าในธุรกิจหรืองานวิจัยที่ทำอยู่ได้ โดยผู้เข้าอบรมไม่จำเป็นต้องมีความรู้พื้นฐานในการเขียนโปรแกรมมาก่อน

Agenda

วันที่ เวลา หัวข้อ
 7 กรกฏาคม 2018 09.00-10.00 Data Science Essential, Machine Learning and Data Mining Process
10.00-10.30 Introduction to RapidMiner Studio
10.30-10.45 break
10.45-11.00 Data and Data Format
11.00-12.00 Data Exloration and Visualization
12.00-13.00 lunch
13.00-14.30 Data Blending and Transformation
14.30-14.45 break
14.45-16.00 Data Quality Essentials
 8 กรกฏาคม 2018 09.00-10.00 Basic Classification Technique: Decision Tree, Naïve Bayes,l-Nearest Neighbors
10.00-10.30 Basic Classification Technique: Random Tree and Random Forest
10.30-10.45 break
10.30-11.00 Regression Methods
11.00-12.00 Classification Evaluation: Confusion Matrix, ROC Curve, and Cost Matrix
12.00-13.00 lunch
13.00-14.30 Advance Classification: Neural Network and Parameter Tuning
14.30-14.45 break
14.45-16.00 Model selection method and model integration
 21 กรกฏาคม 2018 09.00-10.00 RapidMiner control flow and Macro
10.00-10.30 Clustering Methods
10.30-10.45 break
10.30-11.00 Advance Clustering Process
11.00-12.00 Semi-supervised Learning
12.00-13.00 lunch
13.00-14.30 Association Rules Discovery
14.30-14.45 break
14.45-15.30 Feature Subset Selection / Missing Values Imputation / Pirncipal Components Analysis
15.30-16.00 Outlier Analysis
 22 กรกฏาคม 2018 09.00-09.30 Introduction to Text Mining
09.30-10.30 Text Classification Use Cases
10.30-10.45 break
10.45-12.00 Web Mining
12.00-13.00 lunch
13.00-13.30 Introduction to Hadoop, Hive, and Spark
13.30-14.30 Big Data Mining Use Cases
14.30-14.45 break
14.45-16.00 WORKSHOP

***โปรดนำ Notebook ส่วนตัวมาด้วยในวันอบรม***

หลักสูตรนี้เหมาะสำหรับ

บุคคลทั่วไปที่ต้องการมีความรู้เบื้องต้นที่จะเข้าสู่สายงาน Data Scienceและมองเห็นว่าการวิเคราะห์ข้อมูลเชิงลึกจะเพิ่มมูลค่าให้หน่วยงานได้

ความรู้พื้นฐาน

ไม่ต้องมีความรู้พื้นฐาน

วันที่

7 - 8 และ 21 - 22 กรกฏาคม 2018

เวลา 9:00-16:00 น. (24 ชั่วโมง)

อัตราค่าลงทะเบียน

8,500 บาท

** ชำระเงินภายใน 23 มิ.ย. ชำระเพียงท่านละ 7,225 บาท **

สถานที่

The Connecion @MRT ลาดพร้าว