Learning Data Science Ecosystem and Data Mining with RapidMiner Studio
Code : DS-18-01
หลักการและเหตุผล
ในยุคที่ข้อมูลมีความสำคัญ มีความหลากหลาย มีจำนวนมาก องค์กรต้องการการวิเคราะห์ข้อมูลที่สามารถนำไปต่อยอดในเชิงธุรกิจ อุตสาหกรรม หรืองานวิจัยได้อย่างมีคุณค่า จึงทำให้ Data Scienceหรือวิทยาการข้อมูล เป็นสาขาที่ได้รับความสนใจในหลากหลายภาคส่วน และ Data Mining หรือการทำเหมืองข้อมูลก็ถือว่าเป็นทักษะสำคัญที่ Data Scientist จำเป็นต้องมี
ในหลักสูตรนี้จะปูพื้นฐานให้ผู้อบรมได้เห็นภาพรวมของ Data Science และการวิเคราะห์ข้อมูลในมุมมองของการทำ Data Mining ด้วยโปรแกรม RapidMiner Studio โดยจะเรียนนรู้ตั้งแต่การเข้าใจกระบวนการทางธุรกิจในกรณีศึกษาที่ยกมา การนำเข้าข้อมูล การรวมข้อมูลจากหลายแหล่งข้อมูล การคัดเลือกและแปลงข้อมูล การใช้เทคนิค Data Mining และ Machine Learning ในการทำ Predictive Modeling เพื่อการทำนายผลลัพธ์ที่คาดว่าจะเกิดขึ้นในอนาคต การทำ Classification และ Regression การแบ่งกลุ่มข้อมูลโดยวิธี Clustering การหาความสัมพันธ์ของข้อมูลด้วยวิธี Association Rules การวิเคราะห์ข้อมูลที่ผิดปกติโดยวิธี Outlier Analysis ไปจนถึงการวิเคราะห์ข้อมูลที่เป็นข้อความและเว็บเพจด้วยกระบวนการ Text Mining และ Web Mining โดยทั้งหมดนี้ ผู้อบรมไม่จำเป็นต้องเขียนโค้ดโปรแกรมสักบรรทัด เพราะเราเชื่อว่า Mindset ของการวิเคราะห์ข้อมูล สร้างยากและสำคัญกว่า Mindsetในการเขียนโปรแกรม
ยิ่งไปกว่านั้น หลักสูตรนี้ยังปูพื้นฐานการเชื่อมต่อกับข้อมูลหลากหลายรูปแบบ การดึงข้อมูล Big Data จาก Hadoop และประมวลผลด้วย Spark ผ่านเครื่องมือ RapidMiner Radoop เพื่อมองเห็นโอกาสในเพิ่มมูลค่าในธุรกิจหรืองานวิจัยที่ทำอยู่ได้ โดยผู้เข้าอบรมไม่จำเป็นต้องมีความรู้พื้นฐานในการเขียนโปรแกรมมาก่อน
Agenda
วันที่ | เวลา | หัวข้อ |
7 กรกฏาคม 2018 | 09.00-10.00 | Data Science Essential, Machine Learning and Data Mining Process |
10.00-10.30 | Introduction to RapidMiner Studio | |
10.30-10.45 | break | |
10.45-11.00 | Data and Data Format | |
11.00-12.00 | Data Exloration and Visualization | |
12.00-13.00 | lunch | |
13.00-14.30 | Data Blending and Transformation | |
14.30-14.45 | break | |
14.45-16.00 | Data Quality Essentials | |
8 กรกฏาคม 2018 | 09.00-10.00 | Basic Classification Technique: Decision Tree, Naïve Bayes,l-Nearest Neighbors |
10.00-10.30 | Basic Classification Technique: Random Tree and Random Forest | |
10.30-10.45 | break | |
10.30-11.00 | Regression Methods | |
11.00-12.00 | Classification Evaluation: Confusion Matrix, ROC Curve, and Cost Matrix | |
12.00-13.00 | lunch | |
13.00-14.30 | Advance Classification: Neural Network and Parameter Tuning | |
14.30-14.45 | break | |
14.45-16.00 | Model selection method and model integration | |
21 กรกฏาคม 2018 | 09.00-10.00 | RapidMiner control flow and Macro |
10.00-10.30 | Clustering Methods | |
10.30-10.45 | break | |
10.30-11.00 | Advance Clustering Process | |
11.00-12.00 | Semi-supervised Learning | |
12.00-13.00 | lunch | |
13.00-14.30 | Association Rules Discovery | |
14.30-14.45 | break | |
14.45-15.30 | Feature Subset Selection / Missing Values Imputation / Pirncipal Components Analysis | |
15.30-16.00 | Outlier Analysis | |
22 กรกฏาคม 2018 | 09.00-09.30 | Introduction to Text Mining |
09.30-10.30 | Text Classification Use Cases | |
10.30-10.45 | break | |
10.45-12.00 | Web Mining | |
12.00-13.00 | lunch | |
13.00-13.30 | Introduction to Hadoop, Hive, and Spark | |
13.30-14.30 | Big Data Mining Use Cases | |
14.30-14.45 | break | |
14.45-16.00 | WORKSHOP |
***โปรดนำ Notebook ส่วนตัวมาด้วยในวันอบรม***
หลักสูตรนี้เหมาะสำหรับ
บุคคลทั่วไปที่ต้องการมีความรู้เบื้องต้นที่จะเข้าสู่สายงาน Data Scienceและมองเห็นว่าการวิเคราะห์ข้อมูลเชิงลึกจะเพิ่มมูลค่าให้หน่วยงานได้
ความรู้พื้นฐาน
ไม่ต้องมีความรู้พื้นฐาน
วันที่
7 - 8 และ 21 - 22 กรกฏาคม 2018
เวลา 9:00-16:00 น. (24 ชั่วโมง)
อัตราค่าลงทะเบียน
8,500 บาท
** ชำระเงินภายใน 23 มิ.ย. ชำระเพียงท่านละ 7,225 บาท **
สถานที่
The Connecion @MRT ลาดพร้าว