👉 Repository for Data Mining and Data Processing, MSc in Applied Statistics, KKU
Work schedule | Score |
---|---|
Research project | 20% |
Programming Assignment | 40% |
Midterm Exam | 10% |
Final Exam | 30% |
- 85% ===> A
- 80% ===> B+
- 70% ===> B
- <50% ===> F
เนื้อหาทั้งหมดที่เราได้เรียนจะประกอบไปด้วย 6 เรื่องได้แก่
All content that we have learned will consist of 6 chapters:
Chapter | Content |
---|---|
Chapter 1 | Introduction |
Chapter 2 | Know the data |
Chapter 3 | Data Preprocessing |
Chapter 6 | Frequent Patterns(Association Rules) |
Chapter 8 | Classification |
Chapter 10 | Clustering |
เนื้อหาเป็นการอธิบายเกี่ยวกับเนื้อหาที่เรียนและการเรียนรู้เกี่ยวกับ Python เบื้องต้น
The content explains the content we learn this semester and the basics of Python.
- แบบบรรยาย (lecture part)
📄 Introduction ⏩ Chapter 1: Introduction
- แบบปฎิบัติ (Coding part)
📝 Introduction ⏩ Introduction
📝 Basic python ⏩ python101
เนื้อหาเป็นการทำความรู้จักเกี่ยวกับ Data ทั้งที่มาในรูปแบบ เสียง ข้อความหรือภาพ เป็นต้น เพื่อสำหรับนำไปใช้งาน ทั้งนี้สำหรับส่วน Python จะมีการใช้คำสั่งต่างๆในการใช้งานการสร้าง function รวมไปถึงการดูภาพรวมข้อมูลทั้งหมดการทำ Boxplot และสร้างกราฟ
The content is about getting to know about Data, both in the form of sound, text, or images, etc., for use. In the Python part, various commands will be used to create functions, including viewing an overview of all data, doing Boxplots, and creating graphs.
- แบบบรรยาย (lecture part)
📄 Know the data ⏩ Chapter 2: Know the data
- แบบปฎิบัติ (Coding part)
📝 Data101 ⏩ Data101
📝 Data102 ⏩ Data102
เนื้อหาเป็นการสอนวิธีการทำความสะอาดข้อมูลเพื่อนำไปใช้งาน รวมทั้งการสอนการรวมตาราง การเพิ่ม Feature และการสร้างตารางขึ้นมาใหม่
The content teaches how to clean data for use. Including teaching how to combine tables, add features, and create new tables.
- แบบบรรยาย (lecture part)
📄 Preprocessing ⏩ Chapter 3: Preprocessing
- แบบปฎิบัติ (Coding part)
📝 Preprocessing ⏩ Data Preprocessing
เนื้อหาเป็นการทำความเข้าใจเกี่ยวกับแพทเทิร์นของข้อมูล ว่าทุกๆข้อมูลจะมีแพทเทิร์นอย่างนี้แล้วผลลัพธ์จะได้อะไร รวมไปถึงการเข้าใจเกี่ยวกับ Assiciation Rules
The content is about understanding the patterns of the data. that every data will have a pattern like this, what will the results be? Including understanding about Association Rules.
- แบบบรรยาย (lecture part)
📄 Frequent Patterns ⏩ Chapter 6 : Frequent Patterns(Association Rules)
- แบบปฎิบัติ (Coding part)
📝 Frequent Patterns ⏩ Frequent Patterns
- แบบทดสอบระหว่างเรียน (Quiz part)
🏆 Quiz 5 ⏩ Quiz 5
เนื้อหาเป็นการทำความเข้าใจเกี่ยวกับการจำแนกข้อมูลซึ่งเป็น Supervise learning เพื่อให้ข้อมูลในอนาคตที่เข้ามาสามารถทำนายได้อย่างแม่นยำโดยได้มีการนำเสนอมากมายทั้ง Decision Tree,KNN เป็นต้น
The content is an understanding of data classification which is Supervise learning so that incoming future data can be accurately predicted. There are many presentations such as Decision Tree, KNN, etc.
- แบบบรรยาย (lecture part)
📄 Classification ⏩ Chapter 8 : Classification
📄 KNN-Classification ⏩ KNN-Classification
- แบบปฎิบัติ (Coding part)
📝 Classification ⏩ Classification
📝 K-nearest neighbor ⏩ K-nearest neighbor
- แบบทดสอบระหว่างเรียน (Quiz part)
🏆 Quiz 6 ⏩ Quiz 6
เนื้อหาเป็นการทำความเข้าใจเกี่ยวกับการแบ่งกลุ่มซึ่งเป็น Unsupervise learning เพื่อให้ข้อมูลที่มีอยู่สามารถแบ่งกลุ่มเพื่ออธิบายข้อมูลของแต่ละกลุ่ม
The content is about understanding grouping, which is Unsupervise learning, so that existing data can be divided into groups to explain the information of each group.
- แบบบรรยาย (lecture part)
📄 Clustering ⏩ Chapter 10 : Clustering
การสอบในครั้งนี้แบ่งออกเป็น 2 ส่วนได้แก่การสอบกลางภาคและการสอบปลายภาคโดยมีคำตอบดังนี้
This exam is divided into 2 parts: a mid-term exam and a final exam with the answers as follows.
- การสอบปฎิบัติ (Coding Examination)
📟 การสอบกลางภาค (Mid-term Exam) ⏩ Mid-term Exam
📟 การสอบปลายภาค (Final Exam) ⏩ Final Exam
Research project เป็นการหา paper ที่ถูกเผยแพร่และมีเนื้อหาเกี่ยวกับกับรายวิชานี้ นำมาทดลองเผยแพร่เรียนรู้ในกับคนให้ห้องฟัง ทั้งนี้การนำเสนอครั้งนี้ได้นำเสนอเกี่ยวกับการทำนายการปล่อยน้ำออกจากแอ่งน้ำด้วยข้อมูลแอ่งน้ำในพื้นที่โคโลราโดตอนเหนือของสหรัฐอเมริกาเพื่อลดผลกระทบการเปลี่ยนแปลงของสภาวะอากาศ โดยหัวชื้อมีชื่อว่า A large-scale comparison of Artificial Intelligence and Data Mining (AI&DM) techniques in simulating reservoir releases over the Upper Colorado Region และได้นำเสนอผ่านเว็ปไซต์ https://www.sciencedirect.com/science/article/abs/pii/S0022169421007733
Research project is to find papers that have been published and have content related to this course. Bring it for testing and disseminate learning to people in the listening room. This presentation was about predicting water release from reservoir using reservoir data in the Upper Colorado Region of the United States to reduce the impacts of climate change. The title is A large-scale comparison of Artificial Intelligence and Data Mining (AI&DM) techniques in simulating reservoir releases over the Upper Colorado Region and is presented on the website https://www.sciencedirect.com/science/article/abs/pii/S0022169421007733 .
- เนื้อหาใน Research project (Content in Research project)
💾 References ⏩ References for learning
💾 Presentation ⏩ Presentation
💾 Coding for learning ⏩ Coding part
🙏 ขอบคุณสำหรับการเยี่ยมชม (Thank you for visiting.) 🙏