Code Monkey home page Code Monkey logo

dpdm2023-1's Introduction

⭐ SC637802 : Data Pre-processing and Data Mining ⭐

👉 Repository for Data Mining and Data Processing, MSc in Applied Statistics, KKU

Sitthatka Jarutsang 665020060-6

Work schedule Score
Research project 20%
Programming Assignment 40%
Midterm Exam 10%
Final Exam 30%

Grading

  • 85% ===> A
  • 80% ===> B+
  • 70% ===> B
  • <50% ===> F

🎓 Table of Contents 🎓

เนื้อหาทั้งหมดที่เราได้เรียนจะประกอบไปด้วย 6 เรื่องได้แก่

All content that we have learned will consist of 6 chapters:

Chapter Content
Chapter 1 Introduction
Chapter 2 Know the data
Chapter 3 Data Preprocessing
Chapter 6 Frequent Patterns(Association Rules)
Chapter 8 Classification
Chapter 10 Clustering

👉 Chapter 1 : Introduction

เนื้อหาเป็นการอธิบายเกี่ยวกับเนื้อหาที่เรียนและการเรียนรู้เกี่ยวกับ Python เบื้องต้น

The content explains the content we learn this semester and the basics of Python.

  • แบบบรรยาย (lecture part)

📄 Introduction ⏩ Chapter 1: Introduction

  • แบบปฎิบัติ (Coding part)

📝 Introduction ⏩ Introduction

📝 Basic python ⏩ python101


👉 Chapter 2 : Know the data

เนื้อหาเป็นการทำความรู้จักเกี่ยวกับ Data ทั้งที่มาในรูปแบบ เสียง ข้อความหรือภาพ เป็นต้น เพื่อสำหรับนำไปใช้งาน ทั้งนี้สำหรับส่วน Python จะมีการใช้คำสั่งต่างๆในการใช้งานการสร้าง function รวมไปถึงการดูภาพรวมข้อมูลทั้งหมดการทำ Boxplot และสร้างกราฟ

The content is about getting to know about Data, both in the form of sound, text, or images, etc., for use. In the Python part, various commands will be used to create functions, including viewing an overview of all data, doing Boxplots, and creating graphs.

  • แบบบรรยาย (lecture part)

📄 Know the data ⏩ Chapter 2: Know the data

  • แบบปฎิบัติ (Coding part)

📝 Data101 ⏩ Data101

📝 Data102 ⏩ Data102


👉 Chapter 3 : Preprocessing

เนื้อหาเป็นการสอนวิธีการทำความสะอาดข้อมูลเพื่อนำไปใช้งาน รวมทั้งการสอนการรวมตาราง การเพิ่ม Feature และการสร้างตารางขึ้นมาใหม่

The content teaches how to clean data for use. Including teaching how to combine tables, add features, and create new tables.

  • แบบบรรยาย (lecture part)

📄 Preprocessing ⏩ Chapter 3: Preprocessing

  • แบบปฎิบัติ (Coding part)

📝 Preprocessing ⏩ Data Preprocessing


👉 Chapter 6 : Frequent Patterns(Association Rules)

เนื้อหาเป็นการทำความเข้าใจเกี่ยวกับแพทเทิร์นของข้อมูล ว่าทุกๆข้อมูลจะมีแพทเทิร์นอย่างนี้แล้วผลลัพธ์จะได้อะไร รวมไปถึงการเข้าใจเกี่ยวกับ Assiciation Rules

The content is about understanding the patterns of the data. that every data will have a pattern like this, what will the results be? Including understanding about Association Rules.

  • แบบบรรยาย (lecture part)

📄 Frequent Patterns ⏩ Chapter 6 : Frequent Patterns(Association Rules)

  • แบบปฎิบัติ (Coding part)

📝 Frequent Patterns ⏩ Frequent Patterns

  • แบบทดสอบระหว่างเรียน (Quiz part)

🏆 Quiz 5 ⏩ Quiz 5


👉 Chapter 8 : Classification

เนื้อหาเป็นการทำความเข้าใจเกี่ยวกับการจำแนกข้อมูลซึ่งเป็น Supervise learning เพื่อให้ข้อมูลในอนาคตที่เข้ามาสามารถทำนายได้อย่างแม่นยำโดยได้มีการนำเสนอมากมายทั้ง Decision Tree,KNN เป็นต้น

The content is an understanding of data classification which is Supervise learning so that incoming future data can be accurately predicted. There are many presentations such as Decision Tree, KNN, etc.

  • แบบบรรยาย (lecture part)

📄 Classification ⏩ Chapter 8 : Classification

📄 KNN-Classification ⏩ KNN-Classification

  • แบบปฎิบัติ (Coding part)

📝 Classification ⏩ Classification

📝 K-nearest neighbor ⏩ K-nearest neighbor

  • แบบทดสอบระหว่างเรียน (Quiz part)

🏆 Quiz 6 ⏩ Quiz 6


👉 Chapter 10 : Clustering

เนื้อหาเป็นการทำความเข้าใจเกี่ยวกับการแบ่งกลุ่มซึ่งเป็น Unsupervise learning เพื่อให้ข้อมูลที่มีอยู่สามารถแบ่งกลุ่มเพื่ออธิบายข้อมูลของแต่ละกลุ่ม

The content is about understanding grouping, which is Unsupervise learning, so that existing data can be divided into groups to explain the information of each group.

  • แบบบรรยาย (lecture part)

📄 Clustering ⏩ Chapter 10 : Clustering


👉 Examination

การสอบในครั้งนี้แบ่งออกเป็น 2 ส่วนได้แก่การสอบกลางภาคและการสอบปลายภาคโดยมีคำตอบดังนี้

This exam is divided into 2 parts: a mid-term exam and a final exam with the answers as follows.

  • การสอบปฎิบัติ (Coding Examination)

📟 การสอบกลางภาค (Mid-term Exam) ⏩ Mid-term Exam

📟 การสอบปลายภาค (Final Exam) ⏩ Final Exam


👉 Research project

Research project เป็นการหา paper ที่ถูกเผยแพร่และมีเนื้อหาเกี่ยวกับกับรายวิชานี้ นำมาทดลองเผยแพร่เรียนรู้ในกับคนให้ห้องฟัง ทั้งนี้การนำเสนอครั้งนี้ได้นำเสนอเกี่ยวกับการทำนายการปล่อยน้ำออกจากแอ่งน้ำด้วยข้อมูลแอ่งน้ำในพื้นที่โคโลราโดตอนเหนือของสหรัฐอเมริกาเพื่อลดผลกระทบการเปลี่ยนแปลงของสภาวะอากาศ โดยหัวชื้อมีชื่อว่า A large-scale comparison of Artificial Intelligence and Data Mining (AI&DM) techniques in simulating reservoir releases over the Upper Colorado Region และได้นำเสนอผ่านเว็ปไซต์ https://www.sciencedirect.com/science/article/abs/pii/S0022169421007733

Research project is to find papers that have been published and have content related to this course. Bring it for testing and disseminate learning to people in the listening room. This presentation was about predicting water release from reservoir using reservoir data in the Upper Colorado Region of the United States to reduce the impacts of climate change. The title is A large-scale comparison of Artificial Intelligence and Data Mining (AI&DM) techniques in simulating reservoir releases over the Upper Colorado Region and is presented on the website https://www.sciencedirect.com/science/article/abs/pii/S0022169421007733 .

  • เนื้อหาใน Research project (Content in Research project)

💾 References ⏩ References for learning

💾 Presentation ⏩ Presentation

💾 Coding for learning ⏩ Coding part


🙏 ขอบคุณสำหรับการเยี่ยมชม (Thank you for visiting.) 🙏

dpdm2023-1's People

Contributors

sitthatkaja avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.