Code Monkey home page Code Monkey logo

datascience-resources's Introduction

DataScience-Resources

🔎 📚📊 مصادر لكل ما يتعلق بعلم البيانات

لأي شخص حاب يدخل مجال علم البيانات ومحتار كيف يبدأ فيه هنا راح افيدكم بالمصادر اللي ساعدتني في تعلمه ,طبعا حبيت استفيد من تجربتي بمعسكر سدايا بحيث أني امشي على نفس roadmap من حيث من وين راح تبدون واضيف من عندي بعض الأشياء اللي فضلتها فبدل ما احطها بالمفضلة وانساها اجمعها هنا بحيث تكون مرجع لي ولكم
{تنوية : المصادر غير متعلقة بالمعسكر }
{نصيحة : إذا بتأخذون كورس ابحثوا عن الكورسيز اللي لها مسار عشان ما تتشتتون وتصير المواضيع اللي هنا لتنمية مهاراتكم } 🧠 Data Scientist with Python مثل هالمسار

🕵️‍♀️ سيتم تحديث الملف بشكل دوري


Table of Contents المحتويات :

What Is Data Science ?

Python Basics أساسيات البايثون

Mathematical Statistics for Data Science

SQL

Data Resources

Data Science Life Cycle

Exploratory Data Analysis and Cleaning Data

Machine Learning

Natural Language Processing

Deep Learning

Treasure (محتويات ثرية)

Support Resources

Practice & Competitions

Research Papers

Social Media

Interview Resources

Data Science Infographic

⁉️ What is Data Science:

ماهو علم البيانات ؟ هو مجال متعدد التخصصات حيثُ انه يجمع مابين الرياضيات والإحصاء وعلوم الحاسب و نظم المعلومات ليسمح لك بتحليل البيانات وإستخراج المعرفة من البيانات المهيكلة والغير المهيكلة لإنتاج أنظمة ذكية لأداء المهام التي تتطلب عادةً ذكاءًا بشريًا.
For More Details تفاصيل تشرح لك ايش هو علم البيانات
What is data science?
Data Science-quora
علم البيانات
كيف تبدأ رحلتك في مجال علم البيانات
Data Science In 5 Minutes

🐍 1- Python Basics أساسيات البايثون

اولاً يحتاج منك تتعلم لغة برمجية زي البايثون أولغة R فراح اشارككم بمصادر للبايثون لأني طبقت عليه ، فإذا كنتم مبتدئين و ماعندكم خلفية عن البايثون يحتاج تتعلم اولاً الأساسيات بعدين تتعرف على المكتبات اللي راح تستخدمها بالتحليل. 

 

هالجدول مقسم لثلاث اقسام القسم الأول راح تلاقون فيه المواقع اللي تشرح لكم الأساسيات وايضًا توفر لكم تمارين تتدربون عليها ، أما القسم الثاني فيه توصيات لأفضل الكتب والقسم الأخير عباره عن فيديوهات شرح للبايثون.
WebSites BOOK YouTube&courses
W3schools Think Python Python Tutorials
pymbook 7 Best Book on Python Learn Python
PYTHON TUTORIAL Python books Python for Beginners
Py.programiz [-] Codzila بالعربي
اكاديمية حوسب [-] Elzero بالعربي )
Harmash [-] Python for Everybody Specialization
منصة سطر [-] Python Bootcamp
Hackerrank

✅ بعد ماعرفنا الأساسيات الآن نبدأ نستخدم البايثون في علم البيانات ونتعرف على المكتبات المستخدمة .

 

1.1 Python For Data Science

مواقع تتكلم عن المكتبات المستخدمة في علم البيانات
كورس مقدمة عن البايثون في علم البيانات

1.2 Python Libraries


✅ الإحصاء لعلم البيانات.

 

♟️ 2- Mathematical Statistics for Data Science

الإحصاء هو دراسة جمع البيانات وتحليلها وتفسيرها وعرضها وتنظيمها للمساعدة في إتخاذ القرار، لذا عليك ان تكون على دراية جيدة بالمفاهيم الإحصائية كالتوزيعات الاحتمالية (probability distributions) والأهمية الإحصائية (statistical significance) واختبار الفرضيات (hypothesis testing) والانحدار (regression) الارتباط (Correlation)
يمكن تصنيف تعلم الإحصاء إلى فئيتين :
Descriptive Statistics - الإحصاء الوصفي Inferential Statistics - الإحصاء الإستنتاجي
Intro to Descriptive Statistics Intro to Inferential Statistics

2.1 Statistics For Data Science


✅ الاستعلام عن البيانات بإستخدام لغة الاستعلام الهيكلية (SQL)

 

🔍 3- SQL

الآن يحتاج ان نعرف أهم المفاهيم في قواعد البيانات لذلك حصلت هالموقع للأمانة اتعب وانا أقول انه بطل طبعًا ليه بطل لانه يوفر كل شي نحتاجة مثل الكورسات ويعطي تقييم ومدة كل كورس وموفر بعد كتب وفايدة كل كتاب وكمان فيه قنوات يوتيوب متعلقة بشرح SQL ومواقع للتتوريالز.

|50 Best Resources to Learn SQL (YouTube, Courses, Books, etc)- 2022 |

|-------------------------------------------------------------------|


✅ بما اننا نحتاج نشتغل على بيانات نحتاج نعرف من وين نجيبها فهنا بعض المصادر اللي تقدرون من خلالها تحصلون على البيانات

 

🗂️ 4- DATA RESOURCES مصادر البيانات


✅ واخيرًا جينا للجزء المهم واللي هو كيف نبدأ نستكشف البيانات ونحللها و نستخدم التبؤ ونتعرف على دورة حياة علم البيانات

 

♻️ 5- Data Science Life Cycle :

فالبداية قبل ما نشتغل على أي مشروع نحتاج نعرف ماهي الخطوات التي يجب اتباعها عند البدء بالمشروع وجعل نتيجة المشروع النهائية مرضية .

اولاً فهم المشكلة :

هذه المرحلة مهمة جدًا في انك تفهم المشكلة وتطرح عدة أسئلة ،ففهم المشكلات يعتبر أحد المراحل الأولية لدورة حياة علوم البيانات فبدون فهم المشكلة تكون جميع الرؤى عديمة الفائدة .

ثانيًا فهم البيانات :

هي الخطوة التي نقوم فيها بجمع البيانات من مصادر مختلفة فمن الضروري معرفة كيفية الحصول على البيانات وكيف يتم تجميعها – لدينا عدة طرق للحصول على البيانات ابرزها الحصول عليها من المواقع ، من الشركة او عن طريق الاستطلاعات او سحب البيانات بإستخدام السكرابت لسحب البيانات من موقع معين، بعد ما تتم عملية جمع البيانات والحصول عليها ننتقل لعملية تحليل البيانات الاستكشافية لإستكشاف العلاقة بين المتغيرات وأنواع البيانات ومعرفة البيانات المفقودة والشاذه والغير صحيحة والعديد من المعلومات من خلال التصور .

ثالثًا إعداد البيانات :

هذه الخطوة تعتبر اكثر الخطوات استغراقًا للوقت لذلك يجب الدقة فيها ، فمن خلال هذه الخطوة سوف نمر بمرحلتين

1- معالجة البيانات ( Data Wrangling ) : وهي مرحلة لمعالجة البيانات من خلال تنظيفها كالتعامل مع القيم المفقودة والمتكرره والمتطرفة والغير صحيحة أو التعامل معها بما يناسبها .

2- اختيار الميزه (Feature Selection ) : هذه المرحلة مهمه عند التنبأ حيثُ يتم فيها اختيار الفيتشرز (الأعمدة ) المناسبة بالعمود اللي راح اتنبأ من خلاله أو ما تسمى بالمدخلات .

اختيار الفيتشرز مع أنواع لغة الآلة

  • عند التعلم الغير الخاضع للإشراف عمود الهدف موجود ولكن نحتاج نحدد الاعمدة التي لها علاقة به فنستطيع تحديد العلاقة عن طريق (Correlation)

  • التعلم الخاضع للإشراف نستطيع إيجاد الفيتشرز عن طريق اربع طرق

  1. Filter methods 2. Wrapper methods
  2. Embedded methods 4. Hybrid methods

لمعرفة المزيد عن هذه التكنيكات feature selection

سوف نتوسع بتعلم الآلة وانواعه فيما بعد 🚏 .

رابعًا اختيار الخوارزمية:

يجب اختيار خوازمية مناسبة وملاءمة للنموذج

خامسًا التقييم :

عملية تقييم النموذج هي التي نستطيع من خلالها التأكد من دقة وكفاءة النموذج و إيجاد أفضل نموذج لتمثيل البيانات .

اخيرًا نشر النموذج :

عملية نحتاج فيها إلى التأكد من أننا اخترنا الحل المناسب بعد إجراء التقييم ليتم نشره .

 

✅ نعم قد تكون الرؤية غير واضحة بالنسبة للمبتدئين ولكن بعد ماتتعرفون على تحليل البيانات وتتعلمون التنبأ راح تكونون في حاجة للتطبيق على مشاريع فعشان كذا راح تكون هالخطوات مرجع لكم قبل ماتسوون أي بروجكت.

 

📈 🧹 5.1 Exploratory Data Analysis {EDA} AND Cleaning Data :

هنا تجدون مصادر لكيفية تنظيف البيانات واستكشافها

🦾5.2 Machine Learning :

.تعلم الآلة: هوأحد فروع الذكاء الاصطناعي المسوؤل عن جعل الآلة قادرة على التعلم من تلقاء نفسها بناءًا على خبراتها وتجاربها السابقة لتتنبأ وتتخذ القرار بصورة اسرع

1- Website

2- Online Courses on Platform and YouTube

3- Build a Machine-Learning-Model

🎙️ 5.3 Natural Language Processing (NLP) :

هو فرع من فروع الذكاء الاصطناعي حيثُ انه يمكّن أجهزة الكمبيوتر من فهم النص والكلمات المنطوقة بنفس الطريقة التي يتعامل بها البشر

 

هنا تجدون كل مايتعلق بمعالجة اللغة الطبيعية من شروحات وتمارين ومشاريع

1- Website:

2- Online Courses:

-Natural Language Processing -مبادئ معالجة اللغات الطبيعية nlp -ما هي المعالجة اللغوية الطبيعية nlp

🤖 5.4 Deep Learning

التعلم العميق هو مجموعة فرعية من التعلم الآلي الذي يعتمد على الشبكات العصبية الاصطناعية.

1- Website:

2- Online Courses on Platform and YouTube

🗝️ Treasure (محتويات ثرية)

Content Description
Over 150 of the Best DS Tutorials المقالة جميلة فيها كل التمارين سوءًا عن الاحصاء او تعلم الالة او التعلم العميق وغيرهم
BlobCity مستودع كبير لقوالب مشاريع مع اكوادها
مبادئ وتقنيات علم البيانات كتاب مبادئ وتقنيات علم البيانات في جامعة كاليفورنيا - بيركلي مترجم بواسطة أ.علي العوهلي
Best Online Courses موقع مرتب لك كل الكورسيز المتعلقة بعلم البيانات لكل المستويات
Machine Learning Package حساب بالقيت هب منزل شرح وتمارين لتعلم الالة
500 AI Machine learning Deep learning Computer vision NLP Projects with code هنا تحصلون مجموعة من مشاريع مع اكوادها
Reddit ( r/machine learningوش اللي تبي تبحث عنه مثلاً ) موقع ريديت يوفر لك مصادر لأي موضوع انت تبيه فقط ماعليك إلا تكتب بخانة البحث

💞 Support Resources :

مواقع توفر لك الفرصة في التواصل مع مبرمجين محترفين لو واجهتكم مشكلة معينة اثناء التعلم او التطبيق .

🎖️ Practice & Competitions:

لصقل مهاراتكم في علم البيانات وتحسينها هالمواقع راح تساعدكم في انكم تقدرون تشاركون في مسابقات وتحديات .

📑 Research Papers :

هنا تجدون افضل المواقع للأوراق البحثية المتعلقة بمجال علم البيانات

Social Media:

YouTube Channels:

محتوى عربي

محتوى انجليزي

Twitter:

Telgram Channels :

📻 Podcast :

📙Interview Resources:

🖼️ Data Science Infographic:

datascience-resources's People

Contributors

muniraalzhrani avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.