Question 1

Datascience & Machine Learning With Python

Accepted Answer

Introduction to Data Science with Python

What is analytics & Data Science?
Common Terms in Analytics
Analytics vs. Data warehousing, OLAP, MIS Reporting
Relevance in industry and need of the hour
Types of problems and business objectives in various industries
How leading companies are harnessing the power of analytics?
Critical success drivers
Overview of analytics tools & their popularity
Analytics Methodology & problem solving framework
List of steps in Analytics projects
Identify the most appropriate solution design for the given problem statement
Project plan for Analytics project & key milestones based on effort estimates
Build Resource plan for analytics project

Python Essentials

Why Python for data science?
Overview of Python- Starting with Python
Introduction to installation of Python
Introduction to Python Editors & IDE’s(Canopy, pycharm, Jupyter, Rodeo, Ipython etc…)
Understand Jupyter notebook & Customize Settings
Concept of Packages/Libraries – Important packages(NumPy, SciPy, scikit-learn, Pandas, Matplotlib, etc)
Installing & loading Packages & Name Spaces
Data Types & Data objects/structures (strings, Tuples, Lists, Dictionaries)
List and Dictionary Comprehensions
Variable & Value Labels – Date & Time Values
Basic Operations – Mathematical – string – date
Reading and writing data
Simple plotting
Control flow & conditional statements
Debugging & Code profiling
How to create class and modules and how to call them?
Scientific Distributions Used In Python For Data Science
NumPy, pandas, scikit-learn, stat models, nltk

Accessing/Importing And Exporting Data Using Python Modules

Importing Data from various sources (Csv, txt, excel, access etc)
Database Input (Connecting to database)
Viewing Data objects – subsetting Data, methods
Exporting Data to various formats
Important python modules: Pandas, beautiful soup

Data Manipulation – Cleansing – Munging using python modules

Cleansing Data with Python
Data Manipulation steps(Sorting, filtering, duplicates, merging, appending, subsetting, derived variables, sampling, Data type conversions, renaming, formatting etc)
Data manipulation tools(Operators, Functions, Packages, control structures, Loops, arrays etc)
Python Built-in Functions (Text, numeric, date, utility functions)
Python User Defined Functions
Stripping out extraneous information
Normalizing data
Formatting data
Important Python modules for data manipulation (Pandas, Numpy, re, math, string, datetime etc)

Data Analysis – Visualization Using Python

Introduction exploratory data analysis
Descriptive statistics, Frequency Tables and summarization
Univariate Analysis (Distribution of data & Graphical Analysis)
Bivariate Analysis(Cross Tabs, Distributions & Relationships, Graphical Analysis)
Creating Graphs- Bar/pie/line chart/histogram/ boxplot/ scatter/ density etc)
Important Packages for Exploratory Analysis(NumPy Arrays, Matplotlib, seaborn, Pandas and SciPy. Stats etc)

Introduction to Statistics

Basic Statistics – Measures of Central Tendencies and Variance
Building blocks – Probability Distributions – Normal distribution – Central Limit Theorem
Inferential Statistics -Sampling – Concept of Hypothesis Testing Statistical Methods – Z/t-tests( One sample, independent, paired), Analysis of variance, Correlations and Chi-square
Important modules for statistical methods: NumPy, SciPy, Pandas

Introduction to Predictive Modelling

Concept of model in analytics and how it is used?
Common terminology used in analytics & Modelling process
Popular modelling algorithms
Types of Business problems – Mapping of Techniques
Different Phases of Predictive Modelling

Data Exploration For Modelling

Need for structured exploratory data
EDA framework for exploring the data and identifying any problems with the data (Data Audit Report)
Identify missing data
Identify outliers data
Visualize the data trends and patterns

Data Preparation

Need of Data preparation
Consolidation/Aggregation – Outlier treatment – Flat Liners – Missing values- Dummy creation – Variable Reduction
Variable Reduction Techniques – Factor & PCA Analysis

Segmentation: Solving Segmentation Problems

Introduction to Segmentation
Types of Segmentation (Subjective Vs Objective, Heuristic Vs. Statistical)
Heuristic Segmentation Techniques (Value Based, RFM Segmentation and Life Stage Segmentation)
Behavioural Segmentation Techniques (K-Means Cluster Analysis)
Cluster evaluation and profiling – Identify cluster characteristics
Interpretation of results – Implementation on new data

Linear Regression: Solving Regression Problems

Introduction – Applications
Assumptions of Linear Regression
Building Linear Regression Model
Understanding standard metrics (Variable significance, R-square/Adjusted R-square, Global hypothesis ,etc)
Assess the overall effectiveness of the model
Validation of Models (Re running Vs. Scoring)
Standard Business Outputs (Decile Analysis, Error distribution (histogram), Model equation, drivers etc.)
Interpretation of Results – Business Validation – Implementation on new data

Logistic Regression: Solving Classification Problems

Introduction – Applications
Linear Regression Vs. Logistic Regression Vs. Generalized Linear Models
Building Logistic Regression Model (Binary Logistic Model)
Understanding standard model metrics (Concordance, Variable significance, Hosmer Lemeshov Test, Gini, KS, Misclassification, ROC Curve etc)
Validation of Logistic Regression Models (Re running Vs. Scoring)
Standard Business Outputs (Decile Analysis, ROC Curve, Probability Cut-offs, Lift charts, Model equation, Drivers or variable importance, etc)
Interpretation of Results – Business Validation – Implementation on new data

Time Series Forecasting : Solving Forecasting Problems

Introduction – Applications
Time Series Components( Trend, Seasonality, Cyclicity and Level) and Decomposition
Classification of Techniques(Pattern based – Pattern less)
Basic Techniques – Averages, Smoothening, etc
Advanced Techniques – AR Models, ARIMA, etc
Understanding Forecasting Accuracy – MAPE, MAD, MSE, etc

Machine Learning : Predictive Modelling

Introduction to Machine Learning & Predictive Modelling
Types of Business problems – Mapping of Techniques – Regression vs. classification vs. segmentation vs. Forecasting
Major Classes of Learning Algorithms -Supervised vs Unsupervised Learning
Different Phases of Predictive Modelling (Data Pre-processing, Sampling, Model Building, Validation)
Overfitting (Bias-Variance Trade off) & Performance Metrics
Feature engineering & dimension reduction
Concept of optimization & cost function
Overview of gradient descent algorithm
Overview of Cross validation(Bootstrapping, K-Fold validation etc)
Model performance metrics (R-square, Adjusted R-square, RMSE, MAPE, AUC, ROC curve, recall, precision, sensitivity, specificity, confusion metrics )

Data Science Unsupervised Learning : Segmentation

What is segmentation & Role of ML in Segmentation?
Concept of Distance and related math background
K-Means Clustering
Expectation Maximization
Hierarchical Clustering
Spectral Clustering (DBSCAN)
Principle component Analysis (PCA)

Data Science Supervised Learning :- Decision Trees

Decision Trees – Introduction – Applications
Types of Decision Tree Algorithms
Construction of Decision Trees through Simplified Examples; Choosing the “Best” attribute at each Non-Leaf node; Entropy; Information Gain, Gini Index, Chi Square, Regression Trees
Generalizing Decision Trees; Information Content and Gain Ratio; Dealing with Numerical Variables; other Measures of Randomness
Pruning a Decision Tree; Cost as a consideration; Unwrapping Trees as Rules
Decision Trees – Validation
Overfitting – Best Practices to avoid

Supervised Learning :- Ensemble Learning

Concept of Ensembling
Manual Ensembling Vs. Automated Ensembling
Methods of Ensembling (Stacking, Mixture of Experts)
Bagging (Logic, Practical Applications)
Random forest (Logic, Practical Applications)
Boosting (Logic, Practical Applications)
Ada Boost
Gradient Boosting Machines (GBM)
XGBoost

Supervised Learning :- Artificial Neural Network – ANN

Motivation for Neural Networks and Its Applications
Perceptron and Single Layer Neural Network, and Hand Calculations
Learning In a Multi Layered Neural Net: Back Propagation and Conjugant Gradient Techniques
Neural Networks for Regression
Neural Networks for Classification
Interpretation of Outputs and Fine tune the models with hyper parameters
Validating ANN models

Supervised Learning :- Support Vector Machines

Motivation for Support Vector Machine & Applications
Support Vector Regression
Support vector classifier (Linear & Non-Linear)
Mathematical Intuition (Kernel Methods Revisited, Quadratic Optimization and Soft Constraints)
Interpretation of Outputs and Fine tune the models with hyper parameters
Validating SVM models

Supervised Learning :-KNN

What is KNN & Applications?
KNN for missing treatment
KNN For solving regression problems
KNN for solving classification problems
Validating KNN model
Model fine tuning with hyper parameters

Supervised Learning :- Naive Bayes

Concept of Conditional Probability
Bayes Theorem and Its Applications
Naïve Bayes for classification
Applications of Naïve Bayes in Classifications

Text Mining And Analytics

Taming big text, Unstructured vs. Semi-structured Data; Fundamentals of information retrieval, Properties of words; Creating Term-Document (TxD);Matrices; Similarity measures, Low-level processes (Sentence Splitting; Tokenization; Part-of-Speech Tagging; Stemming; Chunking)
Finding patterns in text: text mining, text as a graph
Natural Language processing (NLP)
Text Analytics – Sentiment Analysis using Python
Text Analytics – Word cloud analysis using Python
Text Analytics – Segmentation using K-Means/Hierarchical Clustering
Text Analytics – Classification (Spam/Not spam)
Applications of Social Media Analytics
Metrics(Measures Actions) in social media analytics
Examples & Actionable Insights using Social Media Analytics
Important python modules for Machine Learning (SciKit Learn, stats models, scipy, nltk etc)
Fine tuning the models using Hyper parameters, grid search, piping etc.

Question 2

Datascience Training With S-A-S Course Content

Accepted Answer

Introduction to Data Science with Python

What is analytics & Data Science?
Common Terms in Analytics
Analytics vs. Data warehousing, OLAP, MIS Reporting
Relevance in industry and need of the hour
Types of problems and business objectives in various industries
How leading companies are harnessing the power of analytics?
Critical success drivers
Overview of analytics tools & their popularity
Analytics Methodology & problem solving framework
List of steps in Analytics projects
Identify the most appropriate solution design for the given problem statement
Project plan for Analytics project & key milestones based on effort estimates
Build Resource plan for analytics project

Python Essentials

Why Python for data science?
Overview of Python- Starting with Python
Introduction to installation of Python
Introduction to Python Editors & IDE’s(Canopy, pycharm, Jupyter, Rodeo, Ipython etc…)
Understand Jupyter notebook & Customize Settings
Concept of Packages/Libraries – Important packages(NumPy, SciPy, scikit-learn, Pandas, Matplotlib, etc)
Installing & loading Packages & Name Spaces
Data Types & Data objects/structures (strings, Tuples, Lists, Dictionaries)
List and Dictionary Comprehensions
Variable & Value Labels – Date & Time Values
Basic Operations – Mathematical – string – date
Reading and writing data
Simple plotting
Control flow & conditional statements
Debugging & Code profiling
How to create class and modules and how to call them?
Scientific Distributions Used In Python For Data Science
NumPy, pandas, scikit-learn, stat models, nltk

Accessing/Importing And Exporting Data Using Python Modules

Importing Data from various sources (Csv, txt, excel, access etc)
Database Input (Connecting to database)
Viewing Data objects – subsetting Data, methods
Exporting Data to various formats
Important python modules: Pandas, beautiful soup

Data Manipulation – Cleansing – Munging using python modules

Cleansing Data with Python
Data Manipulation steps(Sorting, filtering, duplicates, merging, appending, subsetting, derived variables, sampling, Data type conversions, renaming, formatting etc)
Data manipulation tools(Operators, Functions, Packages, control structures, Loops, arrays etc)
Python Built-in Functions (Text, numeric, date, utility functions)
Python User Defined Functions
Stripping out extraneous information
Normalizing data
Formatting data
Important Python modules for data manipulation (Pandas, Numpy, re, math, string, datetime etc)

Data Analysis – Visualization Using Python

Introduction exploratory data analysis
Descriptive statistics, Frequency Tables and summarization
Univariate Analysis (Distribution of data & Graphical Analysis)
Bivariate Analysis(Cross Tabs, Distributions & Relationships, Graphical Analysis)
Creating Graphs- Bar/pie/line chart/histogram/ boxplot/ scatter/ density etc)
Important Packages for Exploratory Analysis(NumPy Arrays, Matplotlib, seaborn, Pandas and SciPy. Stats etc)

Introduction to Statistics

Basic Statistics – Measures of Central Tendencies and Variance
Building blocks – Probability Distributions – Normal distribution – Central Limit Theorem
Inferential Statistics -Sampling – Concept of Hypothesis Testing Statistical Methods – Z/t-tests( One sample, independent, paired), Analysis of variance, Correlations and Chi-square
Important modules for statistical methods: NumPy, SciPy, Pandas

Introduction to Predictive Modelling

Concept of model in analytics and how it is used?
Common terminology used in analytics & Modelling process
Popular modelling algorithms
Types of Business problems – Mapping of Techniques
Different Phases of Predictive Modelling

Data Exploration For Modelling

Need for structured exploratory data
EDA framework for exploring the data and identifying any problems with the data (Data Audit Report)
Identify missing data
Identify outliers data
Visualize the data trends and patterns

Data Preparation

Need of Data preparation
Consolidation/Aggregation – Outlier treatment – Flat Liners – Missing values- Dummy creation – Variable Reduction
Variable Reduction Techniques – Factor & PCA Analysis

Segmentation: Solving Segmentation Problems

Introduction to Segmentation
Types of Segmentation (Subjective Vs Objective, Heuristic Vs. Statistical)
Heuristic Segmentation Techniques (Value Based, RFM Segmentation and Life Stage Segmentation)
Behavioural Segmentation Techniques (K-Means Cluster Analysis)
Cluster evaluation and profiling – Identify cluster characteristics
Interpretation of results – Implementation on new data

Linear Regression: Solving Regression Problems

Introduction – Applications
Assumptions of Linear Regression
Building Linear Regression Model
Understanding standard metrics (Variable significance, R-square/Adjusted R-square, Global hypothesis ,etc)
Assess the overall effectiveness of the model
Validation of Models (Re running Vs. Scoring)
Standard Business Outputs (Decile Analysis, Error distribution (histogram), Model equation, drivers etc.)
Interpretation of Results – Business Validation – Implementation on new data

Logistic Regression : Solving Classification Problems

Introduction – Applications
Linear Regression Vs. Logistic Regression Vs. Generalized Linear Models
Building Logistic Regression Model (Binary Logistic Model)
Understanding standard model metrics (Concordance, Variable significance, Hosmer Lemeshov Test, Gini, KS, Misclassification, ROC Curve etc)
Validation of Logistic Regression Models (Re running Vs. Scoring)
Standard Business Outputs (Decile Analysis, ROC Curve, Probability Cut-offs, Lift charts, Model equation, Drivers or variable importance, etc)
Interpretation of Results – Business Validation – Implementation on new data

Time Series Forecasting : Solving Forecasting Problems

Introduction – Applications
Time Series Components( Trend, Seasonality, Cyclicity and Level) and Decomposition
Classification of Techniques(Pattern based – Pattern less)
Basic Techniques – Averages, Smoothening, etc
Advanced Techniques – AR Models, ARIMA, etc
Understanding Forecasting Accuracy – MAPE, MAD, MSE, etc

Machine Learning: Predictive Modelling

Introduction to Machine Learning & Predictive Modelling
Types of Business problems – Mapping of Techniques – Regression vs. classification vs. segmentation vs. Forecasting
Major Classes of Learning Algorithms -Supervised vs Unsupervised Learning
Different Phases of Predictive Modelling (Data Pre-processing, Sampling, Model Building, Validation)
Overfitting (Bias-Variance Trade off) & Performance Metrics
Feature engineering & dimension reduction
Concept of optimization & cost function
Overview of gradient descent algorithm
Overview of Cross validation(Bootstrapping, K-Fold validation etc)
Model performance metrics (R-square, Adjusted R-square, RMSE, MAPE, AUC, ROC curve, recall, precision, sensitivity, specificity, confusion metrics )

Data Science Unsupervised Learning : Segmentation

What is segmentation & Role of ML in Segmentation?
Concept of Distance and related math background
K-Means Clustering
Expectation Maximization
Hierarchical Clustering
Spectral Clustering (DBSCAN)
Principle component Analysis (PCA)

Data Science Supervised Learning :- Decision Trees

Decision Trees – Introduction – Applications
Types of Decision Tree Algorithms
Construction of Decision Trees through Simplified Examples; Choosing the “Best” attribute at each Non-Leaf node; Entropy; Information Gain, Gini Index, Chi Square, Regression Trees
Generalizing Decision Trees; Information Content and Gain Ratio; Dealing with Numerical Variables; other Measures of Randomness
Pruning a Decision Tree; Cost as a consideration; Unwrapping Trees as Rules
Decision Trees – Validation
Overfitting – Best Practices to avoid

Supervised Learning :- Ensemble Learning

Concept of Ensembling
Manual Ensembling Vs. Automated Ensembling
Methods of Ensembling (Stacking, Mixture of Experts)
Bagging (Logic, Practical Applications)
Random forest (Logic, Practical Applications)
Boosting (Logic, Practical Applications)
Ada Boost
Gradient Boosting Machines (GBM)
XGBoost

Supervised Learning :- Artificial Neural Network – ANN

Motivation for Neural Networks and Its Applications
Perceptron and Single Layer Neural Network, and Hand Calculations
Learning In a Multi Layered Neural Net: Back Propagation and Conjugant Gradient Techniques
Neural Networks for Regression
Neural Networks for Classification
Interpretation of Outputs and Fine tune the models with hyper parameters
Validating ANN models

Supervised Learning :- Support Vector Machines

Motivation for Support Vector Machine & Applications
Support Vector Regression
Support vector classifier (Linear & Non-Linear)
Mathematical Intuition (Kernel Methods Revisited, Quadratic Optimization and Soft Constraints)
Interpretation of Outputs and Fine tune the models with hyper parameters
Validating SVM models

Supervised Learning :-KNN

What is KNN & Applications?
KNN for missing treatment
KNN For solving regression problems
KNN for solving classification problems
Validating KNN model
Model fine tuning with hyper parameters

Supervised Learning :- Naive Bayes

Concept of Conditional Probability
Bayes Theorem and Its Applications
Naïve Bayes for classification
Applications of Naïve Bayes in Classifications

Text Mining And Analytics

Taming big text, Unstructured vs. Semi-structured Data; Fundamentals of information retrieval, Properties of words; Creating Term-Document (TxD);Matrices; Similarity measures, Low-level processes (Sentence Splitting; Tokenization; Part-of-Speech Tagging; Stemming; Chunking)
Finding patterns in text: text mining, text as a graph
Natural Language processing (NLP)
Text Analytics – Sentiment Analysis using Python
Text Analytics – Word cloud analysis using Python
Text Analytics – Segmentation using K-Means/Hierarchical Clustering
Text Analytics – Classification (Spam/Not spam)
Applications of Social Media Analytics
Metrics(Measures Actions) in social media analytics
Examples & Actionable Insights using Social Media Analytics
Important python modules for Machine Learning (SciKit Learn, stats models, scipy, nltk etc)
Fine tuning the models using Hyper parameters, grid search, piping etc.

Question 3

Supervised Learning: Ensemble Learning

Accepted Answer

Concept of Ensembling
Manual Ensembling Vs. Automated Ensembling
Methods of Ensembling (Stacking, Mixture of Experts)
Bagging (Logic, Practical Applications)
Random Forest (Logic, Practical Applications)
Boosting (Logic, Practical Applications)
Ada Boost
Gradient Boosting Machines (GBM)
XGBoost

Supervised Learning: Artificial Neural Networks (ANN)

Motivation for Neural Networks and Its Applications
Perceptron and Single Layer Neural Network, and Hand Calculations
Learning In a Multi Layered Neural Net: Back Propagation and Conjugant Gradient Techniques
Neural Networks for Regression
Neural Networks for Classification
Interpretation of Outputs and Fine tune the models with hyper parameters
Validating ANN models

Supervised Learning: Support Vector Machines

Motivation for Support Vector Machine & Applications
Support Vector Regression
Support vector classifier (Linear & Non-Linear)
Mathematical Intuition (Kernel Methods Revisited, Quadratic Optimization and Soft Constraints)
Interpretation of Outputs and Fine tune the models with hyper parameters
Validating SVM models

Supervised Learning: KNN

What is KNN & Applications?
KNN for missing treatment
KNN For solving regression problems
KNN for solving classification problems
Validating KNN model
Model fine tuning with hyper parameters

Supervised Learning: Naïve Bayes

Concept of Conditional Probability
Bayes Theorem and Its Applications
Naïve Bayes for classification
Applications of Naïve Bayes in Classifications

Text Mining & Analytics

Taming big text, Unstructured vs. Semi-structured Data; Fundamentals of information retrieval, Properties of words; Creating Term-Document (TxD);Matrices; Similarity measures, Low-level processes (Sentence Splitting; Tokenization; Part-of-Speech Tagging; Stemming; Chunking)
Finding patterns in text: text mining, text as a graph
Natural Language processing (NLP)
Text Analytics – Sentiment Analysis using R
Text Analytics – Word cloud analysis using R
Text Analytics – Segmentation using K-Means/Hierarchical Clustering
Text Analytics – Classification (Spam/Not spam)
Applications of Social Media Analytics
Metrics(Measures Actions) in social media analytics
Examples & Actionable Insights using Social Media Analytics
Important R packages for Machine Learning (caret, H2O, Randomforest, nnet, tm etc)
Fine tuning the models using Hyper parameters, grid search, piping etc.

Question 4

Advanced Big Datascience Course Content

Accepted Answer

Introduction To Data Science

What is Data Science?
Why Python for data science?
Relevance in industry and need of the hour
How leading companies are harnessing the power of Data Science with Python?
Different phases of a typical Analytics/Data Science projects and role of python
Anaconda vs. Python

Python Essentials (Core)

Overview of Python- Starting with Python
Introduction to installation of Python
Introduction to Python Editors & IDE’s(Canopy, pycharm, Jupyter, Rodeo, Ipython etc…)
Understand Jupyter notebook & Customize Settings
Concept of Packages/Libraries – Important packages(NumPy, SciPy, scikit-learn, Pandas, Matplotlib, etc)
Installing & loading Packages & Name Spaces
Data Types & Data objects/structures (strings, Tuples, Lists, Dictionaries)
List and Dictionary Comprehensions
Variable & Value Labels – Date & Time Values
Basic Operations – Mathematical – string – date
Reading and writing data
Simple plotting
Control flow & conditional statements
Debugging & Code profiling
How to create class and modules and how to call them?
Scientific distributions used in python for Data Science – Numpy, scify, pandas, scikitlearn, statmodels, nltk etc

Accessing/Importing And Exporting Data Using Python Modules

Importing Data from various sources (Csv, txt, excel, access etc)
Database Input (Connecting to database)
Viewing Data objects – subsetting, methods
Exporting Data to various formats
Important python modules: Pandas, beautifulsoup

Data Manipulation – Cleansing – Munging Using Python Modules

Cleansing Data with Python
Data Manipulation steps(Sorting, filtering, duplicates, merging, appending, subsetting, derived variables, sampling, Data type conversions, renaming, formatting etc)
Data manipulation tools(Operators, Functions, Packages, control structures, Loops, arrays etc)
Python Built-in Functions (Text, numeric, date, utility functions)
Python User Defined Functions
Stripping out extraneous information
Normalizing data
Formatting data
Important Python modules for data manipulation (Pandas, Numpy, re, math, string, datetime etc)

Data Analysis – Visualization Using Python

Introduction exploratory data analysis
Descriptive statistics, Frequency Tables and summarization
Univariate Analysis (Distribution of data & Graphical Analysis)
Bivariate Analysis(Cross Tabs, Distributions & Relationships, Graphical Analysis)
Creating Graphs- Bar/pie/line chart/histogram/ boxplot/ scatter/ density etc)
Important Packages for Exploratory Analysis(NumPy Arrays, Matplotlib, seaborn, Pandas and scipy.stats etc)

Basic Statistics & Implementation Of Stats Methods In Python

Basic Statistics – Measures of Central Tendencies and Variance
Building blocks – Probability Distributions – Normal distribution – Central Limit Theorem
Inferential Statistics -Sampling – Concept of Hypothesis Testing
Statistical Methods – Z/t-tests (One sample, independent, paired), Anova, Correlation and Chi-square
Important modules for statistical methods: Numpy, Scipy, Pandas

Python: Machine Learning -Predictive Modeling – Basics

Introduction to Machine Learning & Predictive Modeling
Types of Business problems – Mapping of Techniques – Regression vs. classification vs. segmentation vs. Forecasting
Major Classes of Learning Algorithms -Supervised vs Unsupervised Learning
Different Phases of Predictive Modeling (Data Pre-processing, Sampling, Model Building, Validation)
Overfitting (Bias-Variance Trade off) & Performance Metrics
Feature engineering & dimension reduction
Concept of optimization & cost function
Concept of gradient descent algorithm
Concept of Cross validation(Bootstrapping, K-Fold validation etc)
Model performance metrics (R-square, RMSE, MAPE, AUC, ROC curve, recall, precision, sensitivity, specificity, confusion metrics)

Machine Learning Algorithms & Applications – Implementation In Python

Linear & Logistic Regression
Segmentation – Cluster Analysis (K-Means)
Decision Trees (CART/CD 5.0)
Ensemble Learning (Random Forest, Bagging & boosting)
Artificial Neural Networks(ANN)
Support Vector Machines(SVM)
Other Techniques (KNN, Naïve Bayes, PCA)
Introduction to Text Mining using NLTK
Introduction to Time Series Forecasting (Decomposition & ARIMA)
Important python modules for Machine Learning (SciKit Learn, stats models, scipy, nltk etc)
Fine tuning the models using Hyper parameters, grid search, piping etc.
Project – Consolidate Learnings
Applying different algorithms to solve the business problems and bench mark the results

Introduction To Big Data

Introduction and Relevance
Uses of Big Data analytics in various industries like Telecom, E- commerce, Finance and Insurance etc.
Problems with Traditional Large-Scale Systems

Hadoop(Big Data) Eco-System

Motivation for Hadoop
Different types of projects by Apache
Role of projects in the Hadoop Ecosystem
Key technology foundations required for Big Data
Limitations and Solutions of existing Data Analytics Architecture
Comparison of traditional data management systems with Big Data management systems
Evaluate key framework requirements for Big Data analytics
Hadoop Ecosystem & Hadoop 2.x core components
Explain the relevance of real-time data
Explain how to use Big Data and real-time data as a Business planning tool

Hadoop Cluster-Architecture-Configuration Files

Hadoop Master-Slave Architecture
The Hadoop Distributed File System – Concept of data storage
Explain different types of cluster setups(Fully distributed/Pseudo etc)
Hadoop cluster set up – Installation
Hadoop 2.x Cluster Architecture
A Typical enterprise cluster – Hadoop Cluster Modes
Understanding cluster management tools like Cloudera manager/Apache ambari

Hadoop-HDFS & MapReduce (YARN)

HDFS Overview & Data storage in HDFS
Get the data into Hadoop from local machine(Data Loading Techniques) – vice versa
Map Reduce Overview (Traditional way Vs. MapReduce way)
Concept of Mapper & Reducer
Understanding MapReduce program Framework
Develop MapReduce Program using Java (Basic)
Develop MapReduce program with streaming API) (Basic)

Data Integration Using Sqoop & Flume

Integrating Hadoop into an Existing Enterprise
Loading Data from an RDBMS into HDFS by Using Sqoop
Managing Real-Time Data Using Flume
Accessing HDFS from Legacy Systems

Data Analysis Using Pig

Introduction to Data Analysis Tools
Apache PIG – MapReduce Vs Pig, Pig Use Cases
PIG’s Data Model
PIG Streaming
Pig Latin Program & Execution
Pig Latin : Relational Operators, File Loaders, Group Operator, COGROUP Operator, Joins and COGROUP, Union, Diagnostic Operators, Pig UDF
Writing JAVA UDF’s
Embedded PIG in JAVA
PIG Macros
Parameter Substitution
Use Pig to automate the design and implementation of MapReduce applications
Use Pig to apply structure to unstructured Big Data

Data Analysis Using Hive

Apache Hive – Hive Vs. PIG – Hive Use Cases
Discuss the Hive data storage principle
Explain the File formats and Records formats supported by the Hive environment
Perform operations with data in Hive
Hive QL: Joining Tables, Dynamic Partitioning, Custom Map/Reduce Scripts
Hive Script, Hive UDF
Hive Persistence formats
Loading data in Hive – Methods
Serialization & Deserialization
Handling Text data using Hive
Integrating external BI tools with Hadoop Hive

Data Analysis Using Impala

Impala & Architecture
How Impala executes Queries and its importance
Hive vs. PIG vs. Impala
Extending Impala with User Defined functions

Introduction To Other Ecosystem Tools

NoSQL database – Hbase
Introduction Oozie

Spark: Introduction

Introduction to Apache Spark
Streaming Data Vs. In Memory Data
Map Reduce Vs. Spark
Modes of Spark
Spark Installation Demo
Overview of Spark on a cluster
Spark Standalone Cluster

Spark: Spark In Practice

Invoking Spark Shell
Creating the Spark Context
Loading a File in Shell
Performing Some Basic Operations on Files in Spark Shell
Caching Overview
Distributed Persistence
Spark Streaming Overview(Example: Streaming Word Count)

Spark: Spark Meets Hive

Analyze Hive and Spark SQL Architecture
Analyze Spark SQL
Context in Spark SQL
Implement a sample example for Spark SQL
Integrating hive and Spark SQL
Support for JSON and Parquet File Formats Implement Data Visualization in Spark
Loading of Data
Hive Queries through Spark
Performance Tuning Tips in Spark
Shared Variables: Broadcast Variables & Accumulators

Spark Streaming

Extract and analyze the data from twitter using Spark streaming
Comparison of Spark and Storm – Overview

Spark GraphX

Overview of GraphX module in spark
Creating graphs with GraphX

Introduction To Machine Learning Using Spark

Understand Ma achine learning framework
Implement some of the ML algorithms using Spark MLLib

Question 5

Datascience With R Course Content

Accepted Answer

What is analytics & Data Science?
Common Terms in Analytics
Analytics vs. Data warehousing, OLAP, MIS Reporting
Relevance in industry and need of the hour
Types of problems and business objectives in various industries
How leading companies are harnessing the power of analytics?
Critical success drivers
Overview of analytics tools & their popularity
Analytics Methodology & problem solving framework
List of steps in Analytics projects
Identify the most appropriate solution design for the given problem statement
Project plan for Analytics project & key milestones based on effort estimates
Build Resource plan for analytics project
Why R for data science?

Data Importing / Exporting

Introduction R/R-Studio – GUI
Concept of Packages – Useful Packages (Base & Other packages)
Data Structure & Data Types (Vectors, Matrices, factors, Data frames, and Lists)
Importing Data from various sources (txt, dlm, excel, sas7bdata, db, etc.)
Database Input (Connecting to database)
Exporting Data to various formats)
Viewing Data (Viewing partial data and full data)
Variable & Value Labels – Date Values

Data Manipulation

Data Manipulation steps
Creating New Variables (calculations & Binning)
Dummy variable creation
Applying transformations
Handling duplicates
Handling missings
Sorting and Filtering
Subsetting (Rows/Columns)
Appending (Row appending/column appending)
Merging/Joining (Left, right, inner, full, outer etc)
Data type conversions
Renaming
Formatting
Reshaping data
Sampling
Data manipulation tools
Operators
Functions
Packages
Control Structures (if, if else)
Loops (Conditional, iterative loops, apply functions)
Arrays
R Built-in Functions (Text, Numeric, Date, utility)
Numerical Functions
Text Functions
Date Functions
Utilities Functions
R User Defined Functions
R Packages for data manipulation (base, dplyr, plyr, data.table, reshape, car, sqldf, etc)

Data Analysis – Visualization

Introduction to exploratory data analysis
Descriptive statistics, Frequency Tables and summarization
Univariate Analysis (Distribution of data & Graphical Analysis)
Bivariate Analysis(Cross Tabs, Distributions & Relationships, Graphical Analysis)
Creating Graphs- Bar/pie/line chart/histogram/boxplot/scatter/density etc)
R Packages for Exploratory Data Analysis(dplyr, plyr, gmodes, car, vcd, Hmisc, psych, doby etc)
R Packages for Graphical Analysis (base, ggplot, lattice,etc)

Introduction To Statistics

Basic Statistics – Measures of Central Tendencies and Variance
Building blocks – Probability Distributions – Normal distribution – Central Limit Theorem
Inferential Statistics -Sampling – Concept of Hypothesis Testing
Statistical Methods – Z/t-tests( One sample, independent, paired), Anova, Correlations and Chi-square

Predictive Modelling

Concept of model in analytics and how it is used?
Common terminology used in analytics & modelling process
Popular modelling algorithms
Types of Business problems – Mapping of Techniques
Different Phases of Predictive Modelling

Data Exploration For Modeling

Data Preparation

Need of Data preparation
Consolidation/Aggregation – Outlier treatment – Flat Liners – Missing values- Dummy creation – Variable Reduction
Variable Reduction Techniques – Factor & PCA Analysis

Segmentation: Solving Segmentation Problems

Introduction to Segmentation
Types of Segmentation (Subjective Vs Objective, Heuristic Vs. Statistical)
Heuristic Segmentation Techniques (Value Based, RFM Segmentation and Life Stage Segmentation)
Behavioral Segmentation Techniques (K-Means Cluster Analysis)
Cluster evaluation and profiling – Identify cluster characteristics
Interpretation of results – Implementation on new data

Linear Regression: Solving Regression Problems

Introduction – Applications
Assumptions of Linear Regression
Building Linear Regression Model
Understanding standard metrics (Variable significance, R-square/Adjusted R-square, Global hypothesis ,etc)
Assess the overall effectiveness of the model
Validation of Models (Re running Vs. Scoring)
Standard Business Outputs (Decile Analysis, Error distribution (histogram), Model equation, drivers etc.)
Interpretation of Results – Business Validation – Implementation on new data

Question 6

Logistic Regression: Solving Classification Problems

Accepted Answer

Introduction – Applications
Linear Regression Vs. Logistic Regression Vs. Generalized Linear Models
Building Logistic Regression Model (Binary Logistic Model)
Understanding standard model metrics (Concordance, Variable significance, Hosmer Lemeshov Test, Gini, KS, Misclassification, ROC Curve etc)
Validation of Logistic Regression Models (Re running Vs. Scoring)
Standard Business Outputs (Decile Analysis, ROC Curve, Probability Cut-offs, Lift charts, Model equation, Drivers or variable importance, etc)
Interpretation of Results – Business Validation – Implementation on new data

Time Series Forecasting: Solving Forecasting Problems

Introduction – Applications
Time Series Components( Trend, Seasonality, Cyclicity and Level) and Decomposition
Classification of Techniques(Pattern based – Pattern less)
Basic Techniques – Averages, Smoothening, etc
Advanced Techniques – AR Models, ARIMA, etc
Understanding Forecasting Accuracy – MAPE, MAD, MSE, etc

Question 7

Machine Learning - Predictive Modelling - Basics

Accepted Answer

Introduction to Machine Learning & Predictive Modeling
Types of Business problems – Mapping of Techniques – Regression vs. classification vs. segmentation vs. Forecasting
Major Classes of Learning Algorithms -Supervised vs Unsupervised Learning
Different Phases of Predictive Modeling (Data Pre-processing, Sampling, Model Building, Validation)
Overfitting (Bias-Variance Trade off) & Performance Metrics
Feature engineering & dimension reduction
Concept of optimization & cost function
Overview of gradient descent algorithm
Overview of Cross validation(Bootstrapping, K-Fold validation etc)
Model performance metrics (R-square, Adjusted R-squre, RMSE, MAPE, AUC, ROC curve, recall, precision, sensitivity, specificity, confusion metrics )

Data Science and Data Analytics

Google Reviews

JustDial Reviews

The Syllabus

Enquire Now

Why Radical Technologies

Live Online Training

Live Classroom Training

Self Paced Training

Skills Covered

User Interface & Navigation

Building Information Modeling (BIM

Design Development

3D Modeling & Visualization

Annotation & Documentation

Project Management

Sustainability

Revit MEP Interface

System Design

Family Creation

Coordination & Collaboration

Annotation & Detailing

Analysis & Simulation

Project Workflow Management

BIM Integration

tool covered

Why Revit MEP ?

In-Demand Skills

Career Opportunities

Cloud Adoption

Scalability and Flexibility

Cost Management

Security and Compliance

Course benefits

Accurate Documentation

Clash Detection and Coordination

Industry Relevance

Time-Saving Automation

Sustainability and Energy Analysis

Career Opportunities

Software Proficiency Certification

Integration with Other Software

Cost Estimation and Control

Scalability

Increased Job Market Demand

Hands-On Experience

Enhanced Design Efficiency

Improved Collaboration

3D Visualization Skills

Who Can Apply for Red Hat Linux

Why Revit MEP ?

Scalability

Flexibility

Hybrid Capabilities

Security and Compliance

Cost-Effectiveness

Innovation

Like the Curriculum ? Let's Get Started

Global Certification

Online Classroom PREFERRED

Discount Voucher

"Register Now to Secure Your Spot in Our Featured Course !"

BOOK HERE

career services

Red Hat Linux Course Projects

Radical Learning Eco-System

Exam simulator

Cloud Send Borey

Hands - on Cloud Lab

Developer Coding Ground

Testimonials

Our Alumni

Revit MEP FAQs

Revit MEP Course in Other Cities

Online Batches Available for the Areas

Revit MEP Interview Questions

What are the primary benefits of using Revit MEP in Building Information Modeling (BIM) compared to traditional CAD tools?

Can you explain the workflow for designing an HVAC system in Revit MEP, including load calculations and duct placement?

How do you perform clash detection in Revit MEP, and what steps do you take to resolve detected conflicts?

Describe the process of creating custom parametric components (families) in Revit MEP and provide an example of their practical use.