14 Important Data Science Skills to Acquire – 資料科學必備 14 大技能
1️⃣ Machine Learning(機器學習)
核心內容:
- Supervised Learning(監督式學習)
- Classification(分類)
- Regression(迴歸)
- Unsupervised Learning(非監督式學習)
- Clustering(分群)
- Dimensionality Reduction(降維)
- Model Explainability(模型可解釋性)
常見技術 / 工具:
- XGBoost
- SVM
- Random Forest
- GLM
- K-Means
- UMAP
- LIME(Local Interpretable Model Explanation)
2️⃣ Data Visualization(資料視覺化)
目標:將數據變成可理解的圖表
- Static Visualization(靜態圖)
- Interactive Visualization(互動圖)
常用工具:
- ggplot2
- plotly
3️⃣ Data Wrangling & Cleaning(資料整理與清理)
資料科學最花時間的部分之一。
必備操作:
- Outliers(離群值處理)
- Missing Data(缺失值補齊)
- Reshaping(資料轉換)
- Aggregation(彙總)
- Filtering / Selecting(篩選)
常用套件:
- dplyr
- tidyr
4️⃣ Data Preprocessing & Feature Engineering
(資料前處理與特徵工程)
內容:
- Preparing data for ML(模型前處理)
- Feature Engineering(特徵建構)
- 日期特徵
- 文字特徵
- 聚合特徵
工具:
- recipes package
5️⃣ Time Series Analysis(時間序列分析)
適用於金融、IoT、銷售、氣象等資料。
技能重點:
- Date/Datetime handling
- Time aggregation
- Time transformation
- Time series visualization
套件:
- timetk
6️⃣ Forecasting(預測建模)
時間序列的進階應用。
常見模型:
- ARIMA
- Exponential Smoothing
- Prophet
ML Forecasting:
- XGBoost
- Random Forest
- GLMnet
Deep Learning:
- GluonTS
進階能力:
- Ensemble Models(集成)
- Hyperparameter tuning(參數調整)
- Scaling to thousands of forecasts(大規模預測)
套件:
- modeltime
7️⃣ Text(文字資料處理)
核心能力:
- Text preprocessing
- Tokenization
- String manipulation
工具:
- stringr
8️⃣ NLP(自然語言處理)
建立在文字資料之上。
技能:
- Text Features extraction(文字特徵)
- Machine learning for language tasks
應用:情感分析、聊天機器人、文件分類
9️⃣ Functional Programming(函數式程式設計)
提升程式可重用性與整潔度。
- Writing reusable functions
- Sourcing code modules
🔟 Iteration(迭代與映射)
避免大量 for-loop,提升資料流程效率。
- Loops
- Mapping
工具:
- purrr package
1️⃣1️⃣ Reporting(報告與輸出)
資料分析的成果呈現能力。
格式:
- RMarkdown
- Interactive HTML Reports
- Static PDF Reports
1️⃣2️⃣ Applications(資料應用系統開發)
資料科學不只是模型,還要能做成產品。
技能:
- Shiny Web Apps
- Dashboards
- Bootstrap UI
1️⃣3️⃣ Deployment(部署與上線)
模型要能在真實環境運作。
核心工具:
- Cloud Platforms:AWS / Azure / GCP
- Docker
- Git
1️⃣4️⃣ Databases(資料庫)
資料來源與儲存的基本功。
- SQL(資料查詢與匯入)
- MongoDB(非結構化資料,App 常用)
✅ 總結:資料科學技能全景圖
| 階段 | 技能模組 |
|---|---|
| 資料準備 | Cleaning、Wrangling、Preprocessing |
| 建模分析 | Machine Learning、Forecasting、NLP |
| 視覺呈現 | Visualization、Reporting |
| 系統應用 | Applications、Deployment |
| 基礎支撐 | Databases、Functional Programming |
「資料科學實務導向課程」:
- 前 6 週:資料整理 + 視覺化
- 中段:機器學習 + 時間序列
- 後段:部署 + 應用系統(Shiny/Dashboard)
學生成就感:不只是跑模型,而是做出完整作品!

