Improve Learning Algorithm
這個章節將介紹如何設計一個機器學習系統,以及如何評估演算法的準確度、防止 overfitting 以及如何利用大量資料來提升演算法的效能。為了解釋這些概念,我們將以一個垃圾郵件分類器為例,詳細解說如何收集資料、撰寫 algorithm 以及如何處理偏斜資料。
📄️ 1 - Advice for Applying ML
在機器學習中,評估學習演算法是非常重要的一個步驟。我們需要透過調整模型參數,和適當的測試方法來確保模型表現的穩定性。本文將介紹幾個常見的模型評估方法,以及對於避免 overfitting 的方法,例如 regularization 和 cross validation。
📄️ 2 - ML System Design
我們將從建立一個 Spam Classifier 了解設計機器學習系統所需要注意的事情。這個 Classifier 將會教我們如何收集資料、撰寫 algorithm 並如何處理偏斜資料,以及如何利用 precision 和 recall 的概念來評估機器學習系統的準確度。最後,我們也會了解到如何利用大量的資料來提升演算法的準確度。