Biology
To know about Biology, it's important to have a good understanding of General Science, Chemistry, Physics, Statistics, and Math.
To know about Biology, it's important to have a good understanding of General Science, Chemistry, Physics, Statistics, and Math.
這是成功大學資訊工程學系高宏宇教授所開的資料探勘的課程筆記。
這個筆記對應 Coursera 系列課程 Deep Learning。 課程主要由 Andrew Ng 教授主講,是一個非常好的深度學習課程。
這個章節會介紹 Neural Network 的概念,並且深入探討為什麼 Deep Learning 正在如此火熱,以及他可以應用在那些資料上。Deep Learning 的應用不只是限於 Structured Data,也可以應用在 Audio、Image 以及 Raw Text 這些 Unstructured Data 上。因此,Deep Learning 可以更有效的分析資料,並得到更加准確的結果。另外, Deep Learning 還受益於三個方面:資料、運算以及演算法。由於資料的數量不斷增加,傳統的學習演算法已經無法能夠滿足應用的需求,而 Deep Learning 則可以透過不斷的擴大網路架構及資料來提升效能。同時,硬體的發展也讓 Deep Learning 的應用可以更加廣泛。
機器學習是一門技術,可以讓電腦自動學習、改善和自我改進,讓電腦獲得知識,而不需要明確的程式指示。它涉及到兩種不同的學習:監督式學習和無監督式學習。在監督式學習中,我們會將問題與正確答案一起提供給程式,以便找出兩者之間的關係。可以分為回歸問題和分類問題。而在無監督學習中,不需要知道資料中每個問題對應的解答為何,而是由程式從資料中找出 pattern 和結構,方法通常為利用資料中的變數關係進行分群演算法(clustering algorithm),以及 Non-clustering algorithm,也就是 Cocktail Party Algorithm。
神經網路是為了模擬人類的大腦運作,大腦可以透過一種 learning algorithm 做到聽、說、讀、寫等活動,而神經網路的最小單位為神經元,它可以由 input wires 接收多個輸入,並將處理過的訊息傳送出去透過 output wires。我們可以再加上 bias unit 作為輸入,而處理這些 input 的為 sigmoid (logistic) activation function。當有多層 layer 時,第一層為 input layer,最後一層為 output layer,而中間所有的層統稱為 hidden layer。我們給予 hidden layer 的 nodes 一個名字:activation units,它是經由 input 和 matrix of weights 作用 output 過來的,hypothesis 就是這些 activation units 經由權重矩陣與輸入矩陣相乘後的結果。
這個章節我們會介紹線性回歸,線性回歸是一個非常簡單的機器學習模型,但是它的應用卻非常廣泛,例如:股票預測、房價預測、銷售預測等等,因此線性回歸是一個非常重要的機器學習模型。
Classification 是一個將問題分成兩個類別或以上的問題,而 Logistic Regression 是一種用來解決 Binary Classification 的機器學習模型。它使用 Sigmoid Function 來預測 Positive Class 的機率,並將 Decision Boundary 的間隔值設定為 0.5,以便更好的分辨 0/1。
這個筆記對應 Coursera 課程 Machine Learning。 課程由 Andrew Ng 教授主講,是一個非常好的機器學習入門課程。
在《Neural Networks and Deep Learning》中,我們將學習深度學習的基礎:瞭解深度學習的主流技術、能夠構建、訓練和應用 fully-connected 的深度神經網路 (DNN)、瞭解如何實現向量化神經網路以及了解神經網路架構的關鍵參數,這也是深度學習必修的第一堂課!
系統性筆記可以更容易地掌握、理解和應用網路上的資源,使學習更有效率且更全面,提供對有興趣的人更好的學習經驗並獲得更多更深入的知識。