開發者入門必讀:最值得看的十大機器學習公開課

張貼日期:Jan 15, 2017 7:28:34 AM

導語:入門機器學習不知道從哪著手?看這篇就夠了。

在當下的機器學習熱潮,人才匱乏十分顯著。截至目前,國內開設人工智能(AI)專業的高校不多,相當多的開發者是跨界入門,需要自學大量知識並摸索。因而優質的學習資源至關重要。因此,我們蒐集了全世界範圍內最受歡迎的機器學習課程,整理成這份“機器學習十大入門公開課”盤點,集中呈現給各位。這份推薦榜頗費心血,綜合考慮了難易、側重點、時效性等諸多因素,希望能幫助大家找到最適合自己的學習資源。

這些課程全部免費開放,但有些需翻牆,有的缺少中文字幕。

1. 吳恩達“機器學習”公開課

課程名稱:機器學習Machine Learning

主講人:吳恩達Andrew Ng

授課機構:斯坦福大學

發布平台:Coursera

語言:英語,漢語字幕

網址:https://www.coursera.org/learn/machine-learning

無論國內國外,這是最火的機器學習入門課程,沒有之一。無數新手都是通過這門課對機器學習初窺門徑。吳恩達老師用極其清楚直白的語言,對機器學習的幾種主要算法做了初步介紹。

這門課最大的特點,是它側重於概念理解而不是數學。數學推導過程基本被略過,重點放在讓初學者理解這背後的思路。另外,它還十分重視聯繫實際和經驗總結:1.課程中吳恩達老師列舉了許多算法實際應用的例子2.他提到當年他們入門AI時面臨的許多問題,以及處理這些難題的經驗。

課程中代碼教程使用的是Octave/MATLAB,因此不需要會Python、C語言,適合沒有編程基礎的新手。

總結起來,這門課對數學、統計、IT基礎薄弱的童鞋十分友好。其實很多機器學習入門課,都是假定學生已修完這一門,於是重點對其進行補充——講解這門課程中吳恩達老師未涉及、或是涉及不深的話題。因此,對於機器學習“一張白紙”的童鞋,我們強烈推薦從這門課起步,然後選擇其他入門課程進階,以在腦海中建立起更全面的知識體系。另外,Coursera上這門課的論壇十分活躍,不管拋出什麼問題都會有人解答,算是一個額外的好處。

彩蛋:網易公開課上有吳恩達老師在斯坦福授課的實錄視頻。內容比較深入,但時間比較久了,可作為進階姊妹篇。地址:http://open.163.com/special/opencourse/machinelearning.html

2. 加州理工“從數據中學習”

課程名稱:Learning from Data,網易公開課譯名為“加州理工學院公開課:機器學習與數據挖掘”

主講人:Yaser Abu-Mostafa

授課機構:加州理工學院

發布平台:edX(原版),網易公開課

語言:英語,網易有漢語字幕

網址:https://www.edx.org/course/caltechx/caltechx-cs1156x-learning-data-2516 ,edX;

http://open.163.com/special/opencourse/learningfromdata.html,網易。

這同樣是一門機器學習的入門課,但並不簡單。該課程強調數據,是因為機器學習與各領域的大數據處理應用(比如金融、醫療)聯繫十分緊密。這門課內容涵蓋基礎理論、算法和應用,平衡了理論與實踐,既覆蓋數學統計,也包含啟發式的概念理解。

課程結構是這樣的:

什麼是學習?

機器能學習嗎?

怎麼做到?

怎麼做好?

經驗教訓。

不少人評論該課程結構就像講故事,它有助於學習者形成對機器學習概念和模型深度、直覺性的理解。學習者公認它內容非常充實,但對作業模塊的爭議很大:有人認為難度偏高並且缺乏反饋,有人認為它是網上能找到的、最好的機器學習練習。

彩蛋:Yaser Abu-Mostafa 出版了同名著作《Learning From Data》,可作為該課程的教材和補充。

3. Tom Mitchell 機器學習課程

課程名稱:機器學習Machine Learning

主講人:Tom Mitchell

授課機構:卡內基梅隆大學(CMU)

發布平台:CMU 官網

語言:英語

網址:http://www.csNaNu.edu/~tom/10701_sp11/

這門課是學界人士的最愛,是入門課程之中較全面、高階的一門。課時為15週,遠超大多數機器學習慕課。其覆蓋的話題非常廣,按先後次序包括:代數和概率論,機器學習的基礎工具,概率圖模型,AI,神經網絡,主動學習,增強學習。課程內容和練習十分簡潔明白,概念解釋清楚到位。

Tom Mitchell是AI領域德高望重的老牌宗師,他的《Machine Learning》 (中文版為《計算機科學叢書:機器學習》),是最經典的機器學習教科書之一。但因為時間久遠,涉及的一些概念與今天的開發者並沒有太大關聯,更適合需要了解人工智能來龍去脈的大學師生。這門課程與之類似,能幫助學習者理清機器學習的發展脈絡。它適合計劃進行系統性學習、投入大量時間的人。

對於初學者,建議至少聽完吳恩達的機器學習課程之後,再修這一門。

4. 台大林軒田老師的機器學習基石

課程名稱:機器學習基石

主講人:林軒田

授課機構:台灣大學

發布平台:Coursera

語言:漢語

這是為漢語學子量身定做的入門課,相當於台灣大學機器學習課程前半學期的課,教給大家的是機器學習最核心的知識。林老師是教科書《Learning From Data》的作者之一,是華人機器學習領域年輕有為的青年學者。這門課程十分用心細緻,內容比吳恩達老師的入門課程稍稍充實一些。

林老師表示,針對頂級機器學習公開課全是英語授課的現狀,不少學生反映英語教學有不易吸收之處。因此,借推出這門課程,希望幫助漢語為母語的學生減少入門難度。

針對如何讓學生接受枯燥的算法,林老師說道:

“我們的課程設計中,大家會看到我們把對算法與數學式的推導,以'解決問題'的過程方式呈現。也就是說,我們對算法的介紹是環繞著'為什麼'出發的,當同學們腦中有'為什麼'的時候,就有目標去理解這些算法與數學式的內容了。”

《Learning From Data》也可作為這門課的教科書。學習Yaser Abu-Mostafa的課程有不解之處,可與這門課互相印證。

目前該課程已在Coursera下架,何時重開尚屬未知。好在網易公開課、YouTube倒是有全套視頻,地址是:http://c.open.163.com/coursera/courseIntro.htm?cid=938以及https://www.youtube.com/playlist?list=PLXVfgk9fNX2I7tB6oIINGBmW50rrmFTqf。更多課程資料可從台大官網找到(網頁為英語)http://www.csie.ntu.edu.tw/~htlin/mooc/

彩蛋:台大2015 年機器學習課程的大綱以及學習資料(PPT):https://www.csie.ntu.edu.tw/~htlin/course/ml15fall/,可作為補充。順便提一句,林老師把台大後半學期的課程開成另一門Coursera 課程“機器學習技巧”,作為進階。目前Coursera 也已撤下。網易公開課地址為http://c.open.163.com/coursera/courseIntro.htm?cid=1664

5. 谷歌人工智能入門

課程名稱:人工智能入門 Intro to ArtificialIntelligence

主講人:Peter Norvig,Sebastian Thrun

授課機構:谷歌

發布平台:優達學城Udacity

語言:英語,漢語字幕

網址:https://cn.udacity.com/course/intro-to-artificial-intelligence--cs271

該課程久享盛名,是AI 入門最好的公開課之一(注:有人認為可以去掉“之一”)。

嚴格來說,它並不是一門機器學習課程。但其中有一周的主題是機器學習,它還介紹了另外幾個AI主要領域:概率推理、信息檢索、機器人學、自然語言處理等。鑑於學習機器學習的童鞋,幾乎都會對AI這個大學科有興趣—— 這門課程便是探索機器學習周邊與交叉領域的絕好機會。

兩位主講者,Peter Norvig 和Sebastian Thrun,一個是谷歌研究總監,一個是斯坦福著名機器學習教授,均是與吳恩達、Yann Lecun 同級別的頂級AI 專家。

需要強調的是,該課程傾向於介紹AI的實際應用。課程練習廣受好評。

6. UBC 本科生的機器學習課程

課程名稱:面向本科生的機器學習課Machine Learning forUndergraduates

主講人: Nando de Freitas

授課機構:英屬哥倫比亞大學(UBC)

發布平台:Youtube

語言:英語

網址:https://www.youtube.com/playlist?list=PLE6Wd9FR--Ecf_5nCbnSQMHqORpiChfJf

Nando de Freitas是機器學習領域非常傑出的學者。他的這門課很適合作為吳恩達老師“機器學習”的進階課程,因為:1. “機器學習”省略掉的一些概念,可以在這門課中找到。2. “機器學習”課不重視數學,而數學是這門課的重點內容。Nando de Freitas對諸如概率論、log likelihood等基礎數學原理做了很好的講解,並以此為基礎介紹更高級的數學、統計概念。

對於機器學習新手,完全略過數學細節是很危險的,這門課會幫助你打下基礎。

但是,它錄製於2012 年,時間也比較久了。因此,雷鋒網特意奉上彩蛋一枚。

彩蛋:Nando de Freitas 2013年轉入牛津大學任教。這是他2014-2015學年在牛津的全套深度學習課程,包括視頻、PPT以及練習:https://www.cs.ox.ac.uk/people/nando.defreitas/machinelearning/(視頻保存在Youtube,需翻牆)。

7. Yann Lecun 深度學習公開課

課程名稱:深度學習Deep Learning

主講人:Yann Lecun

授課機構:法蘭西學院

發布平台:法蘭西學院官網

語言:法語,英語字幕

網址:https://www.college-de-france.fr/site/en-yann-lecun/course-2016-04-15-11h00.htm

Yann Lecun 在2016 年初於法蘭西學院開課,這是其中關於深度學習的8 堂課。當時是用法語授課,後來加入了英文字幕。

作為人工智能領域大牛和Facebook AI實驗室(FAIR)的負責人,Yann Lecun身處業內機器學習研究的最前沿。他曾經公開表示,現有的一些機器學習公開課內容已經有些過時。通過Yann Lecun的課程能了解到近幾年深度學習研究的最新進展。該系列可作為探索深度學習的進階課程。

8.Geoffrey Hinton 深度學習課程

課程名稱:神經網絡用於機器學習Neural Networks For MachineLearning;網易譯名“神經網絡的機器學習”

主講人:Geoffrey Hinton

授課機構:多倫多大學

發布平台:Coursera、網易公開課

語言:英語,漢語字幕

網址:https://www.coursera.org/learn/neural-networks,Coursera;

http://c.open.163.com/coursera/courseIntro.htm?cid=77,網易

深度學習必修課程,講師為該領域的一代宗師Geoffrey Hinton。

這門課程聚焦於神經網絡和深度學習,是深入了解該領域最好的課程之一(注:很多人認為可以去掉“之一”)。

課程官方介紹:

“(你會在這門課)學習人工神經網絡以及它們如何應用於機器學習,比方說語音、物體識別,圖像分割(image segmentation),建模語言、人體運動等等。我們同時強調基礎算法,以及對它們成功應用所需的實用技巧。”

這門課錄製於2013-2013,時效性上不如Yann Lecun 的法蘭西學院公開課,建議兩者結合。另外,它要求微積分、Python 基礎,涉及許多專有名詞,對初學者難度較大,需自己查找相關資料。

9. 哥倫比亞大學的機器學習公開課

課程名稱:機器學習Machine Learning

主講人:John W. Paisley

授課機構:哥倫比亞大學

發布平台:edX

語言:英語

網址:https://www.edx.org/course/machine-learning-columbiax-csmm-102x

在這份大牛雲集的榜單中,該課程的主講者——哥倫比亞大學副教授John Paisley,只是一名相對普通的青年學者。但是,這門課程將於兩天后,也就是2017年1月16日首次開課。這使它成為時下最新的機器學習入門課程。要知道,近一兩年來人工智能和機器學習的發展完全可以用“日新月異”來形容——湧現的新方法、新理論,即便是一流專家也有目不暇接之感。換句換說,三、四年前的課程,可能現在有許多內容已經過時了。

這是Yann LeCun 提醒大家注意學習資源時效性的原因所在。

可惜許多一流的機器學習公開課,距離錄製都有些久了。我們知道一堂公開課背後所耗費的巨大人力。因此,對於部分課程在近兩三年並沒有更新的事實,倒也不能去怪主講者和平台。但這使得比較新、時效性較強的課程格外可貴。

這門課中,學習者會了解到機器學習的算法、模型和方法,以及它們在現實生活中的應用。

由於是首次開課,尚沒有對該課程的反饋。但鑑於哥倫比亞大學的研究、教學實力,課程品質應當值得期待。

10. MIT 進階課程

開發者入門必讀:最值得看的十大機器學習公開課

課程名稱:機器學習Machine Learning

主講人:Tommi Jaakkola

授課機構:麻省理工學院(MIT)

發布平台:MIT Opencourseware

語言:英語

網址:https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-867-machine-learning-fall-2006/index.htm

這是一門研究生水平的機器學習課程,難度較高。可惜的是,MIT並沒有提供課程視頻,而是以參考書目和課堂筆記的形式,讓我們得以一窺該課程的內容。小編認為,這些學習資源的價值仍舊不可估量。因為如此,相比常規公開課,它不會耗費過多時間,非常適合有一定基礎的學習者印證自己所學。

小結

這就是我們為您盤點的十大最有價值的機器學習入門公開課。這些課程有淺有深,分別對機器學習不同領域、方面有所側重。各位童鞋可根據自己所需,自行選擇最適合自己的課程。不過,小編必須提醒各位,所有盤點都不可避免得摻雜了主觀因素。雖然我們已盡力按照課程質量與業內人士的評價來製定該推薦榜,但自知無法做到十足的公正客觀。比方說,該榜單傾向於機器學習的“入門”,而非開發者進階;傾向於概念、算法學習,而非實戰技巧(比如Python教程);傾向於把全世界範圍內最好的課程推薦給諸君,而對英語基礎較差的學習者照顧不足。榜單之外尚有許多有價值、適應不同層次人士需求的公開課。因此,我們特意列舉了幾個比較好的系統性機器學習課程以及學習平台,彌補該榜單不足,以供參考。

友情提醒,以下包含收費課程。

系統性課程:

優達學城(Udacity)提供的的“機器學習工程師”納米學位,中文字幕,谷歌、滴滴參與授課,收費。

https://cn.udacity.com/course/machine-learning-engineer-nanodegree--nd009

華盛頓大學的“機器學習專業”系列課程,Coursera 平台,收費,共六門課。

https://www.coursera.org/specializations/machine-learning

約翰·霍普金斯大學的“數據科學專業”系列課程,Coursera 平台,收費,共十門課。

https://www.coursera.org/specializations/jhu-data-science

密歇根大學的“Python 的應用數據科學專業”系列課程,Coursera 平台,收費,共五門課。適合需要學習Python 實戰技巧的機器學習開發者。

https://www.coursera.org/specializations/data-science-python

平台推薦:

國外的Coursera、edX、優達學城(Udacity)、Udemy;國內的網易公開課、七月在線都集中了相對優質的學習資源。當然,英語不錯的童鞋推薦國外學習網站,尤其它們的問答論壇非常有幫助。

對於英語基礎不是那麼好的童鞋,Coursera 和優達學城很重視中國市場,它們的大部分機器學習資源都添加了漢語字幕。對於edX 和可汗學院的部分課程,網易公開課有字幕翻譯。

對於需要在數學、統計方面補課的童鞋,除了以上幾個平台之外,強烈推薦可汗學院KhanAcademy,它的數學課非常有名,連比爾·蓋茨都推薦給他子女,很適合從零起步打基礎。

來源:

http://www.leiphone.com/news/201701/0milWCyQO4ZbBvuW.html

台灣最大人工智能、深度學習與GPU議題社團,採實名制,歡迎申請加入

https://www.facebook.com/groups/marketing.gpu