深度學習必備手冊(下)
更多深度文章,請關注雲計算頻道:https://yq.aliyun.com/cloud
深度學習的概念源於人工神經網絡的研究,如果追溯深度學習的概念還是要回到2006年Hinton那篇論文,基於深信度網(DNB)提出非監督貪心逐層訓練算法,未解決深層結構相關的優化難題出現的論文。
其實,對於我們人類而言,很多事情都是經過大腦的深層處理模式的解決的,筆者認為,在未來廣度學習一定是深度學習的一個沿伸,為什麼?因為人類最顯著的特征並不是深度學習,而是廣度學習。所謂的廣度學習是建立在一係列深度學習的基礎上的,廣度學習通俗的說法既是聯想能力。
聯想能力對於人類來說是非常重要的能力,一個領域的解決方法擴展到另外一個領域這種思維方式,在我們人類來說是非常普遍的。但是,對於技術來說,這些能力還需要很長的路來走,起碼一點,就是深度學習必須達到非常高的程度。因為之後這樣深度學習才能真正的應用於強人工智能,強人工智能要求的就是人工智能具有聯想能力,一旦強人工智能具備了強人工智能的基礎,那麼強人工智能一定會從夢想成為現實。
深度學習實戰篇:
1. 間諜衛星的基礎?YOLT——利用卷積神經網絡對衛星影像進行多尺度目標檢測
摘要:利用卷積神經網絡(CNN)對衛星影像進行多尺度目標檢測,該文是在YOLO模型的基礎上改進提出YOLT模型,該方法極大的提高了背景區分,並能夠在不同尺度和多個傳感器上快速檢測出物體。
摘要:Yann Lecun曾將無監督學習比作蛋糕,將監督學習比作蛋糕上的糖霜,聲稱我們僅懂得如何做糖霜卻不知道怎樣才能做出蛋糕。在本篇文章中,我們提供了一份訓練無監督學習算法的“蛋糕”配方,用來增強衛星圖像。
3.日常新聞能用來精準預測股市動向嗎?這篇聚焦開放數據的訪談或能給你答案
摘要:日常新聞標題能用來精準地預測股市動向嗎?在本次聚焦開放數據欄目中,Jiahao談論了作為一名教師在Kaggle開放數據分析平台上共享數據集的理由,迄今為止Kaggle用戶實現的一些重大的基準預測,以及他對基於新聞標題實現交易算法的可行性的看法。
摘要:神經網絡是機器學習中的熱門話題。但是網絡上有關LSTM在時間序列上的應用卻很少,我們不妨透過本文來開拓LSTM的應用視野。
摘要:如今,Twitter、Tumblr和Facebook等社交網站深受互聯網用戶歡迎。在這些熱門網站上,每天都有數以百萬的消息產生。這些消息的作者記錄自己的生活,分享對不同話題的看法,並討論當前的問題。此類網站已經成為人們評論與情感信息的寶貴來源,這樣的數據能夠有效地用於營銷或社交研究。
6. 一次神經網絡的探索之旅-基於Tensorflow的路標識別
摘要:是否覺得理論的神經網絡有點抽象呢?是否想知道神經網絡具體是怎麼應用呢?本文將一步一步引領你完成一個基於TensorFlow的交通路標識別項目。還等什麼呢,快來看看吧。
摘要:在你的工作時間,有沒有上網瀏覽一些與你工作無關的網站呢?每當這種時候,如果我發現老板不知何時已經站在我背後時,我會感到非常尷尬。當然,我可以迅速地切換屏幕,但這種行為實在是太可疑了,更何況有時我都不會注意到他已經在那了。所以,為了解決這個問題,我創建了一個使用Keras的係統,它能自動識別我
8. GitHub網站究竟可不可靠?穀歌工程師教你用BigQuery一探究竟
摘要:GitHub的可靠性有沒有達到SLA的要求?網站近期的SLO又如何?有了GitHub的網站日誌以及BigQuery工具的幫助,我們可以更加深入地定義並度量這些指標。在本篇文章中,作者結合Github公開的部分數據,使用BigQuery以及一係列數據可視化方法對Github網站的可靠性展開了分析。
摘要:根據代碼識別編程語言的源代碼分類器將是一個非常有用的工具,因為它可用於在線自動語法高亮和標簽建議,比如可用在StackOverflow和技術維基網站上。這個想法促使我們根據最新的AI技術編寫一個對代碼片段依據編程語言進行分類的模型。
摘要:本文介紹了仿射變換和雙線性插值在圖片變換中的應用。
11.DeepTraffic: 如何讓MIT的遊戲利用深度學習來減少交通阻塞
摘要:大家都對交通阻塞深惡痛絕。除了讓人頭疼和錯過約會之外,交通擁堵讓美國的司機每年多花3000億美元。研究人員建議大家使用自動駕駛汽車,即使數量占比並不大,但也能大大改善交通擁堵情況。 Lex Fridman和他的MIT團隊開發了一款模擬遊戲來加速實現這個未來。
12. 私人定製——使用深度學習Keras和TensorFlow打造一款音樂推薦係統
摘要:還在為蝦米音樂等APP的精準推送感到驚奇嘛?快來瞅瞅,自己也可以私人定製一個音樂推薦係統啦。本文利用深度學習打造一個音樂推薦係統,處理起來不是很複雜,主要是先收集音樂製作成一個音樂庫,然後對音樂進行處理轉換成相關的頻譜圖,不同類型的音樂對應不同的頻譜圖,之後利用這些頻譜圖訓練搭建的卷積神經網絡模型,以此實現後續的音樂推薦。
摘要:我們可以創建一個能夠對交通標誌進行分類的模型,並且讓模型自己學習識別這些交通標誌中最關鍵的特征。在這篇文章中,我將演示如何創建一個深度學習架構,這個架構在交通標誌測試集上的識別準確率達到了98%。
摘要:學了那麼多深度學習的基本知識,還在發愁沒有地方展示自己學過的知識?來試試這個簡單的實際問題吧!
摘要:本文探討的是開發一個能夠對心髒磁共振成像(MRI)數據集圖像中的右心室自動分割的係統。到目前為止,這主要是通過經典的圖像處理方法來處理的。而現代深度學習技術有可能提供更可靠、更自動化的解決方案。
16. 對象跟蹤小白?本文帶你玩轉OpenCV(C ++ / Python)
摘要:本文中我們將學習OpenCV 3.0中引入的OpenCV跟蹤API,以及學習OpenCV 3.2中提供的6種不同的跟蹤器。
摘要:OCR也算是計算機視覺的一部分,今天我們來介紹一下如何使用(opencv/python)來實現OCR處理銀行票據。
深度學習雜談篇:
1. 深度學習都需要了解什麼?無從下手的話,可以看看這份深度學習速查表
摘要:本文介紹了一些深度學習中的常見概念,如梯度、後向傳播、ReLU、Dropout、交叉熵與softmax等,以幫助大家快速了解深度學習。
2. 最前沿:圖文結合詳解深度學習Memory & Attention
摘要:該文獻主要介紹深度學習網絡中語音、文字以及圖片這塊中的典型神經網絡,重點介紹Memory與Attention的發展前沿,分析了幾個詳細的典型模型,說明Memory與Attention在文字、語音以及圖片相關應用中的重要性。
摘要:本文簡單介紹了 Goodfellow 所著的《深度學習》的主要內容,非常透徹地分析了該書的優缺點以及適用群體。想學習深度學習麼?快來看看吧。
摘要:本文是一篇關於深度學習的入門筆記,簡單的介紹了神經網絡的結構,包含輸入層、隱藏層以及輸出層;介紹了前向傳播過程以及反饋傳播過程。深度學習的優點在於其能夠將複雜的模式分解成一係列更簡單的模式,缺點是訓練所花費的時間以及受到計算機運算能力的限製等。
摘要:本文是一篇關於深度學習的入門筆記,簡單的介紹了幾種神經網絡的基本結構以及原理,包含受限玻爾茲曼機、卷積神經網絡、循環神經網絡等;介紹他們的訓練的基本過程,並說明各自應用領域,適合深度學習研究者的入門理解。
摘要:本文描寫了百度矽穀人工智能實驗室在深度學習框架中引入HPC技術的實踐,通過對OpenMPI裏ring all-reduce算法進行改進,使語音識別訓練模型的性能得到數十倍的提升,最後百度開源了其實現,希望更多的人受益。
7. Top 100論文導讀:純幹貨!深度神經網絡中的理解,泛化以及遷移學習
摘要:作者從目前熱門的top 100 優秀深度學習論文中選取第一組論文為大家進行純幹貨總結,該組包含6篇論文,主要講解使用可視化技術分析深度神經網絡DNNs(大多是卷積神經網絡CNNs)學習的東西,泛化性以及遷移學習。
摘要:本文介紹了關於對抗樣本的7篇文獻,解釋了對抗樣本的產生及攻擊原理,對深層神經網絡會有什麼影響等。結果表明,即使是訓練得非常好的神經網絡在對抗樣本前會顯得那麼脆弱,不過我們可以通過利用對抗樣本進行對抗訓練以提高模型的努棒性。
摘要:線性代數在深度學習領域有著舉足輕重的作用,它是深度學習各種算法的基本數學工具。本文作者對深度學習中會用到的一些線性代數的基本概念和運算操作進行了介紹,希望能讓有興趣的同學一起來進行學習。
摘要:在深度學習過程中,你或許會碰到一般近似定理:僅含有一層的前饋網絡足以有效地表示任何函數,但是這樣的網絡結構可能會格外龐大,進而無法正確的學習和泛化。這是一個令人驚奇的觀點。如果你可以接受大多數種類的問題都可以約化成函數,那麼這句話就是說,神經網絡可以在理論上解決任何問題。
摘要:隨機性在深度學習中有多麼重要?這篇文章或許能給你答案。
12. 大神帶你分分鍾超越最好結果——基於分布式CPU計算的Deeplearning4j遷移學習應用實例
摘要:本文通過應用開源工具Apache Spack、Apache Hadoop和Deeplearning4j以分布式CPU運算完成VGG16模型遷移學習的應用,在Caltech-256數據集上實現了最好結果。
摘要:文章簡要概述了一個深度學習的開源庫,文末有這個開源庫的地址。
摘要:世界上沒有完美無缺的技術,深度學習也是如此。本文著重向我們介紹了深度學習發展的六大障礙!
摘要:任何技術的入門都是第一隻出現的攔路虎,對於初學者來說,工具的安裝著實讓人頭疼。本文作者介紹如何使用Ubuntu入門深度學習的教程,Python版。
深度學習競賽篇:
摘要:數據科學競賽平台Kaggle將舉辦一場為期五個月的AI競賽,這場競賽將展示未來網絡安全和網絡戰爭的樣子,而戰爭中的攻守雙方都是AI算法,它們將互相迷惑互相欺騙,以研究如何加強機器學習係統來抵禦未來可能出現的攻擊。
摘要:本文總結由Marios Michailidis(a.k.a Kazanova),Kaggle Grandmaster在2016年3月5日現在排名第3位的在線研討會上分享的技巧,更好地在機器學習競賽中取勝
摘要:本文總結由Marios Michailidis(a.k.a Kazanova),Kaggle Grandmaster在2016年3月5日現在排名第3位的在線研討會上分享的技巧,更好地在機器學習競賽中取勝
4:5個步驟 & 7個提示 | 一份開啟Kaggle競賽征途的初學者指南
摘要:本文是關於Kaggle數據科學競賽平台的初學者指南,總結出五個步驟和七個提示。其中五步驟介紹了由淺入深地慢慢適應Kaggle競賽,七個提示讓初學者能夠享受在Kaggle平台上的一切。最後強調,通過Kaggle平台著重鍛煉提示自己的職業技能,而不是看中競賽的獎金。
5.Kaggle首席技術官發布——(Kaggle)NIPS 2017對抗學習挑戰賽起步指南
摘要:本文是一個入門介紹,由Kaggle首席技術官Ben簡單介紹以下2017年的NIPS 對抗學習競賽數據的處理,用一個具體的代碼實例介紹了如何生成目標對抗圖像與非目標對抗圖像,將對抗圖像送入原先的分類器中,可以看到結果與原圖大相徑庭。
摘要:正則表達式被用來定義文本的格式,而深度學習則被廣泛應用在語音識別,機器翻譯,計算機視覺等方麵。當它們結合起來,會迸發出怎樣的火花呢?
摘要:梯度提升方法(Gradient Boosting)在眾多機器學習競賽中有著廣泛的應用。本文介紹了梯度提升的基本概念,並結合實例討論了梯度提升方法在實踐中應用。
摘要:針對Kaggle保險索賠競賽給定的數據集,本文詳細介紹了如何利用python對數據集進行分析並對特種進行預處理操作。以保險索賠競賽案例和詳細的操作步驟,生動形象的講解了自動預測保險索賠的算法流程。
摘要:本文介紹了深受Kaggle數據分析競賽參賽者歡迎的一個梯度提升算法實現-XGBoost,在分類算法中,XGBoost以速度製勝,精度與Sci-Kit Learn相當,在Kaggle競賽中打敗了AdaBoost(自適應提升算法)和RandomForest(隨機森林算法)。
10. 幹貨|大神教你如何參加kaggle比賽——根據CT掃描圖預測肺癌
摘要:本文介紹Deep Breath團隊在kaggle競賽上取得第九名使用的方法,主要包括數據處理以及相關針對數據處理的不同網絡架構的搭建,最後說明了kaggle競賽的一些注意事項。
最後更新:2017-10-05 00:03:10