AI大事件 | Geoffrey Hinton決定拋棄反向傳播,預期策略梯度算法
嗚啦啦啦啦啦大家好呀,又到了本周的AI大事件時間了。過去的一周中AI圈都發生了什麼?大佬們互撕了哪些問題?研究者們發布了哪些值得一讀的論文?又有哪些開源的代碼和數據庫可以使用了?文摘菌帶你盤點過去一周AI大事件!
了解過去一周AI爆點,一篇就夠啦!
新聞
Geoffrey Hinton決定拋棄反向傳播
來源:WWW.AXIOS.COM
鏈接:https://www.axios.com/ai-pioneer-advocates-starting-over-2485537027.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
現在幾乎所有神經網絡都會經過反向傳播的訓練。然而在最近的一次采訪中,Hinton,深度學習之父卻表示,他將“拋開一切重新開始”。要想在深度學習上向前推進,就必須發明全新的方法。
Facebook人工智能研究登陸蒙特利爾
來源:NEWSROOM.FB.COM
鏈接:https://newsroom.fb.com/news/2017/09/fair-montreal/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
作為Facebook的人工智能研究的一部分(FAIR),這個新的團隊將由超過100名來自門洛帕克、紐約和巴黎的科學家組成,他們將努力推進人工智能領域的研究。
蒙特利爾實驗室將對AI領域進行廣泛的研究,但它也將特別關注強化學習和對話係統。
Sophia Genetics籌集了3000萬美元幫助醫生使用人工智能和基因組數據進行診斷
來源:VENTUREBEAT.COM
鏈接:https://venturebeat.com/2017/09/13/sophia-genetics-raises-30-million-to-help-doctors-diagnose-using-ai-and-genomic-data-analysis/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
9月13日消息,瑞士醫療數據分析公司Sophia Genetics宣布完成3000萬美元D輪融資,Balderton Capital領投,Alychlo、Invoke Capital Partners、360 Capital Partners等跟投。
Sophia Genetics成立於2011年,是一家遺傳信息數據分析公司,專注於通過人工智能找出患者基因突變原理,並結合專家意見提供個性化的治療診斷方案。
文章&教程
學習其他代理想法的模型(OpenAI)
來源:BLOG.OPENAI.COM
鏈接:https://blog.openai.com/learning-to-model-other-minds/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一種算法,它解釋了其他代理也在學習的事實,並在迭代囚徒困境中發現了類似於針鋒相對的合作策略。
AI健身房
來源:LEARNINGAI.IO
鏈接:https://learningai.io/projects/2017/07/28/ai-gym-workout.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一個易於理解的近端策略優化( Proximal Policy Optimization)的介紹(PPO)並且能夠很好的應對MuJoCo 和 RoboSchool 的環境。點擊這裏查看代碼:https://github.com/pat-coady/trpo
使用強化學習達到最優化
來源:BAIR.BERKELEY.EDU
鏈接:https://bair.berkeley.edu/blog/2017/09/12/learning-to-optimize-with-rl/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
機器學習的算法仍然是人工設計的。這就引出了一個自然的問題:我們可以學習這些算法嗎?
項目&數據
使用TensorBoard API完成自定義可視化
來源:RESEARCH.GOOGLEBLOG.COM
鏈接:https://research.googleblog.com/2017/09/build-your-own-machine-learning.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
為了讓學習者能夠使用新的和有用的可視化進行創作,穀歌公布了一組API,允許開發人員添加自定義的可視化插件到TensorBoard。
膨脹殘留網絡(Dilated Residual Network)的實現
來源:GITHUB.COM
鏈接:https://github.com/fyu/drn?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
基於膨脹卷積的多元內容集成和膨脹殘留網絡的官方PyTorch實現。
對TensorFlow數據集和估計機製(Estimators)的介紹
來源:DEVELOPERS.GOOGLEBLOG.COM
鏈接:https://developers.googleblog.com/2017/09/introducing-tensorflow-datasets.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
TensorFlow 1.3介紹了兩個重要的特點:數據集和估計機製。這篇文章顯示了他們如何適應TensorFlow架構。
數據集 | 一萬本最受歡迎的書:一萬本書,六百萬次閱讀
來源:GITHUB.COM
鏈接:https://github.com/zygmuntz/goodbooks-10k?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
該數據集包含了goodreads.com上一萬本最受歡迎的書,其中最受歡迎的被閱讀了六百萬次。
爆款論文
針對工程師的機器學習簡介
來源:ARXIV.ORG
鏈接:https://arxiv.org/abs/1709.02840?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一個200頁的“簡短”的介紹。這項工作旨在介紹機器學習中的關鍵概念、算法和理論框架,包括監督和無監督學習、統計學習理論、概率圖形模型和近似推理。
把所有東西都嵌入進去!
來源:ARXIV.ORG
鏈接:https://arxiv.org/abs/1709.03856?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一個通用的神經嵌入模型,可以解決各種各樣的問題:標簽型任務,如文本分類;排序型任務,如信息檢索、網絡搜索、基於協同過濾和基於內容的推薦;多關係圖的嵌入,並能夠實現單詞、句子或文檔級的嵌入。在每種情況下,模型都是通過嵌入由離散特征組成的實體來實現的,並將對它們進行比較——學習依賴於任務的相似性。
預期策略梯度算法
來源:ARXIV.ORG
鏈接:https://arxiv.org/abs/1706.05374?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
預期策略梯度算法(EPG:Expected policy gradients)使強化學習中的隨機策略梯度算法(SPG: stochastic policy gradients )和確定性策略梯度算法(DPG: deterministic policy gradients )達成了一致。這一算法的靈感來自於預期的SARSA算法,EPG在估計梯度的時候整合了整個操作,而不是僅僅依賴於采樣軌跡。
原文發布時間為:2017-09-19
編譯 | 寧雲州
本文來自雲棲社區合作夥伴“大數據文摘”,了解相關信息可以關注“大數據文摘”微信公眾號
最後更新:2017-09-20 10:03:37