機器學習能為你的業務做什麼?有些事情你肯定猜不到!
每一個產品經理、企業家或商業領袖都應該讓自己的項目或企業在機器學習方麵加速發展。如果你還沒有建立起下一個代的聊天室或自動駕駛汽車,那麼你需要加快引入機器學習的進度,以保持較強的競爭力。有一個好消息,對於機器學習,你無需自己發明,隻需利用現成的就可以了。一些技術公司已經提供了開源的工具和平台(Amazon AI,TensorFlow, 和許多其他工具),使得任何公司在今天都可以使用機器學習。
當我初次踏入機器學習門檻的時候,我對此幾乎一無所知,但是在很短的時間裏,我就能以機器學習為技術核心指揮產品的開發了(就像這個)。本文的目標是讓你充分了解開發機器學習產品的技術和流程,讓你快速入門。 這是一個循序漸進的教程,它能讓你成為一名能夠利用機器學習實現業務目標的產品經理。
機器學習是一項令人難以置信的技術,你需要了解很多很多的基礎知識,以使得業務功能盡可能的不受複雜算法的影響,讓你能夠提出正確的問題、了解機器學習模型開發過程、成立一個團隊以促進學科間的不斷合作,而不是把數據科學視為一個產生奇跡的黑匣子。
本教程包含六個部分:
1. 機器學習能為你的業務做什麼
2. 關於機器學習算法你需要了解什麼關心什麼
3. 開發機器學習模型全過程
4. 機器學習產品團隊的角色、技能和組織結構
5. 機器學習就是一個用戶體驗問題
6. 產品經理應該注意的工程問題
下麵我們將開始第一部分:機器學習可以為你的業務做什麼。
投身到機器學習的大潮中去,就像十年前投身到移動技術中一樣,它能讓你實現業務轉型
通過查詢已有的數據來獲得見解是一個眾所周知且廣泛適用的方法。機器學習是數據分析方麵的下一個前沿領域。計算機程序首先從眾多數據中分析識別出一定的模式,然後根據該模式進行預測或得出見解,同時,通過以往的經驗可以對這些見解進行改進。在這整個過程中,無需有人去明確地告訴計算機該如何做。由於機構組織可以獲得更多的數據,所以他們能夠通過機器學習技術從大規模的數據中獲取見解,粒度級別從單個用戶的交互到全球趨勢以及它們對地球的影響。使用這些見解還可用於定製個人用戶之間細微差別的使用體驗,也可用於創造新的產品尋找新的商機。請注意,要利用機器學習,不僅要使用內部數據,還要將外部數據與內部數據相結合,以增強機器學習的功能,從而推動以前無法實現的新見解的實現。
來自於A16Z這個頂級風投公司的Frank Chen對人工智能的潛在應用做了一個很好的介紹,而其中有許多應用需要利用機器學習技術來實現。這些應用程序中有一些是未來的,用現有的技術暫時無法實現,但仍具有無限的可能。
就像消費者行業在8-10年前投身到移動設備那樣,現在是公司探索機器學習技術來幫助推動商業成果發展的時候了。針對那些專注於利用現有機器學習技術的公司,下麵羅列了幾個機器學習的關鍵用途。這裏講得比較簡單,相互之間也並不是互斥的,而是從不同角度對業務潛在影響的思考:
定製化的用戶環境、使用體驗和係統響應。想象一下,人們所做的或看到的一切都可以進行特別的定製,甚至可以預見用戶的需求和行為。這包括針對產品或服務的推薦,按照相關度進行排列;根據用戶的知識、行為、喜歡他們的人或外部數據來定製用戶體驗或流程,包括預測他們下一步要做什麼。在較小的範圍內,這可以轉化為針對某個用戶群體而不是單個人的體驗進行定製化。
視覺識別物體的能力,並據此實現自動化或定製使用體驗。當今的技術可以識別照片和視頻中的對象,包括識別攝像頭中的實時視頻。Pinterest(一款圖片app,堪稱圖片版的Twitter)使用這項技術來推薦與用戶當前正在看的照片相似或者互補的照片;Facebook使用臉部識別技術在照片中標記並推薦朋友;亞馬遜正在建立基於對象視覺識別的自動存儲檢測係統。
內容的自動檢索、生成或處理。 利用機器學習可以很方便地處理世界上大批量的內容。其常見用途是文件檢索,例如,查找與法律案件相關的所有文件(請注意,這不僅僅是根據關鍵字到上下文中搜索)、按主題和關鍵字對文檔進行分類、自動對內容提取摘要,從大量內容中提取相關信息,例如,在供應商合同中查找某個具體的條款等等。這裏的“內容”適用於所有類型的媒體,而不僅僅是文本。
一定規模的預測、估計和趨勢。 在以前,進行預測需要有高水平的專業知識,不僅昂貴,而且難以實現。而機器學習對預測來說非常有用,它可以實現一些人類無法實現的功能。例如,機器可以識別數據潛在的變化趨勢。
檢測異常活動或係統故障。每個係統都會發生錯誤出現問題,而機器學習不僅能幫你檢測是否出現了問題,還能告訴你這些問題是否是不尋常的,並且及時告警。這在各種監控安全軟件中特別有用。
從戰略的角度來看,機器學習可以促使出現這幾種商業成果:
為你的客戶增強體驗和功能。最常見的案例是大規模的定製化,即更快更準確的找出與你的客戶最相關的產品,例如約會網站上的最佳匹配、音樂網站上可能喜歡的歌曲、購物網站上可能感興趣的商品。另一個案例則是通過預測來獲取以前得不到的情報, 例如Zillow對房地產的估價,又或者是針對個人客戶的定製化服務,例如根據用戶特定的口味對用戶還沒有看的電影進行評分。
內部功能、流程和業務邏輯。機器學習可以節省你的時間,使你的資源投入在業務流程和決策方麵更有效。例如:借貸公司希望優先考慮潛在借貸人。它需要確定誰想要一筆貸款,如果提供的話,對方是否能夠到期償還。優先考慮信譽最高的客戶不一定是借貸公司想要的答案,因為這些客戶通常有很多選擇,所以需要一個更複雜的模型。
擴展到新的領域和新的產品。數據可以幫助你開辟全新的商機,為現有客戶創建全新的產品,或為你之前從未服務過的細分市場或客戶提供服務。例如,Netflix可以為不是核心目標受眾的電影工作室提供服務,向他們出售有關哪些觀眾喜歡哪些主題或者情節的數據;Zillow可以幫助房地產開發商了解哪些建築功能可以得到最高的投資回報,等等。
首先針對哪個領域,應取決於潛在的商業影響、問題的複雜性以及實現這一影響的成本。
“我們需要用數據來做某事”是一個策略,而不是數據科學,或是一個問題
許多公司正在招聘能夠構建機器學習模型的數據科學家,因為“我們應該用數據來做某事”。我聽說過許多知名公司的高管都說“我們看到競爭對手購買了數據,所以我們也需要這樣做才能保持競爭力”,然後他們聘請了幾位數據科學家,希望能看到一些驚喜。這讓我對機器學習產生了很大的誤解。
機器學習並不是你生意上的魔法棒。在利用機器學習的過程中,遇到第一個挑戰是弄清楚由技術驅動的業務影響。機器學習是一種解決方案,你需要首先定義問題:您希望用機器學習實現的業務結果是什麼?機器學習能為你的客戶帶來什麼好處? 機器學習是一把錘子,但是如果你沒有釘子,錘子並沒有什麼用處。引申一下,機器學習是一套各不相同的錘子,你所選擇的釘子將決定你該選擇哪個錘子以及如何使用它。你要解決的問題決定了所有一切:結果該如何使用、你的模型能預測出什麼結果以及如何校準、應該收集和處理什麼樣的數據,該使用怎麼樣的測試算法以及許多其他問題。
其核心“我們要解決什麼問題?”是一個商業問題,這意味著最終確定這個問題答案的是產品經理和業務主管而不是數據科學家的。數據科學家和其他利益相關者應該也參與進來,隻是不要把問題拋給他們,期望他們來回答這個問題。如果你有數據,但你不知道該怎麼用這些數據,請與客戶進行交流。數據科學家可以幫你探索數據,但他們很難提出自己的商業案例。為了最大限度地發揮機器學習的商業價值,你需要讓產品經理和數據科學家之間互相協作,產品經理有責任確保解決的問題能對業務產生最大的影響。
解密機器學習如何推動你的業務向前發展的
雖然機器學習有著無限的可能,但對於技術是如何應用於團隊這個問題,你可能會有幾個疑問想弄清楚。這裏有幾個例子:
內部流程
公司人員今天用於決策的知識哪些可以自動化?這樣他們的技能就可以在其他地方得到更好地利用。
公司人員一般在信息庫中搜索、收集或提取哪些數據,這些操作如何自動化?
公司做出的一係列決定是什麼?如果機器獲取到公司人員所能獲取到的所有數據,是否也能做出這些決定?
針對現有客戶的產品和體驗
客戶交互的哪些部分是由人來定製的,是否可以交給機器來定製?
是否根據喜好、行為和需求對客戶進行了細分?產品或體驗是否為每個細分客戶群進行了定製?
是否可以根據自己對客戶的了解或客戶與網站/應用/產品的交互來為每個客戶定製體驗?如何為客戶創造一個更好、更快、更愉快的體驗?
具體來說,今天需要客戶做出怎樣的決定或選擇?基於我已經擁有或可能擁有一些知識,這些決策能否可以自動化?
如何更好地識別出好的或壞的客戶體驗?對客戶體驗或滿足感產生負麵影響的問題是否可以提前發現?
新的領域或客戶
- 我手裏是否有一些對本行業或者相關行業中其他利益相關者有用的數據?這些數據可以幫助他們做出什麼樣的決定?
綜上所述
哪些指標或者趨勢如果我正確預測了就能對我服務的客戶或者行業中的競爭對手產生深遠的影響?比如,預測某些類別產品的需求、成本波動等等?
收集的數據的關鍵實體是什麼(人、公司、產品等等)?可以將這些數據與任何外部數據(來源於公共來源、合作夥伴等)結合起來,得出有關這些實體一些新的或有用的東西嗎?對誰有用,以及如何使用?比如,在人們在查找你的產品的時候識別出潛在客戶、了解外部因素如何影響行業需求並作出相應的反應。
請與團隊以及組織中主要的利益相關者一起討論這些問題。如果你不知道從哪裏開始,就從隨便某個地方開始吧,隻要讓數據對你或者你的團隊產生一定的幫助作用。
文章原標題《What Machine Learning Can Do for Your Business and How to Figure It Out》,作者:Yael Gavish,譯者:夏天,審校:主題曲哥哥。
文章為簡譯,更為詳細的內容,請查看原文
因為原文需要翻牆,大家也可以下載該PDF查看原文內容。
最後更新:2017-08-13 22:21:10