【投資人不懂AI】為什麼說AI創業不是4、5個人的團隊就能搞定的事
本文講的是為什麼說AI創業不是4、5個人的團隊就能搞定的事,在人工智能領域內的一係列突破點燃了無限商機,大公司希望抓住機遇來加強現有職位,小公司希望借助新技術來提升市場領先地位。作為FirstMark的投資者,Matt>在人工智能領域內的一係列突破點燃了無限商機,大公司希望抓住機遇來加強現有職位,小公司希望借助新技術來提升市場領先地位。作為FirstMark的投資者,Matt Turck已經看到機器學習領域內的初創正在躍躍欲試。Matt Turck曾任Bloomberg Ventures常務董事,現為FirstMark Capital合夥人。
以下Matt Turck對於機器學習型初創公司發展模式的討論,哪些是推動生態係統發展的原因,以及為什麼它們看起來與之前的SaaS初創公司不同。
采訪人Sam DeBrule是人工智能、技術、創業等領域的優秀博主。在Medium社區,他有8600多粉絲。他的《機器學習和人工智能的非技術指南》、《如何找到一個值得工作的創業公司》等文章獲得了許多喜愛。
Sam:Matt,請你簡單介紹一下自己以及你所做的工作吧。
Matt:我是紐約風投公司FirstMark的合夥人,FirstMakr管理著61億美元的資金,已經成為紐約市最大的早期投資創業公司。作為投資者,我雖然對很多事情感興趣,但我重點關注的領域有兩個。
第一個是“數據領域”,包括大數據、機器學習和人工智能公司,以及將大數據視為護城河的初創公司,如ActionIQ、Dataiku、x.ai、Sense360和HyperScience這樣的公司,我很熱衷於投資於這樣的企業,並時常在博客上討論這些話題。與此同時,我還運營著一個有著14000名大數據和AI愛好者的社區——Data Driven NYC。
第二是“前沿科技領域”,包括新型計算平台、VR/AR、物聯網以及你所能想到的所有流行新事物。同樣地,我也會在個人博客上討論,並運營著一個超過5000人的社區Hardwired NYC。
1. 現在確實是投資AI的最佳時機
Sam:你是在什麼時候開始考慮投資機器學習領域?
Matt:我是以數據分析師這個角色進入科技行業的。我是一家搜索引擎初創公司的聯合創始人,我們用貝葉斯理論(一種機器學習方法)來進行問題搜索和檢索。
實際上,機器學習已經存在於創投領域很多年了。但近年來,因為大數據的出現這個領域變得有趣了許多。大數據技術以合理的成本和速度捕獲和處理大量數據。另一方麵,它同時加快了機器學習的發展速度,特別是需要大量數據工作的領域,如神經網絡。
現在正是投資該領域的最佳時機。在我看來,人工智能確實很熱。
2. 營銷蓋過現實:IBM可能在兌現承諾方麵做得最差
Sam:接下來,我們來討論一個比較犀利的問題。如今眾多的AI企業中,哪家企業在兌現消費者承諾方麵做得最差?
Matt:根據我從市場上聽到的,可能是IBM。
很大程度上,正是因為他們的營銷機製和雄心勃勃讓他們陷入了一個尷尬的境地:承諾太多,同時間投入在多個領域難以得到市場的滿意回饋。據說,隻要你願意花幾個月的時間和大量的金錢去訓練IBM Waston,你就能用它來實現有趣的事情。但是,很明顯,這有些言過其實了。
他們會發現,在每個垂直領域的競爭上都十分激烈。據我了解,他們正在損失大量交易,通常是敗給那些更為專注、靈活的小公司。
3. 人才是核心,而創業公司距離人才更近
Sam:Salesforce是否會走上和IBM同樣的路徑?
Matt:我覺得不會。當Salesforce創始人Marc Benioff去年宣揚人工智能平台Einstein時,Salesforce公司自己的人都有些害怕,不過這可能是因為Marc本身就愛吹牛。
問題的核心是,創業生態係統的導向和市場收購動作有著直接聯係。因為創業公司距離機器學習領域的人才更近,而目前來看,這個因素是該行業的決定性條件。Salesforce和創業生態係統有較強的連接性,這一點很重要。
4. 沒有大數據對創業公司的影響並沒有想象中大,行業裏最敏銳的人正在致力於減少神經網絡對大數據的依賴,這是未來的一個方向
Sam:眾所周知,專有數據是模型訓練的關鍵,這使得創業公司和大公司相比會處於劣勢。是否能找到更小的數據集來為模型提供動力的方法?
Matt:創業公司在這一方麵確實處於劣勢,但是這同時也會讓他們具備更多創造性,讓資源變得豐富。
從技術角度來說,當下該行業中最敏銳的人(不僅僅是初創公司裏的人)正在致力於讓神經網絡在數據量較少的情況下發揮作用。在可以看得到的未來裏,這將是這個行業前進的方向。
幾家我很熟悉創業公司已經取得了一些真正的進展,並在遷移學習方麵做了一些有趣的事情。話雖如此,這似乎還是一個特別棘手的問題,所以還需要些時間。
同時,創業公司也正在尋找多種的方法獲得他們所需要的大型數據集。例如醫學成像領域的人工智能公司,他們中的一些人在與特定醫院建立了合作後,能安全地訪問一些特定的放射影像數據庫。在保險、工業機械、農業等領域也同樣如此。
另外,獲取數據隻是挑戰的中一部分,你還需要給它貼上標簽,以便深入學習。一些創業公司在世界各地雇傭了一大批人,用Mechanical Turk(Amazon旗下的公司,網絡交易平台)的套路來給他們的數據貼上標簽。
我還看到其他一些創企聘請了一些行業專家來給特定類型的數據貼上標簽,比如一個外科醫生精英組給最複雜的醫療圖像數據集貼標簽。
5. 理論上,任何人都能收集到足夠多的數據,形成馬太效應
Sam:基於Netflix、Spotify和Facebook等平台,我們看到數據集帶來的馬太效應。哪些初創公司在構建下一代強大的數據馬太效應?
Matt:理論上,任何人都能從多個用戶那裏收集到足夠多的數據,在集合數據集上運行算法,並將學習反饋給每個客戶的機器學習企業這些都可以從數據網絡效應中受益。
以x.ai項目為例,人工智能助手安排的會議越多,得到的數據也就越多,算法隨即變得越聰明。算法越智能,體驗也就越好。反過來,體驗越好,人們也就會更願意使用x.ai來安排會議,從而x.ai就能獲得更多的數據。如此良性循環下去。這便是數據網絡效應。
這種效應的奇妙之處適用於很多創業公司,從像x.ai幫助人們安排會議的公司,再到像Phosphorous幫助醫院經營基因檢測實驗室的公司都能適用。
在B2B模式背景下,通常不會輕易受到數據聚集帶來的馬太效應影響,因為企業都很注重對數據的保護,比較抗拒把自家數據和所在行業其他公司的數據摻糅在一起。
另一方麵,數據集造成的門檻問題也將在一定程度上得到解決。穀歌搜索在幾個月前發表了一份關於聯合學習的文章,文章的想法是:在不實際收集數據的情況下支持協作式機器學習。這就可以解決所有關於數據隱私的擔心,充分利用各類數據網絡效應了。
不管怎樣,數據網絡效應的影響要幾年才能發揮出來。創企要建立客戶基礎來收集足夠的數據,這才能讓他們的模型進行學習。不過,一旦完成,企業就會形成較強的競爭力。
6. 人工智能創業不是簡簡單單4、5個人就能搞定的事
Sam:人工智能是否將成為創業公司的“最佳市場策略”?
Matt:我認為,大多數的人工智能創企最終都會趨同。例如,由於不同行業的特點、客戶規模、價格等,麵臨著多種不同的市場策略供創業者選擇,然而這些公司最後將會變得和軟件或SaaS公司類似。但是,我們還遠未達到那種程度。現在,建立機器學習產品還需要大量的研發,訓練算法需要大量的時間、精力、技術資源以及數據。
再引用x.ai的例子。x.ai成立了數年時間,雇傭數十名數據科學家和機器學習工程師,花費數百萬的風投基金才建立起AI後端,以提供其高水平的自動化和可靠性。這樣高的門檻,使得機器學習企業很難成為精益創業企業,至少現在看來是這樣。對於這些創業團隊,構建一個真正以AI技術為驅動的可行產品仍比較困難。任何一款運作良好的AI產品,都需要基於大量數以訓練算法,並定製完善產品。
比較常見的情況是,AI創業團隊以大額預算來追求大體量客戶,自上而下銷售產品,基本上遵循合作策略。即在早期,與少數客戶建立緊密合作的基礎上,盡可能多地迭代產品。基於大量服務來解決客戶問題的模式,以達到在工作中構建軟件的目的,積累可重複使用的案例,再將其服務轉化為產品。模式穩固,但銷售周期比較長。
但這個階段隻是暫時的。隨著機器學習的大眾化和開源化,我們能得到更多的開源數據集和算法、更多訓練有素的工程師。未來,機器學習的初創企業會像其他領域的公司一樣變得多元化。
7. AI型創業公司必須提供10倍產能
Sam:投資人是否會將人工智能創業公司視為收購標的,或者是否看好這些創業企業發展為大型獨立公司?
Matt:考慮到風險投資的經濟效益,後者的可能性更大。近年來,大公司收購各種小型AI公司的確形成了一股潮流。但這種現象背後的原因在於,人們堅信AI的美好未來,並且機器學習領域的人才稀缺。所以,有機會近距離接觸研究實驗室的公司可能獲得相當可觀的投資。不過,這種情況正在減少。
這就是為什麼像我這樣的投資者對垂直人工智能創企會如此感興趣。在垂直領域方麵,創企的專注度更高,而且他們的服務和產品能夠有別於大公司。當大公司嗅到商業氣味的時候,創企已經能取得不小的成就。
隻要找準定位,人工智能可以成為真正的差異化因素。AI技術確實會對產品性能產生巨大影響,能夠提供比現有質量好上10倍的產品。
不論你是創業者還是投資人,目的都是利用下一個市場拐點來獲得發展。幾年前,這個拐點是SaaS,現在是人工智能。當然,這個時間窗口終究會結束。但是,現在很多的人工智能企業都有機會成為這一行業的領軍人。
原文發布時間為:2017-09-20
作者/采訪:Sam DeBrule
編譯:四月
本文來自雲棲社區合作夥伴新智元,了解相關信息可以關注“AI_era”微信公眾號
原文鏈接
最後更新:2017-09-21 16:32:52