閱讀434 返回首頁    go 阿裏雲 go 技術社區[雲棲]


特寫|Kaggle被穀歌收購能否複製,中國的Kaggle們走到哪了


0?wx_fmt=jpeg


 

Kaggle被收購的消息讓國內數據競賽平台的先行者們在探索的路上“似乎看到了新的希望”……


當地時間3月8日,Google CloudNext 穀歌雲計算開發者大會上,穀歌官方宣布收購 Kaggle。這條撲朔迷離了將近一周的流言終於得到了官方證實。(點擊查看大數據文摘相關新聞穀歌宣布收購全球最大數據科學社區Kaggle》

 

0?wx_fmt=png

Google Cloud Next 穀歌雲計算開發者大會上,李飛飛宣布了收購 Kaggle這個消息


“一大早就被這個消息刷屏了”,範向偉笑著說,“很多人轉這個消息給我,好朋友、合作夥伴、投資人,說要恭喜我。”


位於上海的數據競賽平台科賽網創始人範向偉是國內最早探索競賽平台的先行者之一,他直言不諱的稱Kaggle為“前輩”,也坦誠的說,當初做競賽平台就是受到Kaggle模式的啟發。

 

Kaggle被收購的消息讓這些國內數據競賽平台的先行者們在探索的路上“似乎看到了新的希望”。

 

“之前大家普遍對於數據競賽的認真沒有那麼高,看不到發展模式,盈利模式也在探索,Kaggle的消息出來之後,大家會覺得,原來競賽平台是這麼玩兒的,原來也是有發展前景的。

 

Kaggle模式何以震動業界?

 

在2010年創建之初的時候,沒有人能夠想到這麼一個專注競賽、商業模式不那麼明朗的平台會得到穀歌的青睞。

0?wx_fmt=png

不管是初學者還是大魔王,隻要浸潤過數據科學和機器學習界,那麼對於Kaggle一定不陌生。各路英豪在這個平台上實戰練習、膜拜大神、打怪升級,用某個媒體人的一句話,“簡而言之,Kaggle 是玩數據、機器學習的開發者們展示功力、揚名立萬的江湖。

 

Kaggle之所以成為繼Deepmind之外,穀歌收購的另一家震動業界的企業,得益於其對於競賽平台和社區運營的專注:活躍用戶基數大(具體數據從50萬到100萬仍有待確認)、粘性強。

 

本次收購Kaggle對於穀歌的意義,同樣位於極高的戰略層麵。穀歌雲對於社區的發力,及對於AI民主化的探索,都讓人們對於這兩個品牌的聯手可能產生的化學反應浮想聯翩。

 

國內競賽平台大勢

市場大但處於早期

 

Kaggle創立於2010年,專注數據科學、機器學習競賽的舉辦,很快吸引了大量數據科學家、機器學習開發者的參與。在B端,Kaggle的模式也對接了大批優秀企業,為各類現實中的商業難題探尋算法解決方案。而其基於社區提供的招聘服務以及名為Kaggle Kernels 的代碼分享工具也是其社區運營的關鍵競爭力。

 

經曆了7年的探索,如果姑且把被穀歌收購當作一種成功的話,Kaggle的飛躍得益於數據科學、AI、機器學習的商業機會的被認可和成熟度。而在國內,盡管數據科學、機器學習的熱度不亞於美國,但是,相關社區的發展不可否認有著巨大的市場,且依然處於發展的初期。而國內的投資者和參賽者,盡管對Kaggle都有所耳聞,直到看到Kaggle被收購,仍然看不清這樣一類隻運營社區的公司出路何在。

 

中國大賽平台仍處於起步階段,大家都隻是做了一兩年。但這個市場充滿了機會,用嶄新的模式為人才和企業締造了一個新的溝通方式。”DataCastle數據城堡聯合創始人張洋這樣看待中國的競賽平台市場。


0?wx_fmt=png

國內主要數據競賽平台發展概況

數據來自各平台官網


總部位於成都的DataCastle數據城堡大數據競賽平台是中國起步最早的數據類競賽平台之一,其發起人、電子科技大學教授周濤是《大數據時代》的譯者之一,也是國內最早關注並推進大數據的先行者。(點擊查看大數據文摘文章:《對話周濤:抓住大數據最性感的方向》


0?wx_fmt=png

數據城堡官網首頁及其Slogan

 

周濤教授在其翻譯的《大數據時代》一書裏曾多次提到過Kaggle及其模式。他非常認同這種競賽平台的模式,也展開了相關實踐,和他的創業合夥人張琳豔共同打造了DataCastle數據城堡這個平台。

 

在大數據文摘對周濤的幾次采訪中,他都不無驕傲的提及過競賽平台對於中國數據科學人才培養以及產業發展的重要意義:


對於企業而言,這樣的競賽一方麵可以解決一些具體的問題,另一方麵可以推廣企業的雇主品牌,也能夠幫助個別企業進行大數據人才招聘;


而對於大數據愛好者來說,在一場競賽中可以得到很多東西:學以致用、拓展人脈並找到自己的圈子,還有收獲獎金和機會。

 

“盈利模式的探索需要緣分”

Kaggle模式可以複製嗎?

 

“其實我們也對Kaggle的模式有很多疑惑,比如它到底賺錢嗎?”科賽網創始人範向偉稱Kaggle本身也曾經嚐試做過谘詢和獵頭,但都不是很成功,後來就開始專注做競賽,“但是我們還是一度懷疑過競賽平台到底是否真的有盈利模式存在?”

0?wx_fmt=png

數據城堡官網首頁


範向偉創建的科賽網可以說是幾家競賽平台中背景最“草根”的一個,而“科賽”的名頭也遠不如它所承辦的第一場競賽“上海開放數據創新大賽(下稱SODA大賽) ”響亮。


0?wx_fmt=png


15年3月跟上海交通大學合作了國內第一個比較專業的數據創新大賽後,碩士在讀的範向偉和他的團隊得到了學校和上海政府的支持,拿到了承辦上海開放數據創新應用大賽的機會。當時範的團隊裏隻有4個沒有畢業的研究生同學,卻因為這個成功將政府、開放數據與年輕的數據血液對接起來的數據大賽一炮而紅。


“我們基於SODA大賽的機會認識了現在的天使投資人,然後就休學,去跑業務,找投資,直到現在。”範這樣輕描淡寫地說完了自己3年的休學創業之路。

 

而大賽之路雖然起步了,想探索持續有效的盈利模式卻並非易事。采訪中,幾家數據競賽平台的創始人也都表示,做大賽運營、推廣渠道門檻比較高,僅靠競賽的企業傭金來作為盈利模式也太過單一。

 

“Kaggle在曆經了6、7年的發展後始終沒有找到一個很好的商業模式,主要靠賣比賽收取服務費賺錢,但平台上的比賽頻率並不高,大部分獎金也很少,所以收益應該不高。”阿裏雲高級專家,天池平台負責人,王一婷如此評價Kaggle模式。


DataCastle(數據城堡)聯合創始人張洋也稱,“競賽平台是贏利點,但不存在爆發性、高增長的價值,因此被互聯網巨頭所關注的是其在其他方麵具有的意義。”

 

與企業合作辦比賽拿傭金,一般是抽取獎金的10-20%作為服務費,這樣簡單的模式,隻是辦比賽的話勉強自負盈虧,但是如果同時需要應對技術研發上的投入,則會麵臨比較大的壓力。

 

背靠阿裏雲的天池競賽平台無疑是國內最大的競賽社區。作為國內最早起步,積累了全球近7萬數據極客的平台,天池擁有著計算能力、數據科學家團隊、生態合作夥伴等各種資源。但即使是天池,依然麵臨著盈利模式的挑戰。


0?wx_fmt=png

天池平台官網首頁


阿裏雲對天池的態度是投入,阿裏雲希望把計算能力開放給更多在天池平台上進行數據探究、進行數據創新、進行數據研發的年輕人”,王一婷表示天池也在積極探索盈利模式,“而對於天池團隊的成員來說,我們是希望能做到自負盈虧的,現在也看到天池的品牌被越來越多的客戶認可,並願意支付一定費用。”

 

創始人的背景和資源決定了DataCastle數據城堡大數據競賽平台的發展道路與“教育”有比較緊密的結合。


與Kaggle和天池專注競賽的模式不那麼一致,DataCastle數據城堡在探索一條基於社區、相對明晰的生態閉環。DataCastle數據城堡的聯合創始人張洋介紹道,“競賽是一種很好地學習交流的方式,但是中國當前更多的是需要係統培訓的種子用戶,通過集中培訓後輸送到企業。通過競賽,幫助用戶發現知識盲點和弱點,再對接在線教育,依托高校背景提供優質課程資源,人才輸出的業務再跟上。既有學習資源,又有企業招聘對接,這是流程化的閉環生態,可以源源不斷的為社會輸送大量優質的機器學習與數據科學人才。”

 

黑客不夠用了?

中國的競賽平台市場有多大


0?wx_fmt=png


黑客大賽太多,黑客都不夠用了”,這句在業內流傳頗廣的段子也道出了國內數據競賽平台發展的另一個挑戰:C端用戶的積澱。當被問及平台發展最大的挑戰時,一位很看好競賽平台市場的投資人如此回應。

 

除了阿裏這樣的本土企業,海外大的軟件巨頭如賽仕軟件公司(下稱SAS)也在不遺餘力的舉辦相關大賽,爭奪人才市場。去年,SAS舉辦的“匯豐杯"2016年中國高校SAS數據分析大賽涵蓋了17個賽區658支隊伍,參賽人數超過2000人。“(舉辦這樣的大賽)是我們培養大數據分析人才,非常重要的一個推手、搖籃。”SAS大中華區總裁吳輔世如此評價相關大賽對於公司的戰略意義。

 

B端企業對競賽的敏感度正越來越高,政府也在認識到競賽對於解決問題的重要性。Datafountain大數據競賽服務平台是中國幾家最主要的大數據競賽服務平台之一,也已經連續四年組織中國計算機學會(下稱CCF)大數據創新創業係列賽事。從曆年大賽參賽人數看,企業方對於競賽平台的敏感度正越來越高。


去年,CCF大數據與計算智能大賽的參賽隊伍達到了8654支,比曆年翻了幾番。一些企業級參賽隊伍在參賽獲獎後,也獲得了政府端賽題提供方後續的項目承接,這也讓工業界也越來越看重競賽平台的優勢。

0?wx_fmt=png

Datafountain大數據競賽服務平台官網首頁


大數據、機器學習的持續火熱,使得更多的中國年輕人希望進入數據科學領域,也為中國競賽平台的發展提供了巨大的空間。而除了比賽的需求,競賽參與者對於行業的了解、社交的需求等,都要求競賽社區提供更進一步的優質服務。

 

而C端用戶的運營模式能不能得到認可則需要平台運營者去了解用戶的需求點,需要給用戶一個簡單易懂的工具把大數據玩兒起來。

 

盡管天池平台注冊用戶量非常大,一些火熱的大賽,參賽人數甚至超過了Kaggle,天池平台負責人王一婷坦言,目前國內用戶樂於分享和交流的習慣仍然需要培養,這是國內社區和國外社區用戶的明顯不同,也是天池目前麵臨的最大挑戰。

 

而像科賽網、DataFountain這樣更小更垂直的平台,社區活躍度的運營就被擺在了更重要的位置。盡管創業團隊小,時間精力都有限,社區運營人員還是占到了團隊中除技術開發人員之外人數最多的職位。而國內幾家競賽平台在運營上也依托各自的資源,有不同的玩兒法。

 

幾家競賽平台都開發了相關論壇,希望用內容分享的方式留住參賽選手,也調動社區的活躍度。Data Fountain從去年年底開始拓寬內容運營團隊,引入了不少新媒體運營人員。

 

此外,與企業合作進行線上培訓也是留存用戶的另一種方式。去年年底,科賽網開始與合作企業共同舉辦免費的數據科學訓練營,通過線上培訓解決問題的方式,解決企業的問題,希望能夠借此產生比較持續的產品。

 

尾聲

當被問及最大挑戰時,科賽網的創始人範向偉猶豫了幾秒鍾:“這個我得好好想想,挑戰太多了。”

 

“中國大數據發展還處於早期,我們自己的團隊也比較年輕,沒有特別完整的商業模式可以照搬。怎麼借鑒中美的經驗找到一個我們自己走得通的商業模式,是很有挑戰的事情。很可能你事情做得很好但是商業模式不成立,最後就變成了做公益。”

原文發布時間為:2017-03-18

本文來自雲棲社區合作夥伴“大數據文摘”,了解相關信息可以關注“BigDataDigest”微信公眾號

最後更新:2017-05-22 15:33:46

  上一篇:go  Adopt Open JDK官方文檔(四)基於虛擬機的編譯環境
  下一篇:go  德國機器人0.637秒破解魔方打破世界紀錄