閱讀847 返回首頁    go 魔獸


阿裏雲數加(大數據)公開數據集(公測ing)

目前阿裏雲大數據產品已經免費向全部用戶開放了多種公用數據集。在此之前,獲取,分析,下載自定義的大型分析數據集需要數小時乃至數天才能完成。

而現在阿裏雲的任何用戶都可以通過基於大數據計算服務[MaxCompute](https://www.aliyun.com/product/odps) 的大數據開發套件[DataIDE](https://data.aliyun.com/product/ide)快速、便捷的分析這些公用數據集。我們將股票價格、房產、影視等多種類型的數據免費開放給用戶,使得大家免去了複雜的數據獲取、上傳、清洗等過程,可以直接進入數據分析階段,通過這種數據開放形式,我們希望能以更快的速度實現更多的創新。

目前我們開放的數據類別包括:股票價格數據,房產信息,影視及其票房數據。所有的數據均被存儲在MaxCompute 產品中的public_data 項目中。以下,我們將對這些數據做更為詳細的介紹,並簡要說明如何通過MaxCompute 及DataIDE 服務並分析這些數據。

獲取權限
首選,需要用戶以項目空間的owner 或者管理員的身份,在自己的項目空間下,執行如下操作。執行完成後用戶項目空間下的所有成員均可讀取各公開數據集合:
add user ALIYUN$everyone;
執行該語句後即可執行查詢:
256bf6f8fa48f5fe07c2a9ed95fe6703eead1582

特殊說明
公開數據集合對所有MaxCompute 用戶開放,這是通過MaxCompute 特殊的授權機製實現的。在使用過程中,用戶需要足以一下幾點:
1. 所有數據均存儲在一個名為public_data 的項目空間中,但所有用戶並未被加入到該空間下(非項目空間成員)。因此,用戶需要跨項目空間訪問數據,在DataIDE 中編輯SQL 時,必須在表明前指定項目名稱,例如:

Select * from public_data.ods_enterprise_share_basic where ds = ‘20170114’;

2. 由於是跨項目空間訪問,所有用戶在DataIDE 的[數據管理]中無法查找到公開數據集的表;

3. 隻有在執行”Add User”語句後,用戶才有權限訪問公開數據集。該語句可以再DataIDE 以及MaxCompte 提供的客戶端中執行;

下麵我們將詳細介紹目前開放的數據集合。

股票價格數據集
總體信息:每日更新A 股股票相關數據。

項目
public_data
表集合
ods_enterprise_share_basic 股票基本信息
ods_enterprise_share_quarter_cashflow 季度報表說明
ods_enterprise_share_quarter_growth 季度業務增長情況
ods_enterprise_share_quarter_operation 季度財務周轉
ods_enterprise_share_quarter_profit 季度利潤
ods_enterprise_share_quarter_report 季度報表
ods_enterprise_share_trade_h 股票價格
更新周期
根據各表的業務屬性,每日或每季度第一天早10 點前更新。至2016 年12 月13 日開始。
 查詢示例  select * from public_data. ods_enterprise_share_basic where ds =‘20170114’;


ods_enterprise_share_basic 股票基本信息

字段英文名

字段類型

描述

是否為分區列

code

STRING

代碼

 

name

STRING

名稱

 

industry

STRING

所屬行業

 

area

STRING

地區

 

pe

STRING

市盈率

 

outstanding

STRING

流通股本

 

totals

STRING

總股本()

 

totalassets

STRING

總資產()

 

liquidassets

STRING

流動資產

 

fixedassets

STRING

固定資產

 

reserved

STRING

公積金

 

reservedpershare

STRING

每股公積金

 

eps

STRING

每股收益

 

bvps

STRING

每股淨資

 

pb

STRING

市淨率

 

timetomarket

STRING

上市日期

 

undp

STRING

未分利潤

 

perundp

STRING

每股未分配

 

rev

STRING

收入同比(%)

 

profit

STRING

利潤同比(%)

 

gpr

STRING

毛利率(%)

 

npr

STRING

淨利潤率(%)

 

holders_ num

STRING

股東人數

 

ds

STRING

數據導入日期,時間間

隔為天。

分區列

數據樣例:
cef138b1ad4c9cb15de8ff9ebc56822dbfe5d54c

ods_enterprise_share_quarter_cashflow 季度報表說明

字段英文名

字段類型

描述

是否為分區列

rank

STRING

排序

 

code

STRING

代碼

 

name

STRING

名稱

 

cf_sales

STRING

 

經營現金淨流量對銷售收入比 率(%)

 

rateofreturn

STRING

資產的經營現金流量回報率(%)

 

cf_nm

STRING

 

經營現金淨流量與淨利潤的比 率(%)

 

cf_liabilities

STRING

經營現金淨流量對負債比率(%)

 

cashflowratio

STRING

現金流量比率(%)

 

ds

STRING

年份

分區列

quarter

STRING

季度。數據季度更新。

分區列


數據樣例:
1af529364aba16f55c463a63a4c1d7518d9ccaeb


ods_enterprise_share_quarter_growth 季度業務增長情況

字段英文名

字段類

是否為分區列

rank

STRING

排序

 

code

STRING

代碼

 

name

STRING

名稱

 

mbrg

STRING

主營業務收入增長率(%)

 

nprg

STRING

淨利潤增長率(%)

 

nav

STRING

淨資產增長率(%)

 

targ

STRING

總資產增長率(%)

 

epsg

STRING

每股收益增長率(%)

 

seg

STRING

股東權益增長率(%)

 

ds

STRING

年份

分區列

quarter

STRING

季度。數據季度更新。

分區列


數據樣例:
83445ca744ecda6b5ae7d5bba6243afc4b9b0dff

ods_enterprise_share_quarter_operation 季度財務周轉

字段英文名

字段類型

描述

是否為分區列

rank

STRING

排序

 

code

STRING

代碼

 

name

STRING

名稱

 

arturnover

STRING

應收賬款周轉率()

 

arturndays

STRING

應收賬款周轉天數()

 

inventory_turnover

STRING

存貨周轉率()

 

inventory_days

STRING

存貨周轉天數()

 

currentasset_turnover

STRING

流動資產周轉率()

 

currentasset_days

STRING

流動資產周轉天數()

 

ds

STRING

導入日期。

分區列

quarter

STRING

季度。數據季度更新。

分區列


數據樣例:
cc551045d083e68c4ec0a99ad1b74d05122aff9d

ods_enterprise_share_quarter_profit 季度利潤

字段英文名

字段類型

描述

是否為分區列

rank

STRING

排序

 

code

STRING

代碼

 

name

STRING

名稱

 

roe

STRING

淨資產收益率(%)

 

net_profit_ratio

STRING

淨利率(%)

 

gross_profit_rate

STRING

毛利率(%)

 

net_profits

STRING

淨利潤(萬元)

 

eps

STRING

每股收益

 

business_income

STRING

營業收入(百萬元)

 

bips

STRING

每股主營業務收入()

 

ds

STRING

年份

分區列

quarter

STRING

季度,數據季度更新。

分區列



數據樣例:

01af347ca1f9ec1818a364f40706dac832bcefba


ods_enterprise_share_quarter_report 季度報表


字段英文名

字段類型

描述

是否為分區列

rank

STRING

排序

 

code

STRING

代碼

 

name

STRING

名稱

 

eps

STRING

每股收益

 

eps_yoy

STRING

每股收益同比(%)

 

bvps

STRING

每股淨資產

 

roe

STRING

淨資產收益率(%)

 

epcf

STRING

每股現金流量()

 

net_profits

STRING

淨利潤(萬元)

 

profits_yoy

STRING

淨利潤同比(%)

 

distrib

STRING

分配方案

 

report_date

STRING

發布日期

 

ds

STRING

年份

分區列

quarter

STRING

季度。數據季度更新。

分區列

數據樣例:

23e3b266e231ad71fbaef40bc78d0a164ada9127


ods_enterprise_share_trade_h 股票價格


字段英文名

字段類型

描述

是否為分區列

trde_date

STRING

日期

 

open

STRING

開盤價

 

high

STRING

最高價

 

close

STRING

收盤價

 

low

STRING

最低價

 

volume

STRING

成交量

 

price_change

STRING

價格變動

 

p_change

STRING

漲跌幅

 

ma5

STRING

5 日均價

 

ma10

STRING

10 日均價

 

ma20

STRING

20 日均價

 

v_ma5

STRING

5 日均量

 

v_ma10

STRING

10 日均量

 

v_ma20

STRING

20 日均量

 

turnover

STRING

換手率

 

code

STRING

股票代碼

 

ds

STRING

導入日期。

分區列

數據例:

 

 

 

b43626aae92ef60dacbfcad79dbd4cdde9a4a4d0


二手房數據集

總體信息:每日更新杭州市二手房相關信息。



public_data
表集合

dwd_prouduct_house_basic_info_out

更新周期
每日早10 點前更新。至2016 年12 月13 日開始更新
查詢示例  Select * from public_data.dwd_prouduct_house_basic_info_out where ds= ‘20170113’;

dwd_prouduct_house_basic_info_out信息


字段英文名

字段口型

描述

是否是分區列

house_id

STRING

ID

 

house_city

STRING

所在城市

 

house_total_price

STRING

產總

 

house_unit_price

STRING

均價

 

house_type

STRING

產類

 

house_floor

STRING

 

house_direction

STRING

方向

 

house_deckoration

STRING

裝修

 

house_area

STRING

 

house_community_name

STRING

所在小區

 

house_region

STRING

所在地區

 

proj_name

STRING

名稱

 

proj_addr

STRING

目地址

 

period

STRING

產權年限

 

property

STRING

公司

 

greening_rate

STRING

化率

 

property_costs

STRING

業費

 

ds

STRING

數據入日期

分區


數據樣例:

dec6c4ed6ad31a7fb6bf8fdc213e0059e9cfa812

及票房數據集

總體信息:每日更新國內影視劇信息及票房數據信息 。



public_data
表集合

dwd_product_movie_basic_info 電影基本信息

ods_product_movie_box 票房基本信息


更新周期
每日早10 點前更新。至2016 年12 月13 日開始更新
 查詢示例  Select * from public_data.dwd_product_movie_basic_info where ds =‘20170112’ limit 10;

dwd_ product_ movie_ basic_ info

字段英文名

字段

描述

是否是分區列

movie_ name

STRING

影名稱

 

dirctor

STRING

 

scriptwriter

STRING

編劇

 

area

STRING

製片地區/國家

 

actors

STRING

主演

 

type

STRING

 

movie_ length

STRING

 

movie_ date

STRING

上映日期

 

movie_ language

STRING

 

imdb_ url

STRING

imdb

 

ds

STRING

日期

分區

0e36b486b51890bd298744ee850bedd533f9cc73


ods_product_movie_box 票房基本信息

字段英文名

 

字段口型

描述

是否是分區列

rank

 

STRING

排名

 

avgprice

 

STRING

平均票價

 

avppeople

 

STRING

均人次

 

boxoffice

 

STRING

日票房(萬)

 

boxoffice_ up

 

STRING

%

 

irank

 

STRING

排名

 

movieday

 

STRING

上映天數

 

moviename

 

STRING

影片名

 

sumboxoffice

 

STRING

票房(萬)

 

womindex

 

STRING

口碑指數

 

ds

 

STRING

日期

分區


數據樣例:

bfb6a5c402617d1ed8d47ecbdb78ca3ada84bd1b

最後更新:2017-05-24 19:01:25

  上一篇:go  阿裏雲使用開篇
  下一篇:go  《計算機存儲與外設》----1.2 Cache存儲器的性能