袋鼠雲助力光伏產業 | 基於阿裏雲數加平台做算法預測
隨著大數據技術的蓬勃發展,現在關於大數據技術在各行各業的實踐也如火如荼。
那麼當大數據技術遇到光伏行業會產生何樣的化學反應呢?
下麵就和大家一起分享一下袋鼠雲是如何使用阿裏雲數加平台和機器學習平台助力光伏行業的。
說明:
為保護客戶數據隱私,本文未透露客戶名稱,並將相關數據進行了馬賽克處理。
01 光伏大數據實踐簡介
一 光伏行業為什麼適合大數據技術
原因有二:光伏行業涉及的數據麵很“廣”; 光伏行業涉及的數據量很“多”。
從狹義上來看:光伏行業擁有各個電站實時采集的光伏發電數據以及周邊環境數據
從廣義上來看:光伏數據除了光伏電站全生命周期(規劃及設計、建造及驗收、監測及控製、運維及管理、資產評估及交易)的所有數據外,太陽輻射數據、氣象數據、地理數據以及一些購電協議等相關業務數據,也包括其中。
二 光伏大數據應用的價值
1. 電力調度
國家能源局下發的《2015年度全國光伏年度計劃新增並網規模表》征求意見稿顯示,2015年全國新增光伏發電並網規模將高達15GW。
隨著光伏發電量在社會發電總量所占的比例越來越高,目前光伏電站所監測的發電數據僅用於常規運維及計量計價的現狀急需改變。
通過對整個光伏發電數據的檢測,將光伏發電加入到整個電網調度之中,這也是未來的一種趨勢。
如此背景下,光伏發電企業急需解決的一個問題,則是如何準確地了解到自身能產生多大規模的電力供應。在此基礎上,才能通過對大數據技術的運用,對設備狀態、電能負載等數據的分析、挖掘,實現精準調度,做到分布式電源的有效共享。
2. 提升用電效率
《關於進一步深化電力體製改革的若幹意見》將 “ 積極開展電力需求側管理和能效管理,完善有序用電和節約用電製度”列為五項基本原則的重要內容,明確要“通過運用現代信息技術、培育電能服務、實施需求響應等,促進供需平衡和節能減排 ” 。
在這種大背景下,光伏電站以及正在開展分布式光伏項目的企業也應積極參與,與需求側響應管理相配合,提升發電能效。
通過集成光伏大數據,形成分析引擎,提供光伏電站的實時監測和即時數據分析,並據此對用戶進行需求響應管理,引導用戶於光伏發電高峰時多用電,光伏發電低穀時少用電,優化用電方式,提高供電效率。
另外,在光伏大數據監測分析引擎的基礎上,更多創新的商業模式也將隨之湧現,如節能建築設計和智能家電設計等。分析和利用光伏電站提供的光伏大數據,提供準確的用電預測,節電的同時,也管理著把電送到哪裏,哪裏的電可以並網。通過與需求側響應管理相配合,光伏發電可以實現按需動態調配生產、傳輸和消費,達到提高效率、節能減排的目的。
3. 故障檢測
通過光伏行業的快速發展,各種光伏的監控平台也在不斷的推出,他們可以監測光伏電站統計的實時運行數據,比如:今日發電量、昨日發電量、電站實時效率以及電站運行狀態等,並可以在某些指標出現異常波動時,發出異常預警,方便工作人員提早排查,提前防範,減少損失等。毋庸置疑,在這個過程中,數據發揮的作用非常重要。
02 阿裏雲大數據平台
工欲善其事,必先利其器。
作為國內大數據領域的標杆企業,阿裏雲的大數據技術在國內同樣遙遙領先。
阿裏雲完整的大數據生態,使得企業無需關注底層技術架構實現,可以將更多的精力放在對自身業務數據的應用上,從而快速擁有大數據能力。
一 阿裏雲大數據分析利器 MaxCompute
大數據計算服務(MaxCompute,原名ODPS),是一種快速、完全托管的TB/PB級數據倉庫解決方案。
MaxCompute向用戶提供了完善的數據導入方案以及多種經典的分布式計算模型,能夠更快速地解決用戶海量數據計算問題,有效降低企業成本,並保障數據安全。
MaxCompute主要服務於批量結構化數據的存儲和計算,可以提供海量數據倉庫的解決方案以及針對大數據的分析建模服務。
隨著社會數據收集手段的不斷豐富及完善,越來越多的行業數據被積累下來。數據規模已經增長到了傳統軟件行業無法承載的海量數據(百GB、TB、乃至PB)級別。在分析海量數據場景下,由於單台服務器的處理能力限製,數據分析者通常采用分布式計算模式。
但分布式的計算模型對數據分析人員提出了較高的要求,且不宜維護。使用分布式模型,數據分析人員不僅需要了解業務需求,同時還需要熟悉底層計算模型。
MaxCompute的目的是為用戶提供一種便捷分析處理海量數據的手段。用戶可以不必關心分布式計算細節,從而達到分析大數據的目的。
目前,MaxCompute已經在阿裏巴巴集團內部得到大規模應用,例如:大型互聯網企業的數據倉庫建設和BI分析、網站日誌分析、電子商務網站交易分析、用戶特征和興趣挖掘等。
二 分析型數據庫(AnalyticDB)
阿裏雲分析型數據庫 (原名ADS),讓海量數據和實時與自由的計算可以兼得,實現了速度驅動的大數據商業變革。
一方麵: 分析型數據庫擁有快速處理百億級別數據的能力,使得數據分析中使用的數據可以不再是抽樣的,而是業務係統中產生的全量數據,使得數據分析的結果具有最強的代表性。
而更重要的是:分析型數據庫采用雲計算技術,擁有強大的實時計算能力,通常可以在數百毫秒內完成十億百億的數據計算,使得使用者可以根據自己的想法在海量數據中進行自由探索,而不是根據預先設定好的邏輯查看已有的數據報表。
同時:由於分析型數據庫能夠支撐較高並發查詢量,並且通過動態的多副本數據存儲計算技術來保證較高的係統可用性,所以能夠直接作為麵向最終用戶(End User)的產品(包括互聯網產品和企業內部的分析產品)的後端係統。
三 阿裏雲大數據平台(DataIDE)
大數據開發套件(Data IDE),提供可視化開發界麵、離線任務調度運維、快速數據集成、多人協同工作等功能,為大數據開發者提供一個高效、安全的離線數據開發環境。
並且該套件擁有強大的Open API為數據應用開發者提供良好的再創作生態。平台使用者隻需要通過拖拽的方式就可以完成一個工作流的開發,同時機器學習平台還集成了很多阿裏集團內諸多優秀的算法。
03 光伏行業應用實踐
古人雲“鑒往而知未來”。不錯,在今天的大數據時代,通過對曆史數據的分析、挖掘,我們能發現某些潛在的規律,根據這些規律我們對未來的結果可以做一定的預測。
一 客戶的訴求
該客戶是一家做光伏逆變器生產的公司,公司的業務主要集中在光伏的分布式能源領域,業務以每年50%的增長率快速爆發,光伏能源前景一片大好。
目前,該客戶想要對自身分布式的光伏發電進行管理並提供一定的增值服務,比如:家庭電量合理利用控製,手機app展現發電量預測圖。這一切的實現都要依賴於對光伏發電功率的預測。
客戶目前已經采集了很多電站的數據,包括逆變器的電壓、電流、功率以及電站周圍的環境數據(太陽輻射、溫度、風速等)。我們基於客戶采集的數據進行數據處理,建立預測算法模型、並對模型進行訓練、評估,希望最終實現客戶訴求。
因為客戶的係統和數據都是在阿裏雲上,所以我們采用的方案為 “ 數加+機器學習平台+Quick BI ” 。
二 光伏發電功率預測結構圖
根據我們做過的一些光伏行業的預測案列,我們整理出來關於發電功率預測的流程圖如下:
三 算法模型構建
阿裏雲的機器學習平台提供了很多優秀的組件可供選擇,開發同學隻要通過拖拽的方式便可以進行算法模型的建立、訓練以及評估。機器學習平台沉澱了諸多阿裏集團內部優秀的算法,開發者可以基於該平台,快速構建算法模型。
四 預測效果
機器學習平台提供了算法模型的評估模塊,我們可以對訓練的算法模型進行評估。
將預測結果導入BI係統中看預測結果的擬合效果:
04 項目意義
隨著汙染越來越嚴重,發展“新能源”已經上升為國家戰略,未來將是一個新能源時代。分布式電源未來會走進千家萬戶,通過基於功率數據進行發電功率預測,可以為客戶提供更多的增值服務,擁抱電力市場化的大環境。
如何精準預測光伏發電也將是業界一個重要的課題,歡迎大家和袋鼠雲一起探索新能源時代的新思路、新方法。
文章轉自袋鼠雲公眾號
最後更新:2017-04-10 15:00:06