311
機器人
人工智能版“薄霧君”:準確率近80%,物種識別不在話下
深度學習是人工智能技術的一種方法,它通常利用大型的數據集來訓練神經網絡,最終以較高的準確率得出問題的結果。深度學習(Deep Learning)從快速發展到實際應用,短短幾年時間裏,已經改變了語音識別、圖像分類、文本理解等眾多領域的算法設計思路。最近,科學家又成功將深度學習算法應用到複雜的植物分類領域。
據發表在 8 月 11 日的 BMC 進化生物學雜誌上的一項研究顯示,研究人員運用深度學習方法成功地對數千種植物標本的圖像進行了自動識別,而且,人工智能成功做出了正確的分類。這是研究人員首次嚐試將人工智能技術運用到物種識別領域上。
賓夕法尼亞州立大學的古植物學家 Peter Wilf 說,這是第一次嚐試,但肯定不會是最後一次嚐試。這種技術是博物學界物種識別分類領域的未來。
此次研究人員用了 26 萬份植物標本的掃描圖像來訓練深度學習算法,這些植物標本的物種數超過了 1000 個。該算法最終以接近 80% 的準確率識別出了這些物種。Wilf 說,這可比人類的分類學家做得好多了。
如今,世界各地的自然曆史博物館都在競相將他們的標本藏品數字化,把他們的標本放在公開的數據庫中,讓任何地方的研究人員都可以通過這些數據庫對標本進行使用。比如,美國國家科學基金會的 iDigBio 項目,其實就是一個數據聚合器,它擁有超過 1.5 億張來自全國各地的植物和動物的收藏標本圖片。
世界上大約有 3000 個植物標本館,據估計這些植物標本館擁有 3.5 億份標本,其中隻有一小部分被數字化。但是,不斷膨脹的標本數據集,以及計算機技術的進步,吸引了來自哥斯達黎加理工學院的計算機科學家 Erick Mata-Montero 和法國農業研究中心的植物學家 Pierre Bonnet 的關注,他們總覺得這些龐大的標本數據會有一些其他的用途。
Bonnet 的團隊已經通過pl@ntnet 項目實現了植物識別的自動化。pl@ntnet 是法國研究人員基於深度學習技術開發的一個 APP,它已經積累了數以百萬計的植物圖像,並能對部分植物進行自動識別,它的這些植物圖像通常是人們用智能手機拍照上傳得來的,圖像數據越多,它識別的準確率就越大。此外,它還會向拍照者詢問圖像裏的植物是一朵花還是一片葉子等,以增加識別的準確度。
Bonnet 說,雖然這種人工智能技術極大地提高了植物學家進行植物識別分類的效率,但是有一些植物學家擔心,這種高效技術會降低植物學領域的門檻,會讓民眾覺得植物學家已沒有什麼專業技術價值。但是 Bonnet 卻堅持認為,這種人工智能技術是很有作為的,因為它是基於人類的專業知識。它永遠不會消除人類的專業知識。何況,植物學家還需要對這種技術的結果進行最後驗證。
這種新技術可以幫助植物標本館快速地處理新樣本,簡化一項需要數小時工作的艱巨任務。另外,Bonnet 說,這種技術還可以更有效地幫助小型植物標本館進行物種識別。他的研究小組發現,從大型植物標本館中獲得的大型數據集的深度學習算法改進了對世界上相對數據缺乏的標本館的植物物種的識別。這一發現對於那些生物多樣性豐富但擁有很少植物標本收藏的地區來說尤其有用。
這種人工智能物種識別技術並不隻是局限於植物標本。Nelson 目前正在努力實現對蠅幼蟲的自動識別。此外,古植物學家 Peter Wilf 正在與人合作來對植物化石進行類似的分析識別。對植物化石的分析相當困難,因為植物化石的形式多種多樣,比如石化了的水果和花朵,石化樹幹或壓印在岩石裏的石化樹葉。相比之下,植物標本的識別就容易多了,它們扁平,幹燥,而且通常是放在標準尺寸的紙上的。
總之,包括 Wilf 在內的一些博物界研究人員非常確信,這種深度學習技術將會逐步解決各種識別分類問題,並且會最終成為物種識別領域的基本技術手段。
最後更新:2017-08-23 10:10:59