日報

Google開源人工智能算法將改變世界?

刊登於 2015-11-15

Google 對第二代人工智能算法庫“Tensor Flow”免費開放源代碼,希望能加速人工智能領域的發展。Research at Google 網頁截圖
Google 對第二代人工智能算法庫“Tensor Flow”免費開放源代碼,希望能加速人工智能領域的發展。

致力於用技術改變世界的互聯網巨頭 Google 於11月9日開源(Open Source,開放源碼)了其第二代人工智能算法庫“TensorFlow”——被廣泛使用在搜索、郵件、圖像與視頻識別等功能中的機器學習(Machine Learning)系統。

Google 於2007年推出的開源操作系統 Android 改變了移動設備領域,手機廠商和開發者從此可以進行自定製開發,搭載這一開源系統的智能手機已佔據全球八成市場份額。Google 希望通過開源 TensorFlow 也能改變人工智能領域。

機器學習對我而言,是為了讓人類能夠不用像機器那樣去做事。

Google 母公司 Alphabet 執行董事長 Eric Schmidt

人工智能研究範疇中的機器學習,是讓計算機對數據自動分析以獲得規律,並利用規律對未知數據進行預測的算法。TensorFlow 採用的則是機器學習中比較高效的深度學習(Deep Learning)算法,通過模擬人腦的神經網絡來解釋圖像、聲音和文本等數據。

早在2011年,由 Google Brain 團隊開發的第一代深度學習系統“DistBelief”在未獲取貓的特徵信息的情況下,從大量 YouTube 視頻中區分出了貓的視頻,這意味着該系統能自動總結出貓的特徵。

第二代的 TensorFlow系統則是在第一代產品的基礎上發展而來。Google 表示,TensorFlow 比第一代系統更快、更靈活且更聰明,並且已經應用於 Gmail、Photos、Translate、YouTube 等產品中。Google 高級科學家 Greg Corrado 解釋稱,比如在垃圾郵件過濾器中引入深度學習,能通過分析大量電子郵件來「學習」識別垃圾郵件和釣魚郵件,而不是利用預先設置好的規則進行攔截。

Google 希望此項技術的免費開放能加速人工智能領域的發展,並能利用收到的反饋信息來改進該技術。該項目的推動者 Jeff Dean 表示,「我們希望的是,整個研究、開發者社區將 TensorFlow 作為一種很好的手段來實現各種各樣的機器學習算法,同時也為其在各種場景下的應用帶來改進。」

有意思的是,在 Google 開源 TensorFlow 後,微軟(Microsoft)亞洲研究院也立刻宣布,將其分布式機器學習工具包“DMTK”開源。除 Google 與微軟外,包括 Facebook、Amazon、百度等在內的科技公司也越來越重視這個領域,以改進智能搜索、目標廣告等功能。2014年5月,Google Brain 的創建人吳恩達(Andrew Ng)更是被百度公司「挖」去擔任首席科學家,並負責「百度大腦」計劃。

99.9 %
Google 表示,利用 TensorFlow 系統,Gmail 服務的垃圾郵件攔截率達到了99.9%,誤報率只有0.05%。

聲音

這是很有趣的一件事,Google 在這一領域領先整個世界5到7年。如果他們將軟件開源,那將改進每一項機器學習研究。

深度學習公司 Skymind CEO Chris Nicholson

TensorFlow 對學術界的幫助比較小,但對工業界的幫助有很大潛在可能性。比如語音識別、自然語言理解、計算機視覺、廣告等等都可以應用這種深度學習算法。

前 Google 科學家、人工智能科技公司出門問問 CEO 李志飛

計算機的視覺如果比人要更好,為什麼還要人去開車?應該讓機器開車。現在是醫生看 X 光,未來如果讓機器看是否會做出更準確的診斷?在開源之後,如果全世界的聰明人都將給 Google 很好的回饋,Google 會有更好的發現,讓產品和服務更完美。

Google 母公司 Alphabet 執行董事長 Eric Schmidt

深度學習

Deep Learning,是機器學習的一個分支,它基於試圖使用包含複雜結構或由多重非線性變換構成的多個處理層對數據進行高層抽象的一系列算法。深度學習是機器學習中表徵學習方法的一類。一個觀測值(例如一幅圖像)可以使用多種方式來表示,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區域等。而使用某些特定的表示方法更加容易地從實例中學習任務(例如,人臉識別或面部表情識別)。深度學習的好處之一是將用非監督式或半監督式的特徵學習和分層特徵提取的高效算法來替代手工獲取特徵。至今已有多種深度學習框架,如深度神經網絡、卷積神經網絡和深度信念網絡和遞歸神經網絡已被應用於計算機視覺、語音識別、自然語言處理、音頻識別與生物信息學等領域並取得了極好的效果。(資料來自維基百科)

來源:一財網Google BlogWiredcnBeta36氪雷鋒網

本刊載內容版權為端傳媒或相關單位所有,未經端傳媒編輯部授權,請勿轉載或複製,否則即為侵權。

延伸閱讀