首頁 » 新聞資訊 » 行業新聞
                行業新聞 Industry News

                一個搞開源,一個送數據,百度和雅虎在AI上有何野心?

                時間:2016-01-16 17:02:22 點擊:8205次
                  今天,人工智能領域發生了兩件大事:百度開源人工智能系統代碼,雅虎送出13.5TB用戶數據。
                  像是說好的一樣,年末年初,谷歌、Facebook、雅虎、百度等科技大佬紛紛開始在人工智能領域拼命圈地,送代碼,送數據,簡直停不下來。他們到底有什么野心?
                  開源關鍵技術圈定開發者社區
                  百度在國內水深火熱,在國外倒是驚天動地了一番。百度硅谷 AI 研究所 (SVAIL) 今天開源了百度的關鍵人工智能 (AI) 軟件 WARP-CTC,希望通過機器學習社區繼續提升 WARP-CTC.
                  WARP-CTC是干什么的呢? CTC結合了多個不同的神經網絡設計,以處理不完美的數據集,而百度的正是基于CTC方案開發了自己的系統WARP-CTC,其語音識別技術在適應中國方言上有很大進步。百度表示,Warp-CTC所需的存儲空間較小,比普通CTC速度快數百倍。
                  百度在人工智能上的布局已經越來越明顯,14年,百度首席科學家吳恩達接受華爾街日報采訪,那時的報道中就提到百度曾計劃投資 3 億美元招聘 200 人建設人工智能中心。吳恩達還說,百度中心的建模速度比他以前任何時候都要快,對此他表示滿意。目前百度的機器學習團隊主要攻關的是語音識別,另外也兼顧一下計算機視覺的研究。
                  那么,百度為何開源自己辛苦研發的技術? 據新浪科技報道,百度希望使“端到端的深度學習變得更簡單、速度更快,加快研究者的進度”,而“此前的代碼在訓練端到端網絡時速度太慢”。這當然只是漂亮的說辭,其實,從去年11月起,谷歌、Facebook也相繼開源了自己的人工智能技術,而他們的目標是共同的:吸引第三方開發者,讓自己的技術成為主流。百度如果不開源,那么開發者很可能競相學習競爭對手的技術,百度的技術則會邊緣化。
                  去年11月,谷歌開源人工智能系統TensorFlow,也就是谷歌的第二代機器學習系統,它的速度是第一代系統DisBelief的兩倍。有媒體評價說,TensorFlow相當于人工智能領域的安卓。到了12月,Facebook公開Big Sur人工智能硬件架構,這是一種易于組裝的計算機服務器,可以運行最新的人工智能算法,此舉也標志著人工智能領域的開源從軟件邁向硬件設計。
                  當然,谷歌、Facebook、百度都不是慈善機構,開源的目的,一方面是“集思廣益”,把科研眾包出去,減少經費壓力;另一方面,一個平臺使用的人越多,就越容易形成自己的社區,最經典的例子就是安卓借助廣大開發者的力量奪回了手機市場。
                  公開數據收買研究員
                  同一天,雅虎送出的是13.5TB的用戶數據大禮包,這里面裝的是將近2000萬匿名用戶在瀏覽雅虎新聞時產生的數據,甚至細致到鼠標的每一次點擊、懸停和滾動。雅虎此前曾56次發布這樣的數據,但這次的數據集規模尤其龐大,相當于美國國會圖書館數據的三分之二。
                  海量數據同樣是機器學習必不可少的食糧。通過分析這些數據,計算機就能夠學習到用戶的許多習慣,比如從雅虎的角度來說就可能是:什么樣的標題更加吸引點擊?什么樣的文章能讓人長時間去細讀?而在雅虎此次公開數據之前,研究者很少有機會能夠接觸到真實反映用戶習慣的數據。
                  根據TechChurch報道,加州大學圣地亞哥分校的電器與計算機工程教授Gert Lanckriet表示,如此大規模的數據,“能夠直接并極大地推進人工智能、機器學習、以及大數據應用技術的研究?!?/span>
                  但其實,公布用戶數據以期改善算法的做法其實并不新鮮,AOL、Netflix也曾公開用戶數據以期從公司外部獲得改善產品的靈感,Netflix甚至提供一百萬美元獎金,明碼標價換取算法優化。不過雅虎似乎還有別的打算。
                  雖然沒有明說,但雅虎這兩年人才流失的窘境早已是路人皆知,因此,它對在像人工智能這樣的高新技術領域吸引人才表現得十分饑渴??▋然仿〈髮W計算機科學院院長摩爾表示,科技公司不論有多少人才,老板永遠都覺得不夠,他們總是覺得想做的事情還差人手。
                  除了公開數據以外,雅虎也通過開源算法來吸引開發者。根據新浪科技,這些算法用于對流數據的計算和網頁爬蟲,處理網站上的結構化數據。
                  人工智能界的“圈地運動”本質上是“圈人”,誰能贏得技術人才以及開發者社區,誰就能掌握話語權。
                  然而,也有開發者在谷歌宣布開源TensorFLow的時候就表示:“人工智能的發展還是初級階段。好比處于原始社會的醫學,武當的技術當主治醫生。谷歌一個公司不可能主導新技術的發展,人工智能還需要全世界幾代科學家的共同努力?!睆倪@一角度來看,在人工智能領域,圈地進行得再熱鬧,一家通吃的現象或許暫時還不會出現。
                關閉地圖

                Back to Top

                24小時客服熱線:
                 0379-63260019
                日韩精品无码一区二区三区,