-
2017年中國人工智能行業發展前景分析
2017/5/21 10:38:16 來源:中國產業發展研究網 【字體:大 中 小】【收藏本頁】【打印】【關閉】
核心提示:2016 年3 月 AlphaGo 大戰李世石以來,人們對人工智能的關注度空前火熱,人工智能無疑會帶來下一代科技革命,國內外互聯網巨頭 Google 、微軟、亞馬遜、百度、騰訊、阿里巴巴等在人工智能領域跑馬圈地,各國也將人工智能上升到國家戰2016 年3 月 AlphaGo 大戰李世石以來,人們對人工智能的關注度空前火熱,人工智能無疑會帶來下一代科技革命,國內外互聯網巨頭 Google 、微軟、亞馬遜、百度、騰訊、阿里巴巴等在人工智能領域跑馬圈地,各國也將人工智能上升到國家戰略,企圖搶占下一代技術革命的制高點。
這一波人工智能的興起源于深度學習算法的突破,深度學習算法突破過去人工提取特征的低效率、深層模型難以訓練的局限,大大提高了算法的性能;其次,摩爾定律揭示了計算速度和內存容量能夠每十八個月翻一番,之前計算性能上的基礎障礙被逐漸克服,進入新時期,云計算、 GPU 的使用為人工智能提供新的可能;互聯網、物聯網的普及,數據積累呈爆發式積累,為訓練算法,實現人工智能提供原料。
一、深度學習技術使人工智能達到商用化水平
在深度學習出現之前,機器學習領域的主流是各種淺層學習算法。初期的人工智能研究的重點是以機器學習為代表的統計方法。機器學習是人工智能的一個分支,是目前實現人工智能的一個重要途徑。機器學習使機器從數據中自動分析習得規律,再利用規律對未知數據進行預測。機器學習淺層算法如神經網絡的反響傳播算法( BP 算法)、支撐向量機( SVM )、 Boosting 、 Logistic Regression 等。這些算法的局限性在于對有限樣本和計算單元的情況下對復雜函數的表示能力有限,對復雜數據的處理受到制約。
深度學習與機器學習的關系

數據來源:公開資料整理
機器學習原理

數據來源:公開資料整理
機器學習的思路

數據來源:公開資料整理
傳統的機器學習需要人工提取特征,其思路是,從開始的通過傳感器來獲取數據,然后經過預處理、特征提取、特征選擇、再到推理、預測或者識別,最后一部分也就是機器學習的部分。中間三部分概況起來就是特征表達,是靠人工提取特征。良好的特征表達對最終算法的準確性起到了非常關鍵的作用。然而手工地選取特征既耗費時間又不能保證選取好,深度學習徹底解決了這個問題。
深度學習突破人工智能算法瓶頸。2016 年,Hinton 等人提出深度學習神經網絡,掀起了深度學習的浪潮。“深度”某種意義上是指人工神經網絡的層數,旨在建立可以模擬人腦進行分析學習的神經網絡,模仿人腦的機制來解釋數據,例如,圖像、聲音和文本。在短短幾年內,深度學習顛覆了語音識別、圖像分類、文本理解等眾多領域的算法設計思路,創造了一種從數據出發,經過一個端到端最后得到結果的新模式。由于深度學習是根據提供給它的大量的實際行為(訓練數據集)來自調整規則中的參數,進而調整規則,因此在和訓練數據集類似的場景下,可以做出一些很準確的判斷。
深度學習與傳統計算模式的區別

數據來源:公開資料整理
傳統的提取特征的方法是通過大量的工程技術和專業領域知識手工設計特征提取器,因此在處理加工數據時能力有限。深度學習把原始數據通過一系列非線性變換得到更高層次、更加抽象的表達,其復雜的結構、海量的參數設置,能夠更好的完成特征提取。對于很多訓練任務來說,特征具有天然的結構層次。以圖像識別任務為例,圖像的初始輸入為像素,相鄰像素組成線條、線條組成紋理,進一步組圖案,圖案組成物體的局部,直到形成整個物體的樣子。
以計算機視覺為例,深度學習出現之前,基于尋找合適的特征來讓機器辨識物體狀態的方式幾乎代表了計算機視覺的全部。盡管對多層神經網絡的探索已經存在,然而實踐效果并不好。深度學習出現之后,計算機視覺的主要識別方式發生重大轉變,自學習狀態成為視覺識別主流。即,機器從海量數據庫里自行歸納物體特征,然后按照該特征規律識別物體。圖像識別的精準度也得到極大的提升,從 70%+ 提升到 95% 。
深度學習對圖像識別的提升

數據來源:公開資料整理
二、運算力和數據量為人工智能提供引擎
深度學習對于運算速度和數據量提供了新要求。例如斯坦福大學的交通指示牌識別實驗,用傳統的線性模型,識別準確率為 92% ,所需訓練時間為 13s ,而采用深度神經網絡模型的識別準確率高達 98.8% ,其所需的訓練時間也提升到 783s 。
1、海量數據為人工智能發展提供燃料
數據量和算法可以分別比作人工智能的燃料和發動機。數據集的豐富和大規模性對深度學習算法訓練尤為重要。實現精準識別的第一步,就是獲取海量而優質的應用場景數據。以人臉識別為例,訓練該算法模型的圖片數據量至少應為百萬級別。
數據在深度學習中的應用

數據來源:公開資料整理
2000 年以來,得益于互聯網、社交媒體、移動設備和廉價的傳感器以及物聯網的發展,世界上產生并存儲的數據量急劇增加,為通過深度學習的方法來訓練各種模型。 IDC 數據顯示,從 2011 年起,全球所產生的數據量已達到 ZB級別( 1ZB 約為 10 億 GB ),海量的數據為深度學習提供源源不斷的素材。而數據量對提高算法準確率具有重要的作用,對于人工智能公司而言,數據是最大的壁壘。
人工智能決策過程

數據來源:公開資料整理
數據在深度學習中的應用

數據來源:公開資料整理
三、資本持續投入催化產品化進程與產業鏈的構建
人工智能領域投資額逐年增長,5 年增長12 倍。從 2006 年提出深度學習之后,人工智能才有了實質性的進展。該領域的創業公司逐漸增加, 2011 年開始投資額度飛速增加,據統計,截止到 2016 年 Q2 ,全球人工智能公司已突破 1000 家,跨越 13 個子門類,融資金額高達 48 億美元。
AI 行業全球投資額

數據來源:公開資料整理
2000-2015 年成立的人工智能公司數量

數據來源:公開資料整理
深度學習、自然語言處理和計算機視覺是創業最火熱的領域。 深度學習、自然語言處理和計算機視覺是創業最火熱的領域。目前受到關注度最高的 AI 應用有自然語言處理、圖像識別的深度學習、計算機視覺、自動駕駛、聊天機器人等。其中研究深度學習應用的公司最多,自然語言處理和計算機視覺的公司其次。同時,深度學習和自然語言處理獲得的融資額也是最多的。應用型的深度學習公司融資額最高為 2.1 億美元,自然語言處理類的公司總融資額為 7000 萬美元,位居第二位。
AI公司融資額及相應公司數量

數據來源:公開資料整理
國內獲投最多領域為NLP 、機器人和計算機視覺。從 1996 年至今,國內至今仍在運營的人工智能公司有 366 家。通過數據分析可 以看出,計算機視覺、機器人、自然語言處理是創業最熱門的領域。 2015-2016 年人工智能領域獲投金額在 90 億人民幣左右。可以看出,獲投最多的細分領域有自然語言處理、機器人、計算機視覺,均在 10 億以上人民幣的級別。
國內各領域人工智能公司數量

數據來源:公開資料整理
國內人工智能公司獲投金額

數據來源:公開資料整理
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如有侵權行為,請第一時間聯系我們修改或刪除,郵箱:cidr@chinaidr.com。



