第二章 AI復興：深度學習+大資料=人工智慧（1 / 6）

小說：人工智慧：李開復談AI如何重塑個人、商業與社會的未來圖譜作者：李開復、王詠剛

這一次人工智慧復興的最大特點是，AI在語音識別、機器視覺、資料探勘等多個領域走進了業界的真實應用場景，與商業模式緊密結合，開始在產業界發揮出真正的價值。

<h2>

第三次AI熱潮：有何不同？</h2>

2016年3月，似乎人人都在談人工智慧。

Alpha Go與李世石的一盤棋將普通人一下子帶入科技最前沿。圍棋人機大戰剛剛塵埃落定，“人類是不是要被機器毀滅了”之類的話題就超出了科幻迷的圈子，在普通人中流行開來。每天，我都能在各種場合聽見人們談論人工智慧，哪怕是在街頭的咖啡館裡，也能聽到“深度學習”這樣的專業字眼兒；大大小小的人工智慧“論壇”或“年會”如雨後春筍般在北京、上海、廣州、深圳、杭州等地湧現出來，學術界的人工智慧大師們在各種會議、商業活動和科普活動中奔波忙碌，馬不停蹄；一邊是專業的科研機構、高科技公司在談論人工智慧，另一邊，銀行、保險、能源、家電等傳統行業廠商也都忙不迭地把“AI”或“AI+”的標籤貼在自己身上；創投領域就更是熱火朝天，包括創新工場在內，每家高科技投資機構都盯緊了人工智慧領域的初創公司——這種火熱場面，和整個投資圈在2016年遇冷的大背景迥然不同。

可大家千萬不要忘了，這並不是人機對弈第一次激起公眾的熱情。1997年IBM的深藍戰勝卡斯帕羅夫的那一天，全世界科技愛好者奔走相告的場景絲毫不比今天人們對Alpha Go的追捧遜色多少。再往前看，1962年，IBM的阿瑟·薩繆爾開發的西洋跳棋程式就戰勝過一位盲人跳棋高手，那時，報紙也在追捧人工智慧，公眾也一樣對智慧機器的未來充滿了好奇。

從20世紀60年代到90年代再到今天，從西洋跳棋到國際象棋再到圍棋，三盤棋，三次人工智慧在公眾中引發的熱潮——為什麼處在風口浪尖的偏偏都是人機對弈？為什麼會下棋的計算機程式如此風光？

圖17　三個時代、三盤人機對弈

縱觀人工智慧發展史，人機對弈只是人工智慧在公眾心目中的地位起起落落的一個縮影。對於人工智慧的技術研發者而言，選擇人機對弈作為演算法的突破口，這一方面是因為棋類遊戲代表著一大類典型的、有清晰定義和規則、容易評估效果的智慧問題；另一方面也是因為具備一定複雜性的棋類遊戲通常都會被公眾視為人類智慧的代表，一旦突破了人機對弈演算法，也就意味著突破了公眾對人工智慧這項新技術的接受門檻。

的確，每次人機大戰以及計算機勝出的結果，都在公眾視野中激起萬千波瀾。可反過來想一想，人類對計算機在棋類專案上勝出的心理承受力又是何等脆弱和可笑。跳棋程式甫一成熟，公眾驚呼“智慧機器威脅論”，可沒過幾年，習慣了計算機會下簡單棋類的公眾又轉而挑釁地說：“下個跳棋有什麼了不起，有本事去下複雜無比的國際象棋試試？”IBM的深藍剛剛戰勝卡斯帕羅夫的時候，全世界關心科技發展的公眾都在為人類的未來命運擔憂，可沒過幾年，國際象棋和中國象棋程式就變成了再普通不過的計算機應用，在大多數人心目中，“下個象棋算什麼智慧？有本事去下奧妙無窮的圍棋試試？”

網上流傳著一幅有關“人工智慧發展成熟度曲線”的漫畫，形象地展示出人們在此前兩次人工智慧熱潮中，從被人工智慧在某些領域的驚豔表現震撼，到逐漸認識到當時的人工智慧還有各種侷限，以至於產生巨大心理落差的有趣過程。

圖18　網上流傳的漫畫：人工智慧發展成熟度曲線

與其說這是人類自身的心理落差，不如說這是計算機是否具有智慧的判定標準在不斷被拔高。從會下跳棋就算智慧，到會下象棋才算智慧，再到會下圍棋才算智慧……到底有沒有客觀的評價尺度？到底要給計算機設定怎樣的門檻，才能正式發給它一張“人類智慧”的鑑定證書？今天我們管Alpha Go叫人工智慧了，3年之後呢？5年之後呢？

Alpha Go之前，人們至少喊過兩次“人類要被機器毀滅了！”20世紀60年代前後算一次，20世紀80年代到90年代前後也算一次。前兩次人工智慧熱潮，每一次都釋放過人類關於未來的瑰麗想象力，每一次都讓許多人熱血沸騰。但很不幸，兩次熱潮在分別經歷了十數年的喧囂後，無一例外地迅速跌入低谷，並在漫長的寒冬中蟄伏起來。

1998年，我來到北京創立微軟亞洲研究院的時候，正值當時人工智慧的熱潮開始消退，人們對熱潮中隨處可見的盲目情緒心有餘悸，很多人甚至不願再用“人工智慧”這個詞來指代相關的研發領域。在學術圈子裡，一度有很多人覺得，凡是叫“人工智慧”的，都是那些被過分誇大，其實並不管用的技術。結果，我們為微軟亞洲研究院設定科研方向的時候，就經常主動迴避“人工智慧”這個字眼兒，而是選用“機器視覺”“自然語言理解”“語音識別”“知識挖掘”之類側重具體應用領域的術語。

僅僅因為人工智慧的表現與普通人的期望存在差距，我們這些研究人工智慧的人就羞於提及“人工智慧”，這真是一件尷尬的事兒。

那麼，今天這次人工智慧熱潮會如何發展呢？第三次人工智慧熱潮有何本質上的不同？幾年後的我們是否還會像前兩次那樣，不但忘掉了曾經的興奮，還憤憤地說人工智慧都是騙子？學術界、投資界、商業界乃至普通大眾還會像此前兩次那樣在熱鬧了一陣子之後就歸於沉寂，甚至跌入冰點嗎？

<h3>

用高德納技術成熟度曲線看AI發展史</h3>

和前面那張搞笑的“人工智慧發展成熟度曲線”不同，學術界、產業界和投資界在談到技術高潮與低谷時，經常會引用高德納諮詢公司（Gartner）推薦的技術成熟度曲線。

這條曲線顯示出，幾乎每一項新興且成功的技術，在真正成熟之前，都要經歷先揚後抑的過程，並在波折起伏中透過積累和迭代，最終走向真正的繁榮、穩定和有序發展。

圖19　高德納諮詢公司（Gartner）技術成熟度曲線（CC BY-SA 3.0，Wikipedia）29

如圖19中的曲線所示，一種新科技的研發過程通常是這樣的：初創公司接受第一輪風投，開發出第一代產品，雖然不成熟，但足以吸引一批早期接受者——粉絲。在早期階段，產品的優點被粉絲放大，大眾媒體跟風炒作，將該技術推向一個充滿泡沫的膨脹期。隨著盲目的追捧者激增，跟風研發、生產的初創公司越來越多，產品的不足被無限放大，負面報道開始出現，供過於求的市場競爭中，大批跟風入局的初創公司不是被兼併，就是走向倒閉，只有少數擁有核心競爭力的堅持了過來。跌入低谷後，第二輪、第三輪風投資金注入大浪淘沙後僅存的中堅企業，新一代技術和產品也隨之問世，整個技術曲線步入穩步攀升的平臺期和成熟期，潛在使用者的接受程度也從5%以下逐漸提升到20%到30%，初創企業和風投資本開始迎來高額回報。

這條曲線概括了絕大多數高新技術的發展歷程。更重要的是，每年高德納公司都會根據當年度所有流行技術的發展、成熟狀況，製作出一張當年各流行技術在高德納曲線上的發展位置圖示，標示出每種前沿技術是處在萌芽期、泡沫期、低谷期還是成熟期，以及每種未達成熟期的技術還需要幾年才會真正成熟起來。技術人員、投資者經常根據高德納曲線來判斷時代潮流，選擇投資方向。

將高德納技術成熟度曲線對應到人工智慧波折起伏的發展歷程中，其實不難看到，人工智慧此前兩次表現出的熱潮，更多應該被理解為一項新興技術在萌芽期的躁動以及在泡沫期的過分膨脹。

20世紀50年代到60年代，伴隨著通用電子計算機的誕生，人工智慧悄然在大學實驗室裡嶄露頭角。以艾倫·圖靈（Alan Turing）提出圖靈測試為標誌，數學證明系統、知識推理系統、專家系統等里程碑式的技術和應用一下子在研究者中掀起了第一撥人工智慧熱潮。但那個年代，無論是計算機的運算速度還是相關的程式設計與演算法理論，都遠不足以支撐人工智慧的發展需要。例如，電腦科學和人工智慧的先驅艾倫·圖靈就曾在1951年發表過一份寫在紙上的象棋程式30，可惜當年的計算機難以實現這樣複雜的運算。這就像探險家發現新大陸一樣，第一次踏足新大陸和真正讓新大陸蓬勃發展起來是根本不同的兩件事。於是，從20世紀60年代末開始，無論是專業研究者還是普通公眾，大家對人工智慧的熱情迅速消退。

20世紀80年代到90年代，也就是我在卡內基-梅隆大學發明非特定人連續語音識別技術並將其用於蘋果計算機系統的時代——那的確是人工智慧研究者和產品開發者的一個黃金時代。傳統的基於符號主義學派的技術被我和其他同時代研究者拋棄在一邊，基於統計模型的技術悄然興起，並在語音識別、機器翻譯等領域取得了不俗的進展，人工神經網路也在模式識別等應用領域開始有所建樹，再加上1997年深藍計算機戰勝人類棋王卡斯帕羅夫，普通人的積極性一度高漲起來。但是，那個時代的技術進步還不夠好，不足以超過人類對智慧機器的心理預期。拿語音識別來說，統計模型雖然讓語音識別技術前進了一大步，但還沒有好到可以讓普通人接受的程度，測試環境稍稍變化就會造成識別效果大幅下降。那時，我在蘋果公司開發的語音識別應用就更多被用於演示和宣傳，實用價值十分有限。從整體上看，那一撥人工智慧熱潮仍然籠罩著濃厚的學術研究和科學實驗色彩，雖然激發了大眾的熱情，但更像是跌入谷底前的泡沫期，遠沒有達到與商業模式、大眾需求接軌並穩步發展的地步。

2010年前後，準確地說，是從2006年開始，隨著深度學習技術的成熟，加上計算機運算速度的大幅增長，當然，還有網際網路時代積累起來的海量資料財富，人工智慧開始了一段與以往大為不同的復興之路。

例如，2012年到2015年，在代表計算機智慧影象識別最前沿發展水平的Image Net競賽（ILSVRC）中，參賽的人工智慧演算法在識別準確率上突飛猛進。2014年，在識別圖片中的人、動物、車輛或其他常見物件時，基於深度學習的計算機程式超過了普通人類的肉眼識別準確率31。

圖20　Image Net影象分類比賽歷年來識別錯誤率的變化趨勢

人們在Image Net競賽（ILSVRC）中取得的非凡成就是人工智慧發展史上一個了不起的里程碑，也是當今這一撥人工智慧熱潮由萌芽到興起的關鍵節點。隨著機器視覺領域的突破，深度學習迅速開始在語音識別、資料探勘、自然語言處理等不同領域攻城略地，甚至開始將以前被人們視為科幻的自動駕駛技術帶入現實。此外，基於深度學習的科研成果還被推向了各個主流商業應用領域，如銀行、保險、交通運輸、醫療、教育、市場營銷等，第一次實現了人工智慧技術與產業鏈條的有機結合。

<h3>

今天的人工智慧是“有用”的人工智慧</h3>

我覺得，和前兩次AI熱潮相比，這一次人工智慧復興的最大特點，就是AI在多個相關領域表現出可以被普通人認可的效能或效率，並因此被成熟的商業模式接受，開始在產業界發揮出真正的價值。

心理學上說，人們接受一件新事物，就像人們感受一種外界刺激一樣，是有一個心理閾值的。外界刺激（比如聲、光、電）的強度太小的話，人們根本不會有任何感覺；只有外界刺激的強度超過了一個人能夠感知的最小刺激量，人們才有“聽到了聲音”“看見了東西”之類的明確感受。這個能引起人們感知反應的最小刺激量，心理學上叫絕對閾值（absolute threshold）32。

人工智慧技術的發展正是如此。還是拿影象識別來說，在人工智慧發展早期，如果一個計算機程式宣稱可以識別出圖片中的人臉，但它的識別準確率只有五成左右，那普通人只會將這個程式看作一個玩具，絕不會認為它擁有智慧。隨著技術進步，當人臉識別演算法的識別準確率提高到80%甚至接近90%的時候，研究者們當然知道，取得這樣的進步十分不易，但這一結果其實還是很難被普通人接受，因為每五個人臉就認錯一個，這明顯無法在實際生活中使用——人們也許會說這個程式挺聰明，但絕對不會認為這個程式已經聰明到可以替代人類的眼睛。只有計算機在人臉識別上的準確率非常接近甚至超過普通人的水平，安防系統才會用計算機來取代人類保安完成身份甄別工作。也就是說，對於人臉識別這個應用，接近或超過普通人的水平才是我們關心的“絕對閾值”。

所以，我們說“人工智慧來了”，其實是說，人工智慧或深度學習真的可以解決實際問題了。在機器視覺、語音識別、資料探勘、自動駕駛等應用場景，人工智慧接連突破了人們可以接受的心理閾值，並第一次在產業層面“落地”，發揮並創造出真正的價值。

人工智慧之所以有今天的成就，深度學習技術居功至偉。谷歌最傑出的工程師傑夫·迪恩說：“我認為在過去5年，最重大的突破應該是對於深度學習的使用。這項技術目前已經成功地被應用到許許多多的場景中，從語音識別到影象識別，再到語言理解。而且有意思的是，目前我們還沒有看到有什麼是深度學習做不了的。希望在未來我們能看到更多更有影響力的技術。”33

所以，關於第三次人工智慧熱潮，我的看法是：

·前兩次人工智慧熱潮是學術研究主導的，而這次人工智慧熱潮是現實商業需求主導的。

·前兩次人工智慧熱潮多是市場宣傳層面的，而這次人工智慧熱潮是商業模式層面的。

·前兩次人工智慧熱潮多是學術界在勸說、遊說政府和投資人投錢，而這次人工智慧熱潮多是投資人主動向熱點領域的學術專案和創業專案投錢。

·前兩次人工智慧熱潮更多是提出問題，而這次人工智慧熱潮更多是解決問題。

到底本次人工智慧熱潮是不是處於技術成熟度曲線的成熟上升期，到底能不能保持長期持續增長的勢頭，是不是會像此前的人工智慧熱潮那樣，有跌入低谷的風險？我想，經過上面的分析，大家應該會有自己的判斷。

<h2>

本站所有小說均來源於會員自主上傳，如侵犯你的權益請聯絡我們，我們會盡快刪除。