馮鵬程,馮鵬程講師,馮鵬程聯(lián)系方式,馮鵬程培訓(xùn)師-【中華講師網(wǎng)】
資本運(yùn)營(yíng)、財(cái)務(wù)管理、戰(zhàn)略與商業(yè)模式專家
50
鮮花排名
0
鮮花數(shù)量
馮鵬程:產(chǎn)業(yè)報(bào)告:人工智能產(chǎn)業(yè)深度研究報(bào)告-----------------資本運(yùn)營(yíng)專家講師馮鵬程教授
2016-01-20 2842

    技術(shù)不足導(dǎo)致移動(dòng)互聯(lián)網(wǎng)難以催生出更多的新應(yīng)用和商業(yè)模式,為突破瓶頸,新一輪更激動(dòng)人心、更值得期待的技術(shù)革命風(fēng)暴已經(jīng)誕生,將成為未來(lái)10年乃至更長(zhǎng)時(shí)間內(nèi)IT產(chǎn)業(yè)發(fā)展的焦點(diǎn),它的名字叫做“人工智能”(AI)。
只有人工智能才能為“萬(wàn)物互聯(lián)”之后的應(yīng)用問(wèn)題提供最完美的解決方案,它將成為IT領(lǐng)域最重要的技術(shù)革命,目前市場(chǎng)關(guān)心的IT和互聯(lián)網(wǎng)領(lǐng)域的幾乎所有主題和熱點(diǎn)(智能硬件、O2O、機(jī)器人、無(wú)人機(jī)、工業(yè)4.0),發(fā)展突破的關(guān)鍵環(huán)節(jié)都是人工智能。
人工智能是指計(jì)算機(jī)系統(tǒng)具備的能力,該能力可以履行原本只有依靠人類智慧才能完成的復(fù)雜任務(wù)。硬件體系能力的不足加上發(fā)展道路上曾經(jīng)出現(xiàn)偏差,以及算法的缺陷,使得人工智能技術(shù)的發(fā)展在上世紀(jì)80—90年代曾經(jīng)一度低迷。近年來(lái),成本低廉的大規(guī)模并行計(jì)算、大數(shù)據(jù)、深度學(xué)習(xí)算法、人腦芯片4大催化劑的齊備,導(dǎo)致人工智能的發(fā)展出現(xiàn)了向上的拐點(diǎn)。
國(guó)際IT巨頭已經(jīng)開(kāi)始在人工智能領(lǐng)域頻頻發(fā)力,一方面網(wǎng)羅頂尖人才,一方面加大投資力度,人工智能新的春天已經(jīng)到來(lái)。自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、規(guī)劃決策等AI細(xì)分領(lǐng)域近期進(jìn)展顯著,很多新的應(yīng)用和產(chǎn)品已經(jīng)驚艷亮相。
由于技術(shù)的復(fù)雜度,未來(lái)5-10年內(nèi),專用領(lǐng)域的智能化是AI應(yīng)用的主要方向,在更遠(yuǎn)的將來(lái),隨著技術(shù)的進(jìn)一步突破,通用領(lǐng)域的智能化有望實(shí)現(xiàn)。無(wú)論是專用還是通用領(lǐng)域,人工智能都將圍繞“基礎(chǔ)資源支持-AI技術(shù)-AI應(yīng)用”這三層基本架構(gòu)形成生態(tài)圈。
在 專用領(lǐng)域的智能化階段,有能力的企業(yè)都希望打通三層架構(gòu)。他們有的將從上往下延伸,如蘋(píng)果、海康威視、小米等智能硬件企業(yè);有的試圖從下往上拓展,如百 度、谷歌、IBM等互聯(lián)網(wǎng)和IT的巨頭,以及科大訊飛、格靈深瞳等AI技術(shù)新貴。產(chǎn)業(yè)格局更多地表現(xiàn)出“競(jìng)爭(zhēng)”而非“合作”,整個(gè)行業(yè)依然處于野蠻生長(zhǎng)的 初期階段。我們認(rèn)為,該階段最值得投資的是已經(jīng)具備先發(fā)優(yōu)勢(shì)的AI企業(yè),無(wú)論他目前處于哪一層都可以。
在 未來(lái)通用智能時(shí)代,進(jìn)入門(mén)檻最高,護(hù)城河最寬的是底層AI資源支持的平臺(tái)企業(yè);其次是技術(shù)層中在細(xì)分領(lǐng)域具備核心競(jìng)爭(zhēng)力的領(lǐng)先企業(yè);門(mén)檻最低的是應(yīng)用層的 企業(yè),但消費(fèi)電子的產(chǎn)品屬性也將允許差異化競(jìng)爭(zhēng)的空間。除了自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等AI技術(shù)在某些領(lǐng)域的直接應(yīng)用,人工智能更大的影響在于將重塑生活 服務(wù)、醫(yī)療、零售、數(shù)字營(yíng)銷(xiāo)、農(nóng)業(yè)、工業(yè)、商業(yè)等各行各業(yè),并將引發(fā)新一輪IT設(shè)備投資周期。智能化的大潮即將來(lái)襲,萬(wàn)億元的市場(chǎng)規(guī)模值得期待。新技術(shù)革命登場(chǎng)IT發(fā)展焦點(diǎn)將從互聯(lián)網(wǎng)轉(zhuǎn)向人工智能發(fā)軔于2007年的移動(dòng)互聯(lián)網(wǎng)浪潮已經(jīng)席卷全球,極大地改變了我們的生存狀態(tài)。然而,就在資本市場(chǎng)熱切地期待移動(dòng)互聯(lián)網(wǎng)催生出更多新應(yīng)用服務(wù)、更多新商業(yè)模式的時(shí)候,由技術(shù)水平不足導(dǎo)致的發(fā)展瓶頸已然出現(xiàn)。
與此同時(shí),為突破上述瓶頸,新一輪更激動(dòng)人心、更值得期待的技術(shù)革命風(fēng)暴已經(jīng)誕生,將成為未來(lái)10年乃至更長(zhǎng)時(shí)間內(nèi)IT產(chǎn)業(yè)發(fā)展的焦點(diǎn),將再次并更加徹底地顛覆世界。這一輪技術(shù)革命風(fēng)暴,它的名字叫做“人工智能”(Artificial Intelligence,以下簡(jiǎn)稱AI)?!?基于互聯(lián)網(wǎng)的應(yīng)用服務(wù)發(fā)展已遭遇技術(shù)瓶頸,AI將成開(kāi)鎖金鑰匙基于PC的互聯(lián)網(wǎng)、基于手機(jī)和平板電腦的移動(dòng)互聯(lián)網(wǎng)以及基于各種其他設(shè)備的物聯(lián)網(wǎng),其本質(zhì)是解決了“連接”問(wèn)題:連接人與人、人與物以及物與物,并且在連接的基礎(chǔ)上創(chuàng)造出新的商業(yè)模式。
以國(guó)內(nèi)BAT三巨頭為例,百度完成的是人與信息的對(duì)接,商業(yè)模式以網(wǎng)絡(luò)廣告為主;阿里解決的是人與商品的對(duì)接,電商是其商業(yè)模式;騰訊則實(shí)現(xiàn)了人與人的對(duì)接,依靠強(qiáng)大的免費(fèi)社交軟件吸引龐大的用戶群,在此基礎(chǔ)上利用增值業(yè)務(wù)和游戲來(lái)實(shí)現(xiàn)貨幣化。盡 管互聯(lián)網(wǎng)的普及打造了包括谷歌、亞馬遜、百度、阿里、騰訊、京東等一批巨頭以及數(shù)量更為龐大的中小企業(yè),基于網(wǎng)絡(luò)的創(chuàng)新應(yīng)用和服務(wù)類型也多種多樣,但技術(shù) 瓶頸的制約已經(jīng)越來(lái)越明顯:生活方面需求痛點(diǎn)的解決、生產(chǎn)領(lǐng)域具有適應(yīng)性和資源效率的智慧工廠的建立、物流體系中更加方便快捷的配送方式建設(shè)等問(wèn)題,都面 臨智能化程度不足帶來(lái)的障礙。只有人工智能才能為“萬(wàn)物互聯(lián)”之后的應(yīng)用問(wèn)題提供最完美的解決方案。
人工智能的價(jià)值如此重要,以至于我們可以毫不夸張地說(shuō),它將成為IT領(lǐng)域最重要的技術(shù)革命,目前市場(chǎng)關(guān)心的IT和互聯(lián)網(wǎng)領(lǐng)域的幾乎所有主題和熱點(diǎn)(智能硬件、O2O、機(jī)器人、無(wú)人機(jī)、工業(yè)4.0),發(fā)展突破的關(guān)鍵環(huán)節(jié)都是人工智能?!?下面我們將通過(guò)一些例子和應(yīng)用場(chǎng)景來(lái)更形象具體地展示上述瓶頸以及AI的重要性智能冰箱還不能告訴我們做什么由 于生活節(jié)奏加快人們的空閑時(shí)間大為減少,做家務(wù)的時(shí)間日益顯得不足,我們需要一款聰明的冰箱,讓冰箱告訴我們做什么。來(lái)自?shī)W維咨詢的《中國(guó)家用冰箱食品浪 費(fèi)調(diào)查報(bào)告》顯示,“每個(gè)家庭平均每年發(fā)生176次食物浪費(fèi)現(xiàn)象。70%受訪者表示,造成浪費(fèi)的主要原因是一次購(gòu)買(mǎi)太多和放入冰箱后忘記。
智能冰箱的出現(xiàn),不僅可以自行“清理門(mén)戶”,采購(gòu)新鮮食品,還能統(tǒng)籌安排,減少食材浪費(fèi),制作個(gè)性化食譜。它會(huì)根據(jù)食材新鮮與否,把不新鮮的食材調(diào)動(dòng)到距離冰箱門(mén)最近的地方,提醒主人“它該吃了”。此外,智能冰箱能對(duì)用戶的膳食合理性進(jìn)行分析,制作菜譜。
同 時(shí)提示需要補(bǔ)充的食材,如果與生鮮電商聯(lián)網(wǎng)的話,可以自動(dòng)選擇送貨上門(mén),直接實(shí)現(xiàn)食物的配送發(fā)貨收獲自動(dòng)化和智能化。2014年美菱率先推出全球首臺(tái)云圖 像識(shí)別智能冰箱ChiQ,突破全球智能冰箱技術(shù)門(mén)檻,該冰箱具備變頻功能,可以用語(yǔ)音搜索、自動(dòng)推薦等多種方式進(jìn)行食譜推薦,并實(shí)現(xiàn)手機(jī)的遠(yuǎn)程查看和控 制。
智能冰箱功能法的升級(jí),提升用戶體驗(yàn)和價(jià)值,背后的最大核心是自動(dòng)識(shí)別技術(shù)的突破。圖像識(shí)別技術(shù)通過(guò)圖像采集系統(tǒng)得到食材圖片,運(yùn)用圖像識(shí)別算法,轉(zhuǎn)化成食品的信息列表。而通過(guò)圖像識(shí)別技術(shù),判斷食材的種類是實(shí)現(xiàn)冰箱智能化的拐點(diǎn)。
可見(jiàn),不是用戶對(duì)智能家居的需求不存在,而是現(xiàn)有的技術(shù)無(wú)法支撐家居的智能化,這個(gè)瓶頸無(wú)法突破,智能家居永遠(yuǎn)是紙上談兵。那么,解決這個(gè)問(wèn)題的鑰匙在哪里?人工智能技術(shù)的突破:圖像識(shí)別背后的底層技術(shù)就來(lái)自于人工智能的算法和應(yīng)用!O2O尚未實(shí)現(xiàn)生活服務(wù)智能化試想這樣一個(gè)場(chǎng)景,你想選擇一個(gè)地方和朋友吃飯,首先你會(huì)打開(kāi)一個(gè)應(yīng)用,在這個(gè)過(guò)程中它會(huì)自動(dòng)確定你所在的位置,然后你通過(guò)語(yǔ)音開(kāi)始向其發(fā)出請(qǐng)求“我想在這附近找一家中式餐廳,下午將要與朋友一起就餐,消費(fèi)價(jià)格適中?!?br />應(yīng)用根據(jù)你發(fā)出的請(qǐng)求及過(guò)往的生活習(xí)慣為你尋找到數(shù)十家備選方案優(yōu)選列表,然后你可以根據(jù)興趣與愛(ài)好選擇直接確定方案,或者實(shí)時(shí)打開(kāi)查看各家的類型、折扣、評(píng)分、環(huán)境、位置、菜品、用戶評(píng)價(jià)等綜合信息并進(jìn)行篩選,這些信息綜合在一起形成了你對(duì)某家餐廳的判斷和最終的決策。
這時(shí)你可以就一些問(wèn)題與餐廳的服務(wù)人員進(jìn)行實(shí)時(shí)的溝通,然后交付押金輕松的進(jìn)行預(yù)訂。預(yù)訂好了餐廳之后,通過(guò)語(yǔ)音控制,你可以將信息轉(zhuǎn)發(fā)給朋友。當(dāng)你到了該出發(fā)赴約的時(shí)候,這個(gè)應(yīng)用開(kāi)始提醒你,并可以選擇是否開(kāi)啟地圖語(yǔ)音導(dǎo)航模式,為你提供位置和路線服務(wù)。
從 本質(zhì)上說(shuō),消費(fèi)者和商戶存在各自信息獲取不對(duì)稱的問(wèn)題,而O2O在于把服務(wù)業(yè)互聯(lián)網(wǎng)化,將商戶與消費(fèi)者之間連接的更好,讓信息不對(duì)稱的問(wèn)題都能解決,這不 僅能夠幫助商戶,也能夠幫助消費(fèi)者。消費(fèi)者對(duì)O2O的最大訴求主要是在前端信息的檢索和獲取,而商家的目的在于持續(xù)獲取消費(fèi)者,這主要通過(guò)前端提供消費(fèi)者 信息影響其購(gòu)買(mǎi)決策,并通過(guò)后期客戶管理增強(qiáng)與用戶關(guān)系。
互聯(lián)網(wǎng)的O2O商業(yè)模式氣勢(shì)洶洶的顛覆傳統(tǒng)行業(yè),似乎發(fā)展到現(xiàn)在好像開(kāi)始止步不前了。目前點(diǎn)評(píng)網(wǎng)站、地圖導(dǎo)航、預(yù)定網(wǎng)站、優(yōu)惠券網(wǎng)站等很好地滿足了消費(fèi)者信息獲取來(lái)源,但移動(dòng)搜索引擎卻未能很好滿足消費(fèi)者檢索的需求,使他們可以方便地查找餐廳以及優(yōu)惠地享受服務(wù)。
綜 合來(lái)看,未來(lái)的O2O會(huì)是一個(gè)融合線下信息聚合、語(yǔ)音識(shí)別、自然語(yǔ)言解析、搜索引擎、點(diǎn)評(píng)信息聚合、預(yù)訂服務(wù)、地圖導(dǎo)航、NFC、CRM、語(yǔ)音以及實(shí)時(shí)溝 通等功能為一體的基于位置的服務(wù)平臺(tái)。然而,至今仍然懸而未決的技術(shù)瓶頸是:自然語(yǔ)言的解析。如何通過(guò)對(duì)用戶的自然語(yǔ)言(文本+語(yǔ)音)等數(shù)據(jù),結(jié)合知識(shí)圖 譜,推理出用戶的需求并精準(zhǔn)的推送用戶所需的本地化生活服務(wù)?這扇大門(mén)的鑰匙也是在人工智能技術(shù)的突破!無(wú)人機(jī)尚不能自主飛行目前無(wú)人機(jī)雖然在軍事和民用領(lǐng)域都得到了應(yīng)用,但其智能化程度還遠(yuǎn)遠(yuǎn)不夠,仍然需要人遙控操縱,尚未實(shí)現(xiàn)自主飛行。設(shè)想一下你打開(kāi)家里的窗子,一架無(wú)人機(jī)恰巧停在窗外,你從無(wú)人機(jī)上取下自己購(gòu)買(mǎi)的物品,然后拿出手機(jī)確認(rèn)收到,無(wú)人機(jī)才緩緩飛走,去尋找下一個(gè)客戶。
或 者,下午你要去某咖啡館與客戶交流,恰巧有一個(gè)快遞要送來(lái)。你提前通知快遞公司,讓無(wú)人機(jī)指揮中心更改送貨路線,通知無(wú)人機(jī)將快遞送到咖啡館。物流體系使 用無(wú)人機(jī)取代人工,實(shí)現(xiàn)貨物派送的設(shè)想一旦實(shí)現(xiàn),將大大提高配送效率,減少人力、運(yùn)力成本,可以說(shuō)承載了人們對(duì)于未來(lái)物流的夢(mèng)想。但這一夢(mèng)想如果要得以實(shí) 現(xiàn),必須要使無(wú)人機(jī)具備感知和規(guī)劃的智能。
低 空以及在建筑物內(nèi)部飛行會(huì)遭遇很多的障礙物,即使預(yù)先設(shè)定飛行線路,也無(wú)法避免臨時(shí)出現(xiàn)的障礙(比如寫(xiě)字樓里突然關(guān)上的門(mén)),這就需要無(wú)人機(jī)具備視覺(jué)功 能、不確定性環(huán)境下的路線規(guī)劃以及行動(dòng)能力。此外,為保證準(zhǔn)確投遞,無(wú)人機(jī)或許還要具備人臉識(shí)別的能力,可以通過(guò)預(yù)先發(fā)送的照片識(shí)別出收貨人。這些感知、 規(guī)劃和行動(dòng)能力都屬于人工智能技術(shù)。智能化是工業(yè)4.0之魂第一次工業(yè)革命是隨著蒸汽機(jī)驅(qū)動(dòng)的機(jī)械制造設(shè)備的出現(xiàn);第二次工業(yè)革命是基于勞動(dòng)分工的,電力驅(qū)動(dòng)的大規(guī)模生產(chǎn);第三次工業(yè)革命是用電子和IT技術(shù)實(shí)現(xiàn)制造流程的進(jìn)一步自動(dòng)化;而如今,第四次工業(yè)革命正在來(lái)臨!
“工 業(yè)4.0”,是一個(gè)德國(guó)政府提出的高科技戰(zhàn)略計(jì)劃。這個(gè)概念包含了由集中式控制向分散式增強(qiáng)型控制的基本模式轉(zhuǎn)變,目標(biāo)是建立一個(gè)高度靈活的個(gè)性化和數(shù)字 化的產(chǎn)品與服務(wù)的生產(chǎn)模式。在這種模式中,傳統(tǒng)的行業(yè)界限將消失,并會(huì)產(chǎn)生各種新的活動(dòng)領(lǐng)域和合作形式。創(chuàng)造新價(jià)值的過(guò)程正在發(fā)生改變,產(chǎn)業(yè)鏈分工將被重 組。
從以上的描述中不難看出,工業(yè)4.0對(duì)智能化的要求涵蓋更廣,涉及機(jī)器感知、規(guī)劃、決策以及人機(jī)交互等方面,而這些領(lǐng)域都是人工智能技術(shù)的重點(diǎn)研究方向。人工智能技術(shù)“奇點(diǎn)”到來(lái)在 宇宙大爆炸理論中,“奇點(diǎn)”是指由爆炸而形成宇宙的那一點(diǎn),即宇宙從無(wú)到有的起點(diǎn)。而在美國(guó)著名科學(xué)家雷?庫(kù)茲韋爾(Ray?Kurzweil:發(fā)明了盲 人閱讀機(jī)、音樂(lè)合成器和語(yǔ)音識(shí)別系統(tǒng);獲9項(xiàng)名譽(yù)博士學(xué)位,2次總統(tǒng)榮譽(yù)獎(jiǎng);著有暢銷(xiāo)作品《奇點(diǎn)臨近》,現(xiàn)任奇點(diǎn)大學(xué)校長(zhǎng))的理論中,“奇點(diǎn)”是指電腦智 能與人腦智能相互融合的那個(gè)美妙時(shí)刻。我們認(rèn)為,這個(gè)美妙時(shí)刻正在到來(lái)。“ 什么是人工智能:從“smart”到“intelligent”目前市場(chǎng)上所謂“智能”的設(shè)備或概念很多,從智能手機(jī)到智能家居等,但這些“智能”實(shí)際上是“smart”的含義,即靈巧;真正意義上的智能應(yīng)該是“intelligent”的含義。
“人 工智能”一詞最初是在1956年達(dá)特茅斯學(xué)會(huì)上提出的。從學(xué)科定義上來(lái)說(shuō),人工智能(ArtificialIntelligence)是研究、開(kāi)發(fā)用于模 擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以 人類智能相似的方式做出反應(yīng)的智能機(jī)器。
人工智能的概念和定義有多種,下圖中沿兩個(gè)維度排列了AI的8種定義。頂部的定義關(guān)注思維過(guò)程和推理,而底部的定義強(qiáng)調(diào)行為。左側(cè)的定義根據(jù)與人類表現(xiàn)的逼真度來(lái)衡量成功與否,而右側(cè)的定義依靠一個(gè)稱為“合理性”(Rationality)的理想的表現(xiàn)量來(lái)衡量。如果從比較容易理解的角度來(lái)概括的話,人工智能是指計(jì)算機(jī)系統(tǒng)具備的能力,該能力可以履行原本只有依靠人類智慧才能完成的復(fù)雜任務(wù)。
人工智能的應(yīng)用領(lǐng)域主要包含以下幾個(gè)方面的內(nèi)容:自然語(yǔ)言處理(包括語(yǔ)音和語(yǔ)義識(shí)別、自動(dòng)翻譯)、計(jì)算機(jī)視覺(jué)(圖像識(shí)別)、知識(shí)表示、自動(dòng)推理(包括規(guī)劃和決策)、機(jī)器學(xué)習(xí)、機(jī)器人學(xué)“ 人腦的精密結(jié)構(gòu)難以復(fù)制,人工智能技術(shù)曾一度受阻超大規(guī)模并行結(jié)構(gòu)使得人腦功能強(qiáng)勁人類的大腦中有數(shù)百至上千億個(gè)神經(jīng)細(xì)胞(神經(jīng)元),而且每個(gè)神經(jīng)元都通過(guò)成千上萬(wàn)個(gè)“突觸”與其他神經(jīng)元相連,形成超級(jí)龐大和復(fù)雜的神經(jīng)元網(wǎng)絡(luò),以分布和并發(fā)的方式傳導(dǎo)信號(hào),相當(dāng)于超大規(guī)模的并行計(jì)算(Parallel Computing)。因此盡管單個(gè)神經(jīng)元傳導(dǎo)信號(hào)的速度很慢(每秒百米的級(jí)別,遠(yuǎn)低于計(jì)算機(jī)的CPU),但這種超大規(guī)模的并行計(jì)算結(jié)構(gòu)仍然使得人腦遠(yuǎn)超計(jì)算機(jī),成為世界上到目前為止最強(qiáng)大的信息處理系統(tǒng)。計(jì)算機(jī)的傳統(tǒng)結(jié)構(gòu)制約人工智能的發(fā)展美籍匈牙利科學(xué)家馮?諾依曼(John Von?Neumann)是數(shù)字計(jì)算機(jī)之父,首先提出了計(jì)算機(jī)體系結(jié)構(gòu)的設(shè)想,目前世界上絕大多數(shù)計(jì)算機(jī)都采取此種結(jié)構(gòu),它也被稱之為馮?諾依曼體系結(jié)構(gòu)。簡(jiǎn)單來(lái)說(shuō),馮?諾依曼體系結(jié)構(gòu)的基本特征有以下幾點(diǎn):
1、采用存儲(chǔ)程序方式,指令和數(shù)據(jù)不加區(qū)別混合存儲(chǔ)在同一個(gè)存儲(chǔ)器中,指令和數(shù)據(jù)都可以送到運(yùn)算器進(jìn)行運(yùn)算,即由指令組成的程序是可以修改的。2、存儲(chǔ)器是按地址訪問(wèn)的線性編址的一維結(jié)構(gòu),每個(gè)單元的位數(shù)是固定的。3、指令由操作碼和地址組成。操作碼指明本指令的操作類型,地址碼指明操作數(shù)和地址。操作數(shù)本身無(wú)數(shù)據(jù)類型的標(biāo)志,它的數(shù)據(jù)類型由操作碼確定。4、通過(guò)執(zhí)行指令直接發(fā)出控制信號(hào)控制計(jì)算機(jī)的操作。指令在存儲(chǔ)器中按其執(zhí)行順序存放,由指令計(jì)數(shù)器指明要執(zhí)行的指令所在的單元地址。指令計(jì)數(shù)器只有一個(gè),一般按順序遞增,但執(zhí)行順序可按運(yùn)算結(jié)果或當(dāng)時(shí)的外界條件而改變。5、以運(yùn)算器為中心,I/O設(shè)備與存儲(chǔ)器間的數(shù)據(jù)傳送都要經(jīng)過(guò)運(yùn)算器。6、數(shù)據(jù)以二進(jìn)制表示。人 工智能對(duì)計(jì)算機(jī)性能的要求很高,尤其是在非數(shù)值處理應(yīng)用領(lǐng)域。馮?諾依曼體系的串行結(jié)構(gòu)和人腦龐大復(fù)雜的并行結(jié)構(gòu)相去甚遠(yuǎn),使得現(xiàn)有計(jì)算機(jī)系統(tǒng)難以迅速有 效地處理復(fù)雜的感知、推理、決策等問(wèn)題。硬件體系能力的不足加上發(fā)展道路上曾經(jīng)出現(xiàn)偏差(希望直接在通用型的人工智能方面取得突破),以及算法的缺陷,使 得人工智能技術(shù)的發(fā)展在上世紀(jì)80年代末到90年代曾經(jīng)一度低迷。“ 四大催化劑齊備,人工智能發(fā)展迎來(lái)轉(zhuǎn)折點(diǎn)近幾年來(lái),隨著技術(shù)的進(jìn)步,人工智能的發(fā)展出現(xiàn)了顯著的復(fù)蘇趨勢(shì)。我們認(rèn)為,下述4個(gè)方面的原因帶來(lái)了人工智能發(fā)展的向上拐點(diǎn):云計(jì)算成本低廉的大規(guī)模并行計(jì)算實(shí)現(xiàn)上文中提到,馮?諾依曼體系的串行結(jié)構(gòu)使得計(jì)算機(jī)無(wú)法滿足人工智能對(duì)硬件的要求,而近年來(lái)云計(jì)算的出現(xiàn)至少部分解決了這個(gè)問(wèn)題。
從 概念上講,可把云計(jì)算看成是“存儲(chǔ)云+計(jì)算云”的有機(jī)結(jié)合,即“云計(jì)算=存儲(chǔ)云+計(jì)算云”。存儲(chǔ)云的基礎(chǔ)技術(shù)是分布存儲(chǔ),而計(jì)算云的基礎(chǔ)技術(shù)正是并行計(jì) 算:將大型的計(jì)算任務(wù)拆分,然后再派發(fā)到云中的各個(gè)節(jié)點(diǎn)進(jìn)行分布式的計(jì)算,最終再將結(jié)果收集后統(tǒng)一處理。大規(guī)模并行計(jì)算能力的實(shí)現(xiàn)使得人工智能往前邁進(jìn)了 一大步。
云 計(jì)算的實(shí)質(zhì)是一種基礎(chǔ)架構(gòu)管理的方法論,是把大量的計(jì)算資源組成IT資源池,用于動(dòng)態(tài)創(chuàng)建高度虛擬化的資源供用戶使用。在云計(jì)算環(huán)境下,所有的計(jì)算資源都 能夠動(dòng)態(tài)地從硬件基礎(chǔ)架構(gòu)上增減,以適應(yīng)工作任務(wù)的需求。云計(jì)算基礎(chǔ)架構(gòu)的本質(zhì)是通過(guò)整合、共享和動(dòng)態(tài)的硬件設(shè)備供應(yīng)來(lái)實(shí)現(xiàn)IT投資的利用率最大化,這就 使得使用云計(jì)算的單位成本大大降低,非常有利于人工智能的商業(yè)化運(yùn)營(yíng)。值得特別指出的是,近來(lái)基于GPU(圖形處理器)的云計(jì)算異軍突起,以遠(yuǎn)超CPU的并行計(jì)算能力獲得業(yè)界矚目。CPU 和GPU架構(gòu)差異很大,CPU功能模塊很多,能適應(yīng)復(fù)雜運(yùn)算環(huán)境;GPU構(gòu)成則相對(duì)簡(jiǎn)單,目前流處理器和顯存控制器占據(jù)了絕大部分晶體管。CPU中大部分 晶體管主要用于構(gòu)建控制電路(比如分支預(yù)測(cè)等)和高速緩沖存儲(chǔ)器(Cache),只有少部分的晶體管來(lái)完成實(shí)際的運(yùn)算工作;而GPU的控制相對(duì)簡(jiǎn)單,而且 對(duì)Cache的需求小,所以大部分晶體管可以組成各類專用電路、多條流水線,使得GPU的計(jì)算速度有了突破性的飛躍,擁有了驚人的處理浮點(diǎn)運(yùn)算的能力。現(xiàn) 在CPU的技術(shù)進(jìn)步正在慢于摩爾定律,而GPU的運(yùn)行速度已超過(guò)摩爾定律,每6個(gè)月其性能加倍。
CPU 的架構(gòu)是有利于X86指令集的串行架構(gòu),從設(shè)計(jì)思路上適合盡可能快的完成一個(gè)任務(wù);對(duì)于GPU來(lái)說(shuō),它最初的任務(wù)是在屏幕上合成顯示數(shù)百萬(wàn)個(gè)像素的圖像 ——也就是同時(shí)擁有幾百萬(wàn)個(gè)任務(wù)需要并行處理,因此GPU被設(shè)計(jì)成可并行處理很多任務(wù),天然具備了執(zhí)行大規(guī)模并行計(jì)算的優(yōu)勢(shì)。
現(xiàn) 在不僅谷歌、Netflix用GPU來(lái)搭建人工智能的神經(jīng)網(wǎng)絡(luò),F(xiàn)acebook、Amazon、Salesforce都擁有了基于GPU的云計(jì)算能力, 國(guó)內(nèi)的科大訊飛也采用了GPU集群支持自己的語(yǔ)音識(shí)別技術(shù)。GPU的這一優(yōu)勢(shì)被發(fā)現(xiàn)后,迅速承載起比之前的圖形處理更重要的使命:被用于人工智能的神經(jīng)網(wǎng) 絡(luò),使得神經(jīng)網(wǎng)絡(luò)能容納上億個(gè)節(jié)點(diǎn)間的連接。傳統(tǒng)的CPU集群需要數(shù)周才能計(jì)算出擁有1億節(jié)點(diǎn)的神經(jīng)網(wǎng)的級(jí)聯(lián)可能性,而一個(gè)GPU集群在一天內(nèi)就可完成同 一任務(wù),效率得到了極大的提升。另外,GPU隨著大規(guī)模生產(chǎn)帶來(lái)了價(jià)格下降,使其更能得到廣泛的商業(yè)化應(yīng)用。大數(shù)據(jù)訓(xùn)練有效提高人工智能水平機(jī)器學(xué)習(xí)是人工智能的核心和基礎(chǔ),是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域。該領(lǐng)域的頂級(jí)專家Alpaydin先生如此定義:“機(jī)器學(xué)習(xí)是用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)?!?br />





我們已經(jīng)進(jìn)入到大數(shù)據(jù)時(shí)代,來(lái)自全球的海量數(shù)據(jù)為人工智能的發(fā)展提供了良好的條件。
根據(jù)IDC的監(jiān)測(cè)統(tǒng)計(jì),2011年全球數(shù)據(jù)總量已經(jīng)達(dá)到1.8ZB(1ZB等于1萬(wàn)億GB,1.8ZB也就相當(dāng)于18億個(gè)1TB的移動(dòng)硬盤(pán),人均200GB,這些信息的量相當(dāng)于可以填充572億個(gè)32GB的iPad),而這個(gè)數(shù)值還在以每?jī)赡攴环乃俣仍鲩L(zhǎng),預(yù)計(jì)到2020年全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量,增長(zhǎng)近20倍?!吧疃葘W(xué)習(xí)”技術(shù)的出現(xiàn)“深度學(xué)習(xí)”是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,它模擬人類大腦神經(jīng)網(wǎng)絡(luò)的工作原理,將輸出的信號(hào)通過(guò)多層處理,將底層特征抽象為高層類別,它的目標(biāo)是更有效率、更精確地處理信息。深度學(xué)習(xí)自2006年由Geoffrey Hinton教授和他的兩個(gè)學(xué)生被提出后,使得機(jī)器學(xué)習(xí)有了突破性的進(jìn)展,極大地推動(dòng)了人工智能水平的提升。2013年,《麻省理工技術(shù)評(píng)論》把它列入年度十大技術(shù)突破之一。
人腦具有一個(gè)深度結(jié)構(gòu),認(rèn)知過(guò)程是逐步進(jìn)行,逐層抽象的,能夠?qū)哟位亟M織思想和概念。深度學(xué)習(xí)之所以有如此大的作用,正是因?yàn)樗^好地模擬了人腦這種“分層”和“抽象”的認(rèn)知和思考方式。
深度學(xué)習(xí)的實(shí)質(zhì),是通過(guò)構(gòu)建具有很多隱層的機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù),來(lái)學(xué)習(xí)更有用的特征,從而最終提升分類或預(yù)測(cè)的準(zhǔn)確性。因此,“深度模型”是手段,“特征學(xué)習(xí)”是目的。區(qū)別于傳統(tǒng)的淺層學(xué)習(xí),深度學(xué)習(xí)的不同在于:1)強(qiáng)調(diào)了模型結(jié)構(gòu)的深度,通常有5層、6層,甚至10多層的隱層節(jié)點(diǎn);2)明確突出了特征學(xué)習(xí)的重要性,也就是說(shuō),通過(guò)逐層特征變換,將樣本在原空間的特征表示變換到一個(gè)新特征空間,從而使分類或預(yù)測(cè)更加容易。與人工規(guī)則構(gòu)造特征的方法相比,利用大數(shù)據(jù)來(lái)學(xué)習(xí)特征,更能夠刻畫(huà)數(shù)據(jù)的豐富內(nèi)在信息。深度學(xué)習(xí)使得人工智能在幾個(gè)主要領(lǐng)域都獲得了突破性進(jìn)展:在語(yǔ)音識(shí)別領(lǐng)域,深度學(xué)習(xí)用深層模型替換聲學(xué)模型中的混合高斯模型(Gaussian Mixture Model, GMM),獲得了相對(duì)30%左右的錯(cuò)誤率降低;在圖像識(shí)別領(lǐng)域,通過(guò)構(gòu)造深度卷積神經(jīng)網(wǎng)絡(luò)(CNN),將Top5錯(cuò)誤率由26%大幅降低至15%,又通過(guò)加大加深網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)一步降低到11%;在自然語(yǔ)言處理領(lǐng)域,深度學(xué)習(xí)基本獲得了與其他方法水平相當(dāng)?shù)慕Y(jié)果,但可以免去繁瑣的特征提取步驟??梢哉f(shuō)到目前為止,深度學(xué)習(xí)是最接近人類大腦的智能學(xué)習(xí)方法。“人腦”芯片另一個(gè)方向打開(kāi)人工智能的大門(mén)前面提到了現(xiàn)代計(jì)算機(jī)的馮?諾依曼體系結(jié)構(gòu)阻礙了大規(guī)模并行計(jì)算的實(shí)現(xiàn),導(dǎo)致人工智能發(fā)展受限。而今天人工智能發(fā)展面臨突破,除了上文說(shuō)的云計(jì)算、大數(shù)據(jù)、深度學(xué)習(xí)三個(gè)原因之外,另外一個(gè)方向的努力也是不容忽視的,那就是徹底改變了馮?諾依曼體系結(jié)構(gòu)的“人腦”芯片。
“人腦”芯片,也叫神經(jīng)形態(tài)芯片,是從硬件方向?qū)θ四X物理結(jié)構(gòu)的模擬。這種芯片把數(shù)字處理器當(dāng)作神經(jīng)元,把內(nèi)存作為突觸,跟傳統(tǒng)?馮諾依曼結(jié)構(gòu)不一樣,它的內(nèi)存、CPU和通信部件是完全集成在一起,因此信息的處理完全在本地進(jìn)行。而且由于本地處理的數(shù)據(jù)量并不大,傳統(tǒng)計(jì)算機(jī)內(nèi)存與CPU之間的瓶頸不復(fù)存在了。同時(shí)神經(jīng)元之間可以方便快捷地相互溝通,只要接收到其他神經(jīng)元發(fā)過(guò)來(lái)的脈沖(動(dòng)作電位),這些神經(jīng)元就會(huì)同時(shí)做動(dòng)作。人工智能產(chǎn)業(yè)發(fā)展加速明顯技術(shù)“奇點(diǎn)”的到來(lái)使得人工智能發(fā)展明顯加速,這從產(chǎn)業(yè)層面能夠得到有力的佐證:我們已經(jīng)能夠看到IT業(yè)對(duì)人工智能的投入顯著加大,新型的應(yīng)用或產(chǎn)品也不斷問(wèn)世?!皣?guó)際IT巨頭頻頻放“大招”IT領(lǐng)域的國(guó)際巨頭近年來(lái)在人工智能領(lǐng)域頻頻發(fā)力,一方面網(wǎng)羅頂尖人才,一方面加大投資力度,這也昭示著人工智能新的春天已經(jīng)到來(lái)。
2013年3月,谷歌以重金收購(gòu)DNNresearch的方式請(qǐng)到了Geoffrey Hinton教授(上文提到的深度學(xué)習(xí)技術(shù)的發(fā)明者);2013年12月,F(xiàn)acebook成立了人工智能實(shí)驗(yàn)室,聘請(qǐng)了卷積神經(jīng)網(wǎng)絡(luò)最負(fù)盛名的研究者、紐約大學(xué)終身教授Yann LeCun為負(fù)責(zé)人;2014年5月,有“谷歌大腦之父”美稱的Andrew NG(吳恩達(dá))加盟百度,擔(dān)任首席科學(xué)家,負(fù)責(zé)百度研究院的領(lǐng)導(dǎo)工作,尤其是“百度大腦”計(jì)劃。這幾位人工智能領(lǐng)域泰斗級(jí)人物的加入,充分展示了這些互聯(lián)網(wǎng)巨頭對(duì)人工智能領(lǐng)域志在必得的決心。
根據(jù)量化分析公司Quid的數(shù)據(jù),自2009年以來(lái),人工智能已經(jīng)吸引了超過(guò)170億美元的投資。僅去年一年,就有322家擁有類似人工智能技術(shù)的公司獲得了超過(guò)20億美元的投資。自2013年以來(lái),Yahoo、Intel、Dropbox、LinkedIn、Pinterest以及Twitter也都收購(gòu)了人工智能公司。過(guò)去四年間,人工智能領(lǐng)域的民間投資以平均每年62%的增長(zhǎng)速率增加,這一速率預(yù)計(jì)還會(huì)持續(xù)下去。 “新的AI應(yīng)用和產(chǎn)品屢有驚喜自然語(yǔ)言處理(NLP)微軟SkypeTranslator同聲傳譯Skype Translator是由Skype和微軟機(jī)器翻譯團(tuán)隊(duì)聯(lián)合開(kāi)發(fā),整合了微軟Skype語(yǔ)音和聊天技術(shù)、機(jī)器翻譯技術(shù)、神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別打造了一款面向消費(fèi)者用戶的產(chǎn)品,2014年5月在微軟Code大會(huì)上推出。兩個(gè)不同語(yǔ)種的人借助SkypeTranslator可實(shí)現(xiàn)無(wú)障礙交談,當(dāng)你說(shuō)出一個(gè)完整的句子后,系統(tǒng)便會(huì)開(kāi)始進(jìn)行記錄翻譯,對(duì)方即可聽(tīng)到翻譯后的句子,并可通過(guò)字幕顯示在屏幕上。這個(gè)實(shí)時(shí)語(yǔ)音翻譯系統(tǒng)能夠識(shí)別不同用戶間的不同語(yǔ)言不同口音的說(shuō)話方式。
目前,Skype Translator還處在早期開(kāi)發(fā)階段,但這一實(shí)時(shí)語(yǔ)音翻譯功能有可能幫助改變世界未來(lái)的交流方式。比如在線教育,2014年12月,微軟正式推出了Skype Translator預(yù)覽版,讓來(lái)自美國(guó)和墨西哥的小學(xué)生使用各自母語(yǔ)就能進(jìn)行語(yǔ)音通話。它可以識(shí)別美國(guó)小學(xué)生的英文語(yǔ)句并將其翻譯為西班牙語(yǔ),然后以文本的形式呈獻(xiàn)給墨西哥小學(xué)生,反之亦然。微軟計(jì)劃將Skype Translator服務(wù)推向教育領(lǐng)域,如此一來(lái)全世界各地的學(xué)生都能無(wú)障礙聆聽(tīng)任何語(yǔ)言的課程,顯然這對(duì)于促進(jìn)全球教育進(jìn)步有著非比尋常的意義。計(jì)算機(jī)視覺(jué)(CV)1格靈深瞳的智能視頻監(jiān)控系統(tǒng)在安防領(lǐng)域,攝像頭已經(jīng)得到大規(guī)模的使用,但監(jiān)控的有效性依然面臨兩個(gè)嚴(yán)峻的挑戰(zhàn):1、 攝像頭只能起到記錄功能,識(shí)別還要依靠人眼,真正能實(shí)時(shí)監(jiān)控到的場(chǎng)景非常有限:一個(gè)像機(jī)場(chǎng)大小的公共場(chǎng)所,攝像頭的數(shù)量能夠達(dá)到幾萬(wàn)臺(tái),而同一時(shí)間負(fù)責(zé)監(jiān)控視頻的安保人員大概只有幾個(gè)人;此外,視頻監(jiān)控往往都采用畫(huà)面輪播機(jī)制,每過(guò)一定時(shí)間自動(dòng)切換屏幕上顯示的監(jiān)控視頻畫(huà)面。所以,那些真正有信息價(jià)值的畫(huà)面被人看到、注意到的幾率就很小。
2、 難以有效查詢歷史記錄。據(jù)估計(jì)全球監(jiān)控視頻記錄的存儲(chǔ)已經(jīng)消耗了75%的硬盤(pán)資源,以北京天安門(mén)為例,每天產(chǎn)生的監(jiān)控視頻數(shù)據(jù),刻成光盤(pán)摞起來(lái),甚至超過(guò)埃菲爾鐵塔的高度。要在如此龐大的數(shù)據(jù)庫(kù)里依靠人眼尋找某個(gè)特定畫(huà)面或犯罪嫌疑人,需要?jiǎng)佑么罅康?a target="_blank" style="color: black;" >人力資源,并且效率低下。
格靈深瞳是一家專注于開(kāi)發(fā)計(jì)算機(jī)視覺(jué)的人工智能公司,致力于讓計(jì)算機(jī)像人一樣主動(dòng)獲取視覺(jué)信息并進(jìn)行精確的實(shí)時(shí)分析。公司成立于2013年初,創(chuàng)始人為Google眼鏡的核心團(tuán)隊(duì)成員,成立不久就獲得真格基金和聯(lián)創(chuàng)策源的天使投資,并于2014年6月獲得紅杉資本數(shù)千萬(wàn)美元的A輪投資。
格靈深瞳通過(guò)研發(fā)三維視覺(jué)感知技術(shù),實(shí)現(xiàn)對(duì)人物的精確檢測(cè)、跟蹤,對(duì)動(dòng)作姿態(tài)(包括暴力、跌倒等危險(xiǎn)行為)和人物運(yùn)動(dòng)軌跡(包括越界、逆行、徘徊等可疑軌跡)的檢測(cè)和分析。在自動(dòng)場(chǎng)景和人物檢測(cè)的基礎(chǔ)上,自動(dòng)給安保人員提供預(yù)警信號(hào),主動(dòng)提醒、報(bào)告異常,保障安保人員“看得到”。同時(shí),格靈深瞳利用感知技術(shù)抽象出人物的特征,從非時(shí)間的維度進(jìn)行監(jiān)測(cè)、跟蹤、搜索,真正做到“找得到”。目前格靈深瞳的視頻監(jiān)控系統(tǒng)已經(jīng)在對(duì)安防要求較高的銀行進(jìn)行應(yīng)用測(cè)試。如果該技術(shù)投入大規(guī)模商業(yè)化應(yīng)用,將有效改善上文提到的現(xiàn)有視頻監(jiān)控的缺陷,是人工智能改變世界邁出的非常積極的一步。2Face++的人臉識(shí)別云服務(wù)Face++是一個(gè)人臉識(shí)別云服務(wù)平臺(tái),通過(guò)它提供的開(kāi)放服務(wù),開(kāi)發(fā)者可以低成本的在自己的產(chǎn)品中實(shí)現(xiàn)若干面部識(shí)別功能。開(kāi)發(fā)者和合作方通過(guò)Face++提供的API接入和離線引擎就可以享受現(xiàn)成的人臉檢測(cè)、分析和識(shí)別等服務(wù)。Face++人臉識(shí)別技術(shù)主要有以下幾種基本功能:1)人臉檢測(cè):從圖片中快速、準(zhǔn)確的找到所有的或者有某些特征的臉。2)人臉?lè)治觯和ㄟ^(guò)人臉,對(duì)人的性別、年齡、情緒的信息進(jìn)行提取。3)人臉識(shí)別:匹配給定人臉的相似性,或者從成萬(wàn)上億的人臉資料庫(kù)中搜索、返回最相似的人臉?biāo)饕?br />Face++為美圖秀秀、美顏相機(jī)App提供諸如:人臉檢測(cè)、人臉追蹤、關(guān)鍵點(diǎn)檢測(cè)技術(shù),可精準(zhǔn)定位人臉中需要美化的位置,實(shí)現(xiàn)精準(zhǔn)自動(dòng)人臉美化,但這些僅是人臉識(shí)別的初級(jí)階段。此外在稍高級(jí)的應(yīng)用階段——搜索領(lǐng)域,F(xiàn)ace++所做的人臉識(shí)別為世紀(jì)佳緣提供服務(wù),用戶可根據(jù)自己對(duì)另一半長(zhǎng)相的需求去搜索相似外貌的用戶,當(dāng)然這個(gè)搜索需要在數(shù)據(jù)庫(kù)中進(jìn)行,可以是世紀(jì)佳緣的數(shù)據(jù)庫(kù)、未來(lái)可以是社交網(wǎng)絡(luò)上的數(shù)據(jù)庫(kù)、更可以是在通用搜索引擎中。
第二個(gè)是Face++與360搜索達(dá)成了合作,在360的圖片搜索中使用到相關(guān)的技術(shù)。而在另一塊安全領(lǐng)域,F(xiàn)ace++推出了APP“云臉應(yīng)用鎖”,掃描一下人臉和設(shè)置一下備用密碼,就可以將需要加密的應(yīng)用添加到需要保護(hù)的應(yīng)用程序中。這樣打開(kāi)加密的應(yīng)用時(shí),就要事先經(jīng)過(guò)一個(gè)人臉識(shí)別的監(jiān)測(cè),才能成功打開(kāi)此應(yīng)用。非常適合于圖片、信息、支付軟件等等擁有私密信息較高的應(yīng)用程序當(dāng)中。知識(shí)表示、規(guī)劃和決策1Palantir:CIA的反恐秘密武器大數(shù)據(jù)挖掘分析公司Palantir成立于2004年,該平臺(tái)把人工智能算法和強(qiáng)大的引擎(可以同時(shí)掃描多個(gè)數(shù)據(jù)庫(kù))整合,可以同時(shí)處理大量數(shù)據(jù)庫(kù),并允許用戶通過(guò)多種方式快速瀏覽相關(guān)信息。其產(chǎn)品已被美國(guó)中情局(CIA)、聯(lián)邦調(diào)查局(FBI)、海陸空三軍、聯(lián)邦檢察官、私人調(diào)查機(jī)構(gòu)及其他客戶所使用。
類似CIA和FBI這樣的情報(bào)機(jī)構(gòu)有成千上萬(wàn)個(gè)數(shù)據(jù)庫(kù),并記錄著不同的數(shù)據(jù),比如財(cái)務(wù)數(shù)據(jù)、DNA樣本、語(yǔ)音資料、錄像片段以及世界各地的地圖。將這些數(shù)據(jù)建立聯(lián)系需要數(shù)年的時(shí)間,即便統(tǒng)一在一起,也很難駕馭不同種類的數(shù)據(jù),比如說(shuō)如何關(guān)聯(lián)銷(xiāo)售數(shù)據(jù)和監(jiān)控錄像資料,而Palantir公司所做的就是開(kāi)發(fā)軟件使這一切變得更容易。同時(shí),Palantir還對(duì)各種安全問(wèn)題高度敏感。
Palantir引發(fā)了計(jì)算機(jī)時(shí)代的一場(chǎng)革命,它梳理所有可以獲得的數(shù)據(jù)庫(kù),對(duì)相關(guān)信息進(jìn)行確認(rèn),并他們整合起來(lái)。Palantir成立之初就獲的CIA基金公司In-Q-Tel的投資,現(xiàn)在成為了美國(guó)情報(bào)機(jī)關(guān)在反恐戰(zhàn)爭(zhēng)不能缺少的工具。Palantir有效的解決了911后對(duì)情報(bào)工作提出的技術(shù)難題:如何從大量的數(shù)據(jù)中快速獲取有價(jià)值的線索,可以說(shuō)是CIA的反恐秘密武器。
Palantir公司相當(dāng)?shù)驼{(diào),但非常受政府情報(bào)機(jī)關(guān)和華爾街的熱捧。除了反恐,其關(guān)注重點(diǎn)也開(kāi)始轉(zhuǎn)向醫(yī)療、零售、保險(xiǎn)和生物科技,比如利用Palantir可以偵查醫(yī)療保險(xiǎn)詐騙以及發(fā)現(xiàn)病毒爆發(fā)的源頭?,F(xiàn)在,Palantir年收入已超過(guò)10億美元,并且每年以3倍的速度增長(zhǎng)。2IBM Watson:認(rèn)知能力強(qiáng)勁Watson由90臺(tái)IBM服務(wù)器、360個(gè)計(jì)算機(jī)芯片驅(qū)動(dòng)組成,是一個(gè)有10臺(tái)普通冰箱那么大的計(jì)算機(jī)系統(tǒng)。它擁有15TB內(nèi)存、2880個(gè)處理器、每秒可進(jìn)行80萬(wàn)億次運(yùn)算。IBM為沃森配置的處理器是Power 7系列處理器,這是當(dāng)前RISC(精簡(jiǎn)指令集計(jì)算機(jī))架構(gòu)中最強(qiáng)的處理器。
Watson存儲(chǔ)了大量圖書(shū)、新聞和電影劇本資料、辭海、文選和《世界圖書(shū)百科全書(shū)》等數(shù)百萬(wàn)份資料。每當(dāng)讀完問(wèn)題的提示后,Watson就在不到三秒鐘的時(shí)間里對(duì)自己長(zhǎng)達(dá)2億頁(yè)的料里展開(kāi)搜索。Watson是基于IBM“DeepQA”(深度開(kāi)放域問(wèn)答系統(tǒng)工程)技術(shù)開(kāi)發(fā)的,DeepQA技術(shù)可以讀取數(shù)百萬(wàn)頁(yè)文本數(shù)據(jù),利用深度自然語(yǔ)言處理技術(shù)產(chǎn)生候選答案,根據(jù)諸多不同尺度評(píng)估那些問(wèn)題。
IBM研發(fā)團(tuán)隊(duì)為Watson開(kāi)發(fā)的100多套算法可以在3秒內(nèi)解析問(wèn)題,檢索數(shù)百萬(wàn)條信息然后再篩選還原成“答案”輸出成人類語(yǔ)言。每一種算法都有其專門(mén)的功能。
IBM公司自2006年開(kāi)始研發(fā)沃森,并在2011年2月的《危險(xiǎn)地帶》(Jeopardy?。┲橇尨鹩螒蛑幸粦?zhàn)成名后,其商業(yè)化應(yīng)用有著清晰的脈絡(luò):2011年8月沃森開(kāi)始應(yīng)用于醫(yī)療領(lǐng)域;2012年3月,沃森則首次應(yīng)用于金融領(lǐng)域,花旗集團(tuán)成為了沃森的首位金融客戶,沃森幫助花旗分析用戶的需求,處理金融經(jīng)濟(jì)和用戶數(shù)據(jù)以及實(shí)現(xiàn)數(shù)字銀行的個(gè)性化,并幫助金融機(jī)構(gòu)找出行業(yè)專家可能忽略的風(fēng)險(xiǎn)、收益以及客戶需求。美國(guó)農(nóng)業(yè)銀行信貸證券公司的一份研究報(bào)告中預(yù)測(cè),Watson在2015年將為IBM帶來(lái)26.5億美元的收入。
例如在醫(yī)療領(lǐng)域,Watson已收錄了腫瘤學(xué)研究領(lǐng)域的42種醫(yī)學(xué)期刊、臨床試驗(yàn)的60多萬(wàn)條醫(yī)療證據(jù)和200萬(wàn)頁(yè)文本資料。Watson能夠在幾秒之內(nèi)篩選數(shù)十年癌癥治療歷史中的150萬(wàn)份患者記錄,包括病歷和患者治療結(jié)果,并為醫(yī)生提供可供選擇的循證治療方案。目前癌癥治療領(lǐng)域排名前三的醫(yī)院都在運(yùn)行Watson。研究表明,醫(yī)療信息數(shù)據(jù)正以每五年翻番的高速度增長(zhǎng)。這為將下一代認(rèn)知計(jì)算系統(tǒng)運(yùn)用于醫(yī)療行業(yè)以改善醫(yī)學(xué)的教學(xué)、實(shí)踐和支付模式提供了史無(wú)前例的商機(jī)。人工智能生態(tài)格局展望巨頭與新貴共舞“人工智能將催生新一輪IT商業(yè)模式創(chuàng)新自從PC互聯(lián)網(wǎng)時(shí)代以來(lái),到移動(dòng)互聯(lián)網(wǎng),再到智能硬件時(shí)代,技術(shù)發(fā)展和商業(yè)模式創(chuàng)新一直處于相輔相成的狀態(tài)中,一旦技術(shù)進(jìn)步的紅利被商業(yè)模式創(chuàng)新挖掘殆盡后,面臨泡沫破裂的風(fēng)險(xiǎn),直到下一輪技術(shù)革命浪潮再來(lái),商業(yè)模式創(chuàng)新才會(huì)春風(fēng)吹又生。
我們認(rèn)為,移動(dòng)互聯(lián)網(wǎng)時(shí)代,萬(wàn)物互聯(lián)催生出了海量的數(shù)據(jù),觸摸屏的交互方式已經(jīng)滿足不了用戶多元化的輸入方式,商業(yè)模式創(chuàng)新已經(jīng)遭遇了技術(shù)無(wú)法支撐的瓶頸,如果人工智能技術(shù)突破,無(wú)疑將催生出新的商業(yè)模式,帶來(lái)巨大的市場(chǎng)想象空間。








現(xiàn)階段移動(dòng)互聯(lián)網(wǎng)的商業(yè)模式創(chuàng)新已經(jīng)將web2.0時(shí)代的技術(shù)紅利消耗殆盡,未來(lái)新的商業(yè)模式的開(kāi)發(fā)需要技術(shù)進(jìn)步的支撐,人工智能是重要的技術(shù)突破點(diǎn)。“AI產(chǎn)業(yè)格局成形的路徑:“底層—中層—頂層”的生態(tài)圈逐步清晰人工智能發(fā)展的拐點(diǎn)已經(jīng)到來(lái),但需要指出的是,由于技術(shù)的復(fù)雜性,發(fā)展不會(huì)一蹴而就,必然經(jīng)歷一個(gè)由點(diǎn)到面,由專用領(lǐng)域(domain)到通用領(lǐng)域(general purpose)的歷程,通用領(lǐng)域的人工智能實(shí)現(xiàn)還比較遙遠(yuǎn)。
我們以計(jì)算機(jī)視覺(jué)的應(yīng)用為例,正常的成年人可以很容易地識(shí)別照片或視頻里的多種場(chǎng)景和人、物,但對(duì)于計(jì)算機(jī)來(lái)說(shuō)還難以做到。原因是識(shí)別是一個(gè)特征抽取的過(guò)程,而特征抽取是建立在識(shí)別模型的基礎(chǔ)之上的,要做到通用識(shí)別,則必須對(duì)世間萬(wàn)物都建立一一對(duì)應(yīng)的模型,工作量極大。而即使是同一事物,由于光線、角度、距離的原因,在不同的場(chǎng)景里也會(huì)呈現(xiàn)出很大的差異,這進(jìn)一步增加了建立識(shí)別模型的難度。
短期內(nèi)計(jì)算機(jī)的運(yùn)算能力(即使是超級(jí)運(yùn)算平臺(tái))還難以望人腦視覺(jué)中樞的項(xiàng)背,因此無(wú)法達(dá)成這一愿景。
在未來(lái)5-10年之內(nèi),專用領(lǐng)域的定向智能化將是AI主要的應(yīng)用發(fā)展方向。在更遠(yuǎn)的將來(lái),如果人腦芯片等硬件架構(gòu)能有所突破,運(yùn)算能力有極大提高,則專用智能將逐步進(jìn)化成為跨場(chǎng)景跨下游應(yīng)用的通用智能。而AI的生態(tài)格局,無(wú)論是專用還是通用領(lǐng)域,我們認(rèn)為都將圍繞“底層-中層-頂層”的技術(shù)和產(chǎn)品架構(gòu)逐漸成形。
人工智能產(chǎn)業(yè)生態(tài)格局的三層基本架構(gòu)如下:底層為基礎(chǔ)資源支持層,由運(yùn)算平臺(tái)和數(shù)據(jù)工廠組成;中層為AI技術(shù)層,通過(guò)不同類型的算法建立模型,形成有效的可供應(yīng)用的技術(shù);頂層為AI應(yīng)用層,利用中層輸出的AI技術(shù)為用戶提供智能化的服務(wù)和產(chǎn)品。每一層架構(gòu)中,都有不同的企業(yè)參與,最終形成圍繞AI技術(shù),產(chǎn)品和服務(wù)的生態(tài)圈。 “專用領(lǐng)域人工智能生態(tài)圈的格局基礎(chǔ)資源支持層實(shí)現(xiàn)路徑運(yùn)算平臺(tái)+數(shù)據(jù)工廠基礎(chǔ)資源支持層通過(guò)部署大規(guī)模GPU與CPU并行計(jì)算構(gòu)成的云計(jì)算資源池(定義為超級(jí)運(yùn)算平臺(tái))來(lái)解決AI所需要的超強(qiáng)存儲(chǔ)和運(yùn)算處理能力問(wèn)題,并輔以能夠抓取到匯聚了人類智慧的海量信息的大數(shù)據(jù)工廠作為數(shù)據(jù)集,為AI技術(shù)層的實(shí)現(xiàn)提供有利支持。
超算平臺(tái)負(fù)責(zé)存儲(chǔ)與運(yùn)算。人類沒(méi)有記憶就沒(méi)有關(guān)聯(lián),也更不用說(shuō)決策與創(chuàng)造,而構(gòu)成記憶的基礎(chǔ)正是有極大存儲(chǔ)能力的腦容量,那么機(jī)器要模仿人腦也必然首先要擁有龐大的存儲(chǔ)能力,海量數(shù)據(jù)的積累最終讓機(jī)器的“存儲(chǔ)”形成類似于人類的“記憶”。
百度在發(fā)展人工智能的道路上,首先做的也是不斷擴(kuò)大其存儲(chǔ)能力。除了存儲(chǔ)的絕對(duì)容量之外,運(yùn)算處理能力是第二個(gè)需要提升的硬實(shí)力。
運(yùn)算處理能力有兩個(gè)方面,第一是服務(wù)器規(guī)模,第二是特征向量大小。所謂特征向量簡(jiǎn)單理解的話就是指將文本語(yǔ)音圖像視頻等內(nèi)容轉(zhuǎn)化為機(jī)器能夠讀懂的一連串關(guān)鍵數(shù)據(jù),數(shù)據(jù)越多,機(jī)器學(xué)習(xí)的就會(huì)越好,但對(duì)服務(wù)器的壓力也會(huì)相應(yīng)加大。百度能夠僅用兩年時(shí)間從10萬(wàn)特征向量直接飆升到200億,足以見(jiàn)得百度服務(wù)器技術(shù)實(shí)力的雄厚。在這個(gè)過(guò)程中,還需要解決大規(guī)模GPU和CPU并行計(jì)算所帶來(lái)的錯(cuò)誤率提升以及散熱難度加大等問(wèn)題,因此,是否能夠搭建超算平臺(tái)成為了人工智能企業(yè)的重要進(jìn)入門(mén)檻。
數(shù)據(jù)工廠實(shí)現(xiàn)分類與關(guān)聯(lián)。數(shù)據(jù)工廠會(huì)對(duì)數(shù)據(jù)進(jìn)行基礎(chǔ)性的加工,而這種加工又非常關(guān)鍵。從人類的記憶聯(lián)想模式分析,要調(diào)取某部分的記憶,就會(huì)很自然的聯(lián)想到某個(gè)詞,某個(gè)畫(huà)面,某個(gè)音樂(lè)等等就能記起很多事情。這是因?yàn)槿祟惔竽X的神經(jīng)連接結(jié)構(gòu)允許我們這樣去檢索,而機(jī)器是不允許的,數(shù)據(jù)存儲(chǔ)在硬盤(pán)上,機(jī)器想要找到某個(gè)數(shù)據(jù),必須一個(gè)個(gè)訪問(wèn)過(guò)去,機(jī)器沒(méi)有分類的概念。
如果需要機(jī)器理解用戶的語(yǔ)言,這種搜索技術(shù)也依然要機(jī)器的大腦配合才能達(dá)到,對(duì)每一個(gè)詞的定義應(yīng)該是一個(gè)庫(kù),而這個(gè)庫(kù)中的每一個(gè)詞又都各自構(gòu)成庫(kù),數(shù)據(jù)工廠所依托的搜索算法,就是在這么一個(gè)數(shù)據(jù)海洋中去為他們建立管理,然后去索引。數(shù)據(jù)工廠相當(dāng)于人腦中的記憶關(guān)聯(lián)過(guò)程:將某個(gè)詞同時(shí)與其他詞或是某個(gè)場(chǎng)景等等建立起動(dòng)態(tài)關(guān)聯(lián)的過(guò)程。
因此,通過(guò)數(shù)據(jù)挖掘和搜索算法對(duì)數(shù)據(jù)工廠中的知識(shí)庫(kù)和信息庫(kù)進(jìn)行分類與關(guān)聯(lián)的技術(shù)能力同樣是人工智能企業(yè)的重要進(jìn)入門(mén)檻。AI技術(shù)層實(shí)現(xiàn)路徑面向特定場(chǎng)景的智能技術(shù)多姿多彩AI技術(shù)層的作用是基于底層提供的計(jì)算存儲(chǔ)資源和大數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)建模,開(kāi)發(fā)面向不同領(lǐng)域的應(yīng)用技術(shù),例如語(yǔ)音識(shí)別、語(yǔ)義識(shí)別和計(jì)算機(jī)視覺(jué)等。
中間層的運(yùn)行機(jī)制和人類的思維形成過(guò)程高度相似,是從感知到思考再到最終的決策行動(dòng)甚至是創(chuàng)造,核心是機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用。
首先,感知環(huán)節(jié)需要連接的是人、信息和物理世界,通過(guò)傳感器,搜索引擎和人機(jī)交互來(lái)獲取建模必須的數(shù)據(jù),相當(dāng)于人類的感知過(guò)程。依托于底層的高性能計(jì)算和彈性存儲(chǔ)能力,中間層對(duì)感知到的數(shù)據(jù)進(jìn)行建模運(yùn)算,相當(dāng)于人類的思考過(guò)程。最終,應(yīng)用層利用數(shù)據(jù)擬合出的模型結(jié)果,對(duì)智能應(yīng)用的服務(wù)和產(chǎn)品端輸出指令,指揮包括機(jī)器人、無(wú)人機(jī)、3D打印等在內(nèi)的各種設(shè)備響應(yīng)用戶需求。盡管目前由于思考層面的計(jì)算存儲(chǔ)能力和建模能力的不足,導(dǎo)致人工智能還無(wú)法達(dá)到和人類相接近的“智慧”程度,但也足以支撐包括語(yǔ)音識(shí)別、圖像識(shí)別和知識(shí)圖譜在內(nèi)的各種AI技術(shù)在特定場(chǎng)景下的應(yīng)用。另外一方面,在具體的應(yīng)用場(chǎng)景中,更為優(yōu)化的算法和更為準(zhǔn)確的背景知識(shí)庫(kù)數(shù)據(jù)集等因素都有助于在不提升計(jì)算資源的前提下實(shí)現(xiàn)更優(yōu)的結(jié)果。這就給眾多專業(yè)領(lǐng)域的AI公司帶來(lái)了巨大的市場(chǎng)機(jī)遇。
我們看到,專用智能的商業(yè)化應(yīng)用風(fēng)生水起,在這個(gè)領(lǐng)域,巨頭和新貴都處于同一起跑線上,產(chǎn)業(yè)格局會(huì)趨于分散,先入者優(yōu)勢(shì)明顯。我們判斷,在數(shù)據(jù)、算法、云計(jì)算資源等幾個(gè)關(guān)鍵因素中,數(shù)據(jù)的獲得以及算法的優(yōu)化是先入者的護(hù)城河,能夠幫助他們?cè)趯S妙I(lǐng)域的特定場(chǎng)景下,迅速實(shí)現(xiàn)AI的商業(yè)化應(yīng)用,從而搶占市場(chǎng)。我們關(guān)注到國(guó)內(nèi)市場(chǎng)已經(jīng)出現(xiàn)了這樣的局面:語(yǔ)音識(shí)別領(lǐng)域的科大訊飛、計(jì)算機(jī)視覺(jué)方面的格林深瞳、語(yǔ)義識(shí)別方面的小i機(jī)器人、人臉識(shí)別方面的face++等等細(xì)分行業(yè)龍頭,都在具體應(yīng)用場(chǎng)景的技術(shù)結(jié)果上,實(shí)現(xiàn)了對(duì)百度、谷歌、微軟和IBM等AI巨頭的超越。








AI應(yīng)用層實(shí)現(xiàn)路徑以Nest為代表的專用智能產(chǎn)品和服務(wù)風(fēng)起云涌專用智能的應(yīng)用水平不斷提升將推進(jìn)智能產(chǎn)品和服務(wù)的智能化程度。為了能夠滿足用戶需求,智能產(chǎn)品和服務(wù)需要多種不同的AI技術(shù)支撐:
(1) 谷歌的無(wú)人駕駛汽車(chē),在駕駛過(guò)程中需要計(jì)算機(jī)視覺(jué)對(duì)不同路況做出相應(yīng)的決策。為了實(shí)現(xiàn)無(wú)人駕駛,車(chē)輛需要配置激光測(cè)距系統(tǒng)、車(chē)道保持系統(tǒng)、GPS/慣性導(dǎo)航系統(tǒng)、車(chē)輪角度編碼器等設(shè)備,通過(guò)收集到的數(shù)據(jù)實(shí)時(shí)生成前方路面的三維圖像,并用計(jì)算機(jī)視覺(jué)技術(shù)判斷潛在的風(fēng)險(xiǎn)。毫無(wú)疑問(wèn),脫離了谷歌大腦的計(jì)算機(jī)視覺(jué)技術(shù)的支撐,谷歌無(wú)人駕駛應(yīng)用就是空中樓閣。
(2) 再以Nest的智能溫控技術(shù)為例。為了能夠通過(guò)不斷地觀測(cè)和學(xué)習(xí)用戶習(xí)慣的舒適溫度來(lái)對(duì)室溫進(jìn)行動(dòng)態(tài)調(diào)整,并節(jié)約能源,Nest安裝了六個(gè)傳感器,不停地對(duì)溫度、濕度、環(huán)境光以及設(shè)備周邊進(jìn)行監(jiān)控和衡量,它能判斷房間中是否有人,以決定是否自動(dòng)關(guān)閉調(diào)溫設(shè)備。依托于強(qiáng)大的機(jī)器學(xué)習(xí)算法,Nest則能自己學(xué)習(xí)控制溫度。在使用這款調(diào)溫器的第一個(gè)星期,用戶可以根據(jù)自己的喜好調(diào)節(jié)室內(nèi)溫度,此時(shí)Nest便會(huì)記錄并學(xué)習(xí)用戶的使用習(xí)慣。為了能讓居室變得更舒適,Nest還會(huì)通過(guò)Wi-Fi和相關(guān)應(yīng)用程序與室外的實(shí)時(shí)溫度進(jìn)行同步,內(nèi)置的濕度傳感器還能讓空調(diào)和新風(fēng)系統(tǒng)提供適宜的氣流。當(dāng)用戶外出時(shí),Nest的動(dòng)作傳感器就會(huì)通知處理器激活“外出模式”。毫無(wú)疑問(wèn),脫離了深度學(xué)習(xí)技術(shù)的支撐,Nest的智能溫控是無(wú)法實(shí)現(xiàn)的。
(3) 微信朋友圈的推送廣告服務(wù)。微信朋友圈的信息流(Feeds)廣告推送基于自然語(yǔ)言解析、圖像識(shí)別和數(shù)據(jù)挖掘技術(shù),通過(guò)分析用戶朋友圈語(yǔ)言特性,以及朋友圈圖片內(nèi)容,根據(jù)對(duì)用戶收入和消費(fèi)能力的分析來(lái)刻畫(huà)用戶畫(huà)像,并決定投放何種廣告。信息流廣告與社交平臺(tái)上好友發(fā)布的信息形式類似,廣告本身內(nèi)容將基于微信公眾賬號(hào)生態(tài)體系,以類似朋友圈的原創(chuàng)內(nèi)容形式進(jìn)行展現(xiàn),融合在信息流中,在基于微信用戶畫(huà)像記性定向的同時(shí),通過(guò)實(shí)時(shí)社交的混排算法,依托關(guān)系鏈進(jìn)行互動(dòng)傳播。如果沒(méi)有自然語(yǔ)言解析和圖像識(shí)別等AI技術(shù)的支撐,微信的信息流廣告推送服務(wù)的用戶體驗(yàn)將大打折扣。通過(guò)以上三個(gè)例子,我們不難看出,智能產(chǎn)品和服務(wù)是否能夠切中用戶的痛點(diǎn)需求,依賴于人工智能技術(shù)在產(chǎn)品背后能夠給予多大的支撐。當(dāng)前的智能產(chǎn)品市場(chǎng)之所以出現(xiàn)產(chǎn)品熱,需求冷的局面,主要的癥結(jié)在于所謂的智能硬件大多是“偽智能”產(chǎn)品,只是把功能性電子產(chǎn)品加上聯(lián)網(wǎng)和搜集數(shù)據(jù)的功能,例如以手環(huán)為代表的可穿戴設(shè)備,以智能機(jī)頂盒為代表的智能家居設(shè)備等等。我們認(rèn)為,殺手級(jí)的智能產(chǎn)品和服務(wù)必然是建立在強(qiáng)大的AI技術(shù)支撐下的。AI具體應(yīng)用層應(yīng)該是以Nest及更為先進(jìn)的智能產(chǎn)品和服務(wù)為代表。我們梳理了當(dāng)前智能產(chǎn)品和服務(wù)產(chǎn)業(yè)鏈上主要參與公司,典型的戰(zhàn)略布局分別有:
(a)以海爾和美的為代表的家電企業(yè)轉(zhuǎn)型智能家居方向;(b)以小米和360為代表的互聯(lián)網(wǎng)新貴從硬件入口開(kāi)始卡位;(c)以百度和谷歌為代表的互聯(lián)網(wǎng)巨頭從AI技術(shù)發(fā)力打造生態(tài)圈;(d)以海康威視和大疆創(chuàng)新為代表的計(jì)算機(jī)硬件制造商轉(zhuǎn)型智能硬件的行業(yè)應(yīng)用。


未來(lái)跨場(chǎng)景通用人工智能生態(tài)圈的格局


 “基礎(chǔ)資源支持層實(shí)現(xiàn)路徑:顛覆馮?諾依曼架構(gòu)人腦芯片等技術(shù)將突破計(jì)算能力極限未來(lái)的人工智能將致力于通過(guò)底層硬件架構(gòu)的變革來(lái)實(shí)現(xiàn)。不同于現(xiàn)階段底層對(duì)云計(jì)算的依賴,硬件模式將直接從芯片層面實(shí)現(xiàn)對(duì)人工神經(jīng)網(wǎng)絡(luò)的模擬,目標(biāo)是構(gòu)建一個(gè)硬件大腦。我們認(rèn)為,這種突破將是下一代計(jì)算機(jī)科學(xué)的發(fā)展的重要方向。
因?yàn)樽罱?0年計(jì)算機(jī)科學(xué)更多關(guān)注的技術(shù)進(jìn)步在于信息處理的標(biāo)的這一層面,可以稱之為“大數(shù)據(jù)”或者“數(shù)據(jù)大爆炸”時(shí)代。在不遠(yuǎn)的未來(lái),數(shù)據(jù)大爆炸造成的結(jié)果是信息處理能力的瓶頸很快達(dá)到,因此,未來(lái)10年計(jì)算機(jī)科學(xué)的關(guān)注點(diǎn)將會(huì)轉(zhuǎn)移到如何突破現(xiàn)階段的計(jì)算能力極限,也就是顛覆馮?諾依曼的硬件架構(gòu)。這個(gè)方向可能是AI在硬件設(shè)備上的一個(gè)終極解決方案,但從目前的技術(shù)成熟度上看,這條路徑距離目標(biāo)還有非常遙遠(yuǎn)的距離。目前已經(jīng)看到的方向大致有以下三種:
(1) 人腦芯片。2014年8月,IBM宣布研制成功了一款大腦原型芯片TrueNorth,主攻超級(jí)計(jì)算機(jī)專業(yè)學(xué)習(xí)領(lǐng)域。TrueNorth微芯片由三星電子為IBM生產(chǎn),使用了三星為生產(chǎn)智能機(jī)和其它移動(dòng)設(shè)備微處理器所使用的相同制造技術(shù)。IBM就該芯片的底層設(shè)計(jì)與紐約康奈爾大學(xué)(Cornell University)紐約校區(qū)的研究人員進(jìn)行了合作。自2008年以來(lái),這一項(xiàng)目獲得了美國(guó)五角大樓高級(jí)計(jì)劃研究局的5300萬(wàn)美元注資。這款芯片集成了100萬(wàn)個(gè)神經(jīng)元和2.56億個(gè)突觸,與普通蜜蜂的大腦水平相當(dāng),而人腦平均包含1000億個(gè)神經(jīng)元和難以統(tǒng)計(jì)數(shù)量的突觸。目前,這款芯片每秒每瓦可實(shí)現(xiàn)460億次神經(jīng)突觸操作,它能像人腦一樣去探測(cè)并識(shí)別模式。簡(jiǎn)而言之,當(dāng)人腦芯片發(fā)現(xiàn)與字母不同部分相關(guān)聯(lián)的模式時(shí),能夠?qū)⑦@些字母關(guān)聯(lián)在一起,從而識(shí)別出單詞和整句,但距離可以商用的智能化程度還遙不可及。除IBM外,芯片巨頭英特爾、高通等公司也擁有了被工程師稱之為“神經(jīng)形態(tài)”(neuromorphic)的自主芯片設(shè)計(jì)。人腦啟發(fā)軟件公司Numenta創(chuàng)始人杰夫霍金斯(Jeff Hawkins)認(rèn)為,類似TrueNorth這樣的二元芯片未來(lái)將讓位于能夠更有效地模擬出人腦聯(lián)系功能的芯片產(chǎn)品,找到正確的神經(jīng)元結(jié)構(gòu)需要經(jīng)歷多年的研究過(guò)程。
(2) 量子計(jì)算。量子計(jì)算機(jī)是一種使用量子邏輯實(shí)現(xiàn)通用計(jì)算的設(shè)備。普通計(jì)算機(jī)存儲(chǔ)數(shù)據(jù)的對(duì)象是晶體管電路的狀態(tài),而量子計(jì)算用來(lái)存儲(chǔ)數(shù)據(jù)的對(duì)象是粒子的量子狀態(tài),它使用量子算法來(lái)進(jìn)行數(shù)據(jù)操作。量子計(jì)算機(jī)的優(yōu)勢(shì)在于強(qiáng)大的并行計(jì)算速度?,F(xiàn)在的計(jì)算機(jī)畢竟是二進(jìn)制的,一遇到比較復(fù)雜的建模,像準(zhǔn)確預(yù)測(cè)天氣,預(yù)測(cè)更長(zhǎng)時(shí)間后的天氣等等,就會(huì)很費(fèi)力費(fèi)時(shí);而超快量子計(jì)算機(jī)就能算,算得超快。因?yàn)楫?dāng)許多個(gè)量子狀態(tài)的原子糾纏在一起時(shí),它們又因量子位的“疊加性”,可以同時(shí)一起展開(kāi)“并行計(jì)算”,從而使其具備超高速的運(yùn)算能力。2014年,谷歌公司與科學(xué)家聯(lián)手研制量子級(jí)計(jì)算機(jī)處理器,目的是未來(lái)使機(jī)器人像人類一樣“獨(dú)立思考問(wèn)題”。但達(dá)到這個(gè)未來(lái)需要多久,目前我們還無(wú)法預(yù)知。
(3) 仿生計(jì)算機(jī)。仿生計(jì)算機(jī)的提出是為了解決如何構(gòu)建大規(guī)模人工神經(jīng)網(wǎng)絡(luò)的問(wèn)題。通用的CPU/GPU處理神經(jīng)網(wǎng)絡(luò)效率低下,如谷歌大腦的1.6萬(wàn)個(gè)CPU運(yùn)行7天才能完成貓臉的無(wú)監(jiān)督學(xué)習(xí)訓(xùn)練。谷歌大腦實(shí)現(xiàn)模擬人腦的突觸數(shù)量?jī)H為100億個(gè),而實(shí)際的人腦突觸數(shù)量超過(guò)100萬(wàn)億。采用CPU/GPU的通用處理器構(gòu)建數(shù)據(jù)中心,占地、散熱以及耗電等都是非常嚴(yán)峻的問(wèn)題。成本方面,這樣級(jí)別的數(shù)據(jù)中心,除了谷歌、百度之外,其他互聯(lián)網(wǎng)企業(yè)根本無(wú)力搭建。專門(mén)的神經(jīng)網(wǎng)絡(luò)處理器成為解決以上問(wèn)題的鑰匙。目前國(guó)內(nèi)的陳云霽團(tuán)隊(duì)所搭建的寒武紀(jì)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)正是基于仿生學(xué)的原理,通過(guò)寒武紀(jì)生物大爆炸中獲取的線索,實(shí)現(xiàn)的無(wú)需訪問(wèn)內(nèi)存,減少90%以上的片上通訊時(shí)間,并支持幾乎現(xiàn)有主流機(jī)器學(xué)習(xí)算法的網(wǎng)絡(luò)計(jì)算機(jī)。寒武紀(jì)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)跟主流GPU相比,取得了21倍的性能和300倍的性能功耗比提升。“AI技術(shù)層的實(shí)現(xiàn)路徑:通用智能實(shí)現(xiàn)跨場(chǎng)景的終極應(yīng)用在專用智能的時(shí)代,AI的技術(shù)應(yīng)用是要針對(duì)不同的場(chǎng)景才能有效的。例如,格靈深瞳的計(jì)算機(jī)視覺(jué)技術(shù),在安防視頻監(jiān)控領(lǐng)域可以識(shí)別出犯罪分子的異常行為舉動(dòng)并予以報(bào)警,但換做是商場(chǎng)中,格靈深瞳的三維攝像頭就無(wú)法識(shí)別出客戶的性別年紀(jì)等特征,并根據(jù)客戶在不同柜臺(tái)中逗留的時(shí)間,分析出客戶可能偏好的產(chǎn)品并向其推薦。這兩個(gè)應(yīng)用場(chǎng)景其實(shí)都是依托于計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行識(shí)別和響應(yīng)的,但是專用智能時(shí)代,受到計(jì)算能力和建模能力的約束,同樣的計(jì)算機(jī)視覺(jué)技術(shù)卻無(wú)法解決跨場(chǎng)景的應(yīng)用。
在未來(lái),通用智能到來(lái)后,AI技術(shù)層的普適性將極大地提升。同樣一個(gè)視頻監(jiān)控的攝像頭加上背后的計(jì)算機(jī)視覺(jué)的云平臺(tái),放在不同的場(chǎng)合中,就能夠根據(jù)用戶不同的需求進(jìn)行不同的識(shí)別并做出智能化的決策行為。這種終極應(yīng)用的到來(lái),必須依賴于計(jì)算資源上突破現(xiàn)有的能力極限,并且在建模上超越現(xiàn)階段的深度學(xué)習(xí)算法的極限,真正讓AI像人類一樣去觀察和思考并做出行為決策。
我們認(rèn)為:在通用智能時(shí)代,進(jìn)入門(mén)檻最高,護(hù)城河最寬的是底層AI資源支持的平臺(tái)企業(yè);其次是技術(shù)層中在細(xì)分領(lǐng)域具備核心競(jìng)爭(zhēng)力的領(lǐng)先企業(yè);門(mén)檻最低的是應(yīng)用層的企業(yè),標(biāo)準(zhǔn)化程度越高意味著同質(zhì)化競(jìng)爭(zhēng)越激烈,但消費(fèi)電子的產(chǎn)品屬性也將允許差異化競(jìng)爭(zhēng)的空間。產(chǎn)業(yè)報(bào)告:人工智能產(chǎn)業(yè)深度研究報(bào)告

技術(shù)不足導(dǎo)致移動(dòng)互聯(lián)網(wǎng)難以催生出更多的新應(yīng)用和商業(yè)模式,為突破瓶頸,新一輪更激動(dòng)人心、更值得期待的技術(shù)革命風(fēng)暴已經(jīng)誕生,將成為未來(lái)10年乃至更長(zhǎng)時(shí)間內(nèi)IT產(chǎn)業(yè)發(fā)展的焦點(diǎn),它的名字叫做“人工智能”(AI)。
只有人工智能才能為“萬(wàn)物互聯(lián)”之后的應(yīng)用問(wèn)題提供最完美的解決方案,它將成為IT領(lǐng)域最重要的技術(shù)革命,目前市場(chǎng)關(guān)心的IT和互聯(lián)網(wǎng)領(lǐng)域的幾乎所有主題和熱點(diǎn)(智能硬件、O2O、機(jī)器人、無(wú)人機(jī)、工業(yè)4.0),發(fā)展突破的關(guān)鍵環(huán)節(jié)都是人工智能。
人工智能是指計(jì)算機(jī)系統(tǒng)具備的能力,該能力可以履行原本只有依靠人類智慧才能完成的復(fù)雜任務(wù)。硬件體系能力的不足加上發(fā)展道路上曾經(jīng)出現(xiàn)偏差,以及算法的缺陷,使得人工智能技術(shù)的發(fā)展在上世紀(jì)80—90年代曾經(jīng)一度低迷。近年來(lái),成本低廉的大規(guī)模并行計(jì)算、大數(shù)據(jù)、深度學(xué)習(xí)算法、人腦芯片4大催化劑的齊備,導(dǎo)致人工智能的發(fā)展出現(xiàn)了向上的拐點(diǎn)。
國(guó)際IT巨頭已經(jīng)開(kāi)始在人工智能領(lǐng)域頻頻發(fā)力,一方面網(wǎng)羅頂尖人才,一方面加大投資力度,人工智能新的春天已經(jīng)到來(lái)。自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、規(guī)劃決策等AI細(xì)分領(lǐng)域近期進(jìn)展顯著,很多新的應(yīng)用和產(chǎn)品已經(jīng)驚艷亮相。
由于技術(shù)的復(fù)雜度,未來(lái)5-10年內(nèi),專用領(lǐng)域的智能化是AI應(yīng)用的主要方向,在更遠(yuǎn)的將來(lái),隨著技術(shù)的進(jìn)一步突破,通用領(lǐng)域的智能化有望實(shí)現(xiàn)。無(wú)論是專用還是通用領(lǐng)域,人工智能都將圍繞“基礎(chǔ)資源支持-AI技術(shù)-AI應(yīng)用”這三層基本架構(gòu)形成生態(tài)圈。
在 專用領(lǐng)域的智能化階段,有能力的企業(yè)都希望打通三層架構(gòu)。他們有的將從上往下延伸,如蘋(píng)果、??低?、小米等智能硬件企業(yè);有的試圖從下往上拓展,如百度、谷歌、IBM等互聯(lián)網(wǎng)和IT的巨頭,以及科大訊飛、格靈深瞳等AI技術(shù)新貴。產(chǎn)業(yè)格局更多地表現(xiàn)出“競(jìng)爭(zhēng)”而非“合作”,整個(gè)行業(yè)依然處于野蠻生長(zhǎng)的 初期階段。我們認(rèn)為,該階段最值得投資的是已經(jīng)具備先發(fā)優(yōu)勢(shì)的AI企業(yè),無(wú)論他目前處于哪一層都可以。
在 未來(lái)通用智能時(shí)代,進(jìn)入門(mén)檻最高,護(hù)城河最寬的是底層AI資源支持的平臺(tái)企業(yè);其次是技術(shù)層中在細(xì)分領(lǐng)域具備核心競(jìng)爭(zhēng)力的領(lǐng)先企業(yè);門(mén)檻最低的是應(yīng)用層的 企業(yè),但消費(fèi)電子的產(chǎn)品屬性也將允許差異化競(jìng)爭(zhēng)的空間。除了自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等AI技術(shù)在某些領(lǐng)域的直接應(yīng)用,人工智能更大的影響在于將重塑生活 服務(wù)、醫(yī)療、零售、數(shù)字營(yíng)銷(xiāo)、農(nóng)業(yè)、工業(yè)、商業(yè)等各行各業(yè),并將引發(fā)新一輪IT設(shè)備投資周期。智能化的大潮即將來(lái)襲,萬(wàn)億元的市場(chǎng)規(guī)模值得期待。新技術(shù)革命登場(chǎng)IT發(fā)展焦點(diǎn)將從互聯(lián)網(wǎng)轉(zhuǎn)向人工智能發(fā)軔于2007年的移動(dòng)互聯(lián)網(wǎng)浪潮已經(jīng)席卷全球,極大地改變了我們的生存狀態(tài)。然而,就在資本市場(chǎng)熱切地期待移動(dòng)互聯(lián)網(wǎng)催生出更多新應(yīng)用服務(wù)、更多新商業(yè)模式的時(shí)候,由技術(shù)水平不足導(dǎo)致的發(fā)展瓶頸已然出現(xiàn)。
與此同時(shí),為突破上述瓶頸,新一輪更激動(dòng)人心、更值得期待的技術(shù)革命風(fēng)暴已經(jīng)誕生,將成為未來(lái)10年乃至更長(zhǎng)時(shí)間內(nèi)IT產(chǎn)業(yè)發(fā)展的焦點(diǎn),將再次并更加徹底地顛覆世界。這一輪技術(shù)革命風(fēng)暴,它的名字叫做“人工智能”(ArtificialIntelligence,以下簡(jiǎn)稱AI)。 基于互聯(lián)網(wǎng)的應(yīng)用服務(wù)發(fā)展已遭遇技術(shù)瓶頸,AI將成開(kāi)鎖金鑰匙基于PC的互聯(lián)網(wǎng)、基于手機(jī)和平板電腦的移動(dòng)互聯(lián)網(wǎng)以及基于各種其他設(shè)備的物聯(lián)網(wǎng),其本質(zhì)是解決了“連接”問(wèn)題:連接人與人、人與物以及物與物,并且在連接的基礎(chǔ)上創(chuàng)造出新的商業(yè)模式。
以國(guó)內(nèi)BAT三巨頭為例,百度完成的是人與信息的對(duì)接,商業(yè)模式以網(wǎng)絡(luò)廣告為主;阿里解決的是人與商品的對(duì)接,電商是其商業(yè)模式;騰訊則實(shí)現(xiàn)了人與人的對(duì)接,依靠強(qiáng)大的免費(fèi)社交軟件吸引龐大的用戶群,在此基礎(chǔ)上利用增值業(yè)務(wù)和游戲來(lái)實(shí)現(xiàn)貨幣化。盡管互聯(lián)網(wǎng)的普及打造了包括谷歌、亞馬遜、百度、阿里、騰訊、京東等一批巨頭以及數(shù)量更為龐大的中小企業(yè),基于網(wǎng)絡(luò)的創(chuàng)新應(yīng)用和服務(wù)類型也多種多樣,但技術(shù) 瓶頸的制約已經(jīng)越來(lái)越明顯:生活方面需求痛點(diǎn)的解決、生產(chǎn)領(lǐng)域具有適應(yīng)性和資源效率的智慧工廠的建立、物流體系中更加方便快捷的配送方式建設(shè)等問(wèn)題,都面臨智能化程度不足帶來(lái)的障礙。只有人工智能才能為“萬(wàn)物互聯(lián)”之后的應(yīng)用問(wèn)題提供最完美的解決方案。
人工智能的價(jià)值如此重要,以至于我們可以毫不夸張地說(shuō),它將成為IT領(lǐng)域最重要的技術(shù)革命,目前市場(chǎng)關(guān)心的IT和互聯(lián)網(wǎng)領(lǐng)域的幾乎所有主題和熱點(diǎn)(智能硬件、O2O、機(jī)器人、無(wú)人機(jī)、工業(yè)4.0),發(fā)展突破的關(guān)鍵環(huán)節(jié)都是人工智能。 下面我們將通過(guò)一些例子和應(yīng)用場(chǎng)景來(lái)更形象具體地展示上述瓶頸以及AI的重要性智能冰箱還不能告訴我們做什么由 于生活節(jié)奏加快人們的空閑時(shí)間大為減少,做家務(wù)的時(shí)間日益顯得不足,我們需要一款聰明的冰箱,讓冰箱告訴我們做什么。來(lái)自?shī)W維咨詢的《中國(guó)家用冰箱食品浪費(fèi)調(diào)查報(bào)告》顯示,“每個(gè)家庭平均每年發(fā)生176次食物浪費(fèi)現(xiàn)象。70%受訪者表示,造成浪費(fèi)的主要原因是一次購(gòu)買(mǎi)太多和放入冰箱后忘記。
智能冰箱的出現(xiàn),不僅可以自行“清理門(mén)戶”,采購(gòu)新鮮食品,還能統(tǒng)籌安排,減少食材浪費(fèi),制作個(gè)性化食譜。它會(huì)根據(jù)食材新鮮與否,把不新鮮的食材調(diào)動(dòng)到距離冰箱門(mén)最近的地方,提醒主人“它該吃了”。此外,智能冰箱能對(duì)用戶的膳食合理性進(jìn)行分析,制作菜譜。
同 時(shí)提示需要補(bǔ)充的食材,如果與生鮮電商聯(lián)網(wǎng)的話,可以自動(dòng)選擇送貨上門(mén),直接實(shí)現(xiàn)食物的配送發(fā)貨收獲自動(dòng)化和智能化。2014年美菱率先推出全球首臺(tái)云圖 像識(shí)別智能冰箱ChiQ,突破全球智能冰箱技術(shù)門(mén)檻,該冰箱具備變頻功能,可以用語(yǔ)音搜索、自動(dòng)推薦等多種方式進(jìn)行食譜推薦,并實(shí)現(xiàn)手機(jī)的遠(yuǎn)程查看和控制。
智能冰箱功能法的升級(jí),提升用戶體驗(yàn)和價(jià)值,背后的最大核心是自動(dòng)識(shí)別技術(shù)的突破。圖像識(shí)別技術(shù)通過(guò)圖像采集系統(tǒng)得到食材圖片,運(yùn)用圖像識(shí)別算法,轉(zhuǎn)化成食品的信息列表。而通過(guò)圖像識(shí)別技術(shù),判斷食材的種類是實(shí)現(xiàn)冰箱智能化的拐點(diǎn)。
可見(jiàn),不是用戶對(duì)智能家居的需求不存在,而是現(xiàn)有的技術(shù)無(wú)法支撐家居的智能化,這個(gè)瓶頸無(wú)法突破,智能家居永遠(yuǎn)是紙上談兵。那么,解決這個(gè)問(wèn)題的鑰匙在哪里?人工智能技術(shù)的突破:圖像識(shí)別背后的底層技術(shù)就來(lái)自于人工智能的算法和應(yīng)用!O2O尚未實(shí)現(xiàn)生活服務(wù)智能化試想這樣一個(gè)場(chǎng)景,你想選擇一個(gè)地方和朋友吃飯,首先你會(huì)打開(kāi)一個(gè)應(yīng)用,在這個(gè)過(guò)程中它會(huì)自動(dòng)確定你所在的位置,然后你通過(guò)語(yǔ)音開(kāi)始向其發(fā)出請(qǐng)求“我想在這附近找一家中式餐廳,下午將要與朋友一起就餐,消費(fèi)價(jià)格適中?!?/span>
應(yīng)用根據(jù)你發(fā)出的請(qǐng)求及過(guò)往的生活習(xí)慣為你尋找到數(shù)十家備選方案優(yōu)選列表,然后你可以根據(jù)興趣與愛(ài)好選擇直接確定方案,或者實(shí)時(shí)打開(kāi)查看各家的類型、折扣、評(píng)分、環(huán)境、位置、菜品、用戶評(píng)價(jià)等綜合信息并進(jìn)行篩選,這些信息綜合在一起形成了你對(duì)某家餐廳的判斷和最終的決策。
這時(shí)你可以就一些問(wèn)題與餐廳的服務(wù)人員進(jìn)行實(shí)時(shí)的溝通,然后交付押金輕松的進(jìn)行預(yù)訂。預(yù)訂好了餐廳之后,通過(guò)語(yǔ)音控制,你可以將信息轉(zhuǎn)發(fā)給朋友。當(dāng)你到了該出發(fā)赴約的時(shí)候,這個(gè)應(yīng)用開(kāi)始提醒你,并可以選擇是否開(kāi)啟地圖語(yǔ)音導(dǎo)航模式,為你提供位置和路線服務(wù)。
從 本質(zhì)上說(shuō),消費(fèi)者和商戶存在各自信息獲取不對(duì)稱的問(wèn)題,而O2O在于把服務(wù)業(yè)互聯(lián)網(wǎng)化,將商戶與消費(fèi)者之間連接的更好,讓信息不對(duì)稱的問(wèn)題都能解決,這不 僅能夠幫助商戶,也能夠幫助消費(fèi)者。消費(fèi)者對(duì)O2O的最大訴求主要是在前端信息的檢索和獲取,而商家的目的在于持續(xù)獲取消費(fèi)者,這主要通過(guò)前端提供消費(fèi)者 信息影響其購(gòu)買(mǎi)決策,并通過(guò)后期客戶管理增強(qiáng)與用戶關(guān)系。
互聯(lián)網(wǎng)的O2O商業(yè)模式氣勢(shì)洶洶的顛覆傳統(tǒng)行業(yè),似乎發(fā)展到現(xiàn)在好像開(kāi)始止步不前了。目前點(diǎn)評(píng)網(wǎng)站、地圖導(dǎo)航、預(yù)定網(wǎng)站、優(yōu)惠券網(wǎng)站等很好地滿足了消費(fèi)者信息獲取來(lái)源,但移動(dòng)搜索引擎卻未能很好滿足消費(fèi)者檢索的需求,使他們可以方便地查找餐廳以及優(yōu)惠地享受服務(wù)。
綜 合來(lái)看,未來(lái)的O2O會(huì)是一個(gè)融合線下信息聚合、語(yǔ)音識(shí)別、自然語(yǔ)言解析、搜索引擎、點(diǎn)評(píng)信息聚合、預(yù)訂服務(wù)、地圖導(dǎo)航、NFC、CRM、語(yǔ)音以及實(shí)時(shí)溝 通等功能為一體的基于位置的服務(wù)平臺(tái)。然而,至今仍然懸而未決的技術(shù)瓶頸是:自然語(yǔ)言的解析。如何通過(guò)對(duì)用戶的自然語(yǔ)言(文本+語(yǔ)音)等數(shù)據(jù),結(jié)合知識(shí)圖 譜,推理出用戶的需求并精準(zhǔn)的推送用戶所需的本地化生活服務(wù)?這扇大門(mén)的鑰匙也是在人工智能技術(shù)的突破!無(wú)人機(jī)尚不能自主飛行目前無(wú)人機(jī)雖然在軍事和民用領(lǐng)域都得到了應(yīng)用,但其智能化程度還遠(yuǎn)遠(yuǎn)不夠,仍然需要人遙控操縱,尚未實(shí)現(xiàn)自主飛行。設(shè)想一下你打開(kāi)家里的窗子,一架無(wú)人機(jī)恰巧停在窗外,你從無(wú)人機(jī)上取下自己購(gòu)買(mǎi)的物品,然后拿出手機(jī)確認(rèn)收到,無(wú)人機(jī)才緩緩飛走,去尋找下一個(gè)客戶。
或 者,下午你要去某咖啡館與客戶交流,恰巧有一個(gè)快遞要送來(lái)。你提前通知快遞公司,讓無(wú)人機(jī)指揮中心更改送貨路線,通知無(wú)人機(jī)將快遞送到咖啡館。物流體系使用無(wú)人機(jī)取代人工,實(shí)現(xiàn)貨物派送的設(shè)想一旦實(shí)現(xiàn),將大大提高配送效率,減少人力、運(yùn)力成本,可以說(shuō)承載了人們對(duì)于未來(lái)物流的夢(mèng)想。但這一夢(mèng)想如果要得以實(shí) 現(xiàn),必須要使無(wú)人機(jī)具備感知和規(guī)劃的智能。
低 空以及在建筑物內(nèi)部飛行會(huì)遭遇很多的障礙物,即使預(yù)先設(shè)定飛行線路,也無(wú)法避免臨時(shí)出現(xiàn)的障礙(比如寫(xiě)字樓里突然關(guān)上的門(mén)),這就需要無(wú)人機(jī)具備視覺(jué)功能、不確定性環(huán)境下的路線規(guī)劃以及行動(dòng)能力。此外,為保證準(zhǔn)確投遞,無(wú)人機(jī)或許還要具備人臉識(shí)別的能力,可以通過(guò)預(yù)先發(fā)送的照片識(shí)別出收貨人。這些感知、 規(guī)劃和行動(dòng)能力都屬于人工智能技術(shù)。智能化是工業(yè)4.0之魂第一次工業(yè)革命是隨著蒸汽機(jī)驅(qū)動(dòng)的機(jī)械制造設(shè)備的出現(xiàn);第二次工業(yè)革命是基于勞動(dòng)分工的,電力驅(qū)動(dòng)的大規(guī)模生產(chǎn);第三次工業(yè)革命是用電子和IT技術(shù)實(shí)現(xiàn)制造流程的進(jìn)一步自動(dòng)化;而如今,第四次工業(yè)革命正在來(lái)臨!
“工 業(yè)4.0”,是一個(gè)德國(guó)政府提出的高科技戰(zhàn)略計(jì)劃。這個(gè)概念包含了由集中式控制向分散式增強(qiáng)型控制的基本模式轉(zhuǎn)變,目標(biāo)是建立一個(gè)高度靈活的個(gè)性化和數(shù)字化的產(chǎn)品與服務(wù)的生產(chǎn)模式。在這種模式中,傳統(tǒng)的行業(yè)界限將消失,并會(huì)產(chǎn)生各種新的活動(dòng)領(lǐng)域和合作形式。創(chuàng)造新價(jià)值的過(guò)程正在發(fā)生改變,產(chǎn)業(yè)鏈分工將被重 組。
從以上的描述中不難看出,工業(yè)4.0對(duì)智能化的要求涵蓋更廣,涉及機(jī)器感知、規(guī)劃、決策以及人機(jī)交互等方面,而這些領(lǐng)域都是人工智能技術(shù)的重點(diǎn)研究方向。人工智能技術(shù)“奇點(diǎn)”到來(lái)在宇宙大爆炸理論中,“奇點(diǎn)”是指由爆炸而形成宇宙的那一點(diǎn),即宇宙從無(wú)到有的起點(diǎn)。而在美國(guó)著名科學(xué)家雷·庫(kù)茲韋爾(Ray·Kurzweil:發(fā)明了盲 人閱讀機(jī)、音樂(lè)合成器和語(yǔ)音識(shí)別系統(tǒng);獲9項(xiàng)名譽(yù)博士學(xué)位,2次總統(tǒng)榮譽(yù)獎(jiǎng);著有暢銷(xiāo)作品《奇點(diǎn)臨近》,現(xiàn)任奇點(diǎn)大學(xué)校長(zhǎng))的理論中,“奇點(diǎn)”是指電腦智 能與人腦智能相互融合的那個(gè)美妙時(shí)刻。我們認(rèn)為,這個(gè)美妙時(shí)刻正在到來(lái)。 什么是人工智能:從“smart”到“intelligent”目前市場(chǎng)上所謂“智能”的設(shè)備或概念很多,從智能手機(jī)到智能家居等,但這些“智能”實(shí)際上是“smart”的含義,即靈巧;真正意義上的智能應(yīng)該是“intelligent”的含義。
“人 工智能”一詞最初是在1956年達(dá)特茅斯學(xué)會(huì)上提出的。從學(xué)科定義上來(lái)說(shuō),人工智能(ArtificialIntelligence)是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以 人類智能相似的方式做出反應(yīng)的智能機(jī)器。
人工智能的概念和定義有多種,下圖中沿兩個(gè)維度排列了AI的8種定義。頂部的定義關(guān)注思維過(guò)程和推理,而底部的定義強(qiáng)調(diào)行為。左側(cè)的定義根據(jù)與人類表現(xiàn)的逼真度來(lái)衡量成功與否,而右側(cè)的定義依靠一個(gè)稱為“合理性”(Rationality)的理想的表現(xiàn)量來(lái)衡量。如果從比較容易理解的角度來(lái)概括的話,人工智能是指計(jì)算機(jī)系統(tǒng)具備的能力,該能力可以履行原本只有依靠人類智慧才能完成的復(fù)雜任務(wù)。
人工智能的應(yīng)用領(lǐng)域主要包含以下幾個(gè)方面的內(nèi)容:自然語(yǔ)言處理(包括語(yǔ)音和語(yǔ)義識(shí)別、自動(dòng)翻譯)、計(jì)算機(jī)視覺(jué)(圖像識(shí)別)、知識(shí)表示、自動(dòng)推理(包括規(guī)劃和決策)、機(jī)器學(xué)習(xí)、機(jī)器人學(xué) 人腦的精密結(jié)構(gòu)難以復(fù)制,人工智能技術(shù)曾一度受阻超大規(guī)模并行結(jié)構(gòu)使得人腦功能強(qiáng)勁人類的大腦中有數(shù)百至上千億個(gè)神經(jīng)細(xì)胞(神經(jīng)元),而且每個(gè)神經(jīng)元都通過(guò)成千上萬(wàn)個(gè)“突觸”與其他神經(jīng)元相連,形成超級(jí)龐大和復(fù)雜的神經(jīng)元網(wǎng)絡(luò),以分布和并發(fā)的方式傳導(dǎo)信號(hào),相當(dāng)于超大規(guī)模的并行計(jì)算(Parallel Computing)。因此盡管單個(gè)神經(jīng)元傳導(dǎo)信號(hào)的速度很慢(每秒百米的級(jí)別,遠(yuǎn)低于計(jì)算機(jī)的CPU),但這種超大規(guī)模的并行計(jì)算結(jié)構(gòu)仍然使得人腦遠(yuǎn)超計(jì)算機(jī),成為世界上到目前為止最強(qiáng)大的信息處理系統(tǒng)。計(jì)算機(jī)的傳統(tǒng)結(jié)構(gòu)制約人工智能的發(fā)展美籍匈牙利科學(xué)家馮·諾依曼(John Von·Neumann)是數(shù)字計(jì)算機(jī)之父,首先提出了計(jì)算機(jī)體系結(jié)構(gòu)的設(shè)想,目前世界上絕大多數(shù)計(jì)算機(jī)都采取此種結(jié)構(gòu),它也被稱之為馮·諾依曼體系結(jié)構(gòu)。簡(jiǎn)單來(lái)說(shuō),馮·諾依曼體系結(jié)構(gòu)的基本特征有以下幾點(diǎn):
1
、采用存儲(chǔ)程序方式,指令和數(shù)據(jù)不加區(qū)別混合存儲(chǔ)在同一個(gè)存儲(chǔ)器中,指令和數(shù)據(jù)都可以送到運(yùn)算器進(jìn)行運(yùn)算,即由指令組成的程序是可以修改的。2、存儲(chǔ)器是按地址訪問(wèn)的線性編址的一維結(jié)構(gòu),每個(gè)單元的位數(shù)是固定的。3、指令由操作碼和地址組成。操作碼指明本指令的操作類型,地址碼指明操作數(shù)和地址。操作數(shù)本身無(wú)數(shù)據(jù)類型的標(biāo)志,它的數(shù)據(jù)類型由操作碼確定。4、通過(guò)執(zhí)行指令直接發(fā)出控制信號(hào)控制計(jì)算機(jī)的操作。指令在存儲(chǔ)器中按其執(zhí)行順序存放,由指令計(jì)數(shù)器指明要執(zhí)行的指令所在的單元地址。指令計(jì)數(shù)器只有一個(gè),一般按順序遞增,但執(zhí)行順序可按運(yùn)算結(jié)果或當(dāng)時(shí)的外界條件而改變。5、以運(yùn)算器為中心,I/O設(shè)備與存儲(chǔ)器間的數(shù)據(jù)傳送都要經(jīng)過(guò)運(yùn)算器。6、數(shù)據(jù)以二進(jìn)制表示。人 工智能對(duì)計(jì)算機(jī)性能的要求很高,尤其是在非數(shù)值處理應(yīng)用領(lǐng)域。馮·諾依曼體系的串行結(jié)構(gòu)和人腦龐大復(fù)雜的并行結(jié)構(gòu)相去甚遠(yuǎn),使得現(xiàn)有計(jì)算機(jī)系統(tǒng)難以迅速有效地處理復(fù)雜的感知、推理、決策等問(wèn)題。硬件體系能力的不足加上發(fā)展道路上曾經(jīng)出現(xiàn)偏差(希望直接在通用型的人工智能方面取得突破),以及算法的缺陷,使 得人工智能技術(shù)的發(fā)展在上世紀(jì)80年代末到90年代曾經(jīng)一度低迷。 四大催化劑齊備,人工智能發(fā)展迎來(lái)轉(zhuǎn)折點(diǎn)近幾年來(lái),隨著技術(shù)的進(jìn)步,人工智能的發(fā)展出現(xiàn)了顯著的復(fù)蘇趨勢(shì)。我們認(rèn)為,下述4個(gè)方面的原因帶來(lái)了人工智能發(fā)展的向上拐點(diǎn):云計(jì)算成本低廉的大規(guī)模并行計(jì)算實(shí)現(xiàn)上文中提到,馮·諾依曼體系的串行結(jié)構(gòu)使得計(jì)算機(jī)無(wú)法滿足人工智能對(duì)硬件的要求,而近年來(lái)云計(jì)算的出現(xiàn)至少部分解決了這個(gè)問(wèn)題。
從 概念上講,可把云計(jì)算看成是“存儲(chǔ)云+計(jì)算云”的有機(jī)結(jié)合,即“云計(jì)算=存儲(chǔ)云+計(jì)算云”。存儲(chǔ)云的基礎(chǔ)技術(shù)是分布存儲(chǔ),而計(jì)算云的基礎(chǔ)技術(shù)正是并行計(jì)算:將大型的計(jì)算任務(wù)拆分,然后再派發(fā)到云中的各個(gè)節(jié)點(diǎn)進(jìn)行分布式的計(jì)算,最終再將結(jié)果收集后統(tǒng)一處理。大規(guī)模并行計(jì)算能力的實(shí)現(xiàn)使得人工智能往前邁進(jìn)了 一大步。
云 計(jì)算的實(shí)質(zhì)是一種基礎(chǔ)架構(gòu)管理的方法論,是把大量的計(jì)算資源組成IT資源池,用于動(dòng)態(tài)創(chuàng)建高度虛擬化的資源供用戶使用。在云計(jì)算環(huán)境下,所有的計(jì)算資源都 能夠動(dòng)態(tài)地從硬件基礎(chǔ)架構(gòu)上增減,以適應(yīng)工作任務(wù)的需求。云計(jì)算基礎(chǔ)架構(gòu)的本質(zhì)是通過(guò)整合、共享和動(dòng)態(tài)的硬件設(shè)備供應(yīng)來(lái)實(shí)現(xiàn)IT投資的利用率最大化,這就 使得使用云計(jì)算的單位成本大大降低,非常有利于人工智能的商業(yè)化運(yùn)營(yíng)。值得特別指出的是,近來(lái)基于GPU(圖形處理器)的云計(jì)算異軍突起,以遠(yuǎn)超CPU的并行計(jì)算能力獲得業(yè)界矚目。CPU 和GPU架構(gòu)差異很大,CPU功能模塊很多,能適應(yīng)復(fù)雜運(yùn)算環(huán)境;GPU構(gòu)成則相對(duì)簡(jiǎn)單,目前流處理器和顯存控制器占據(jù)了絕大部分晶體管。CPU中大部分晶體管主要用于構(gòu)建控制電路(比如分支預(yù)測(cè)等)和高速緩沖存儲(chǔ)器(Cache),只有少部分的晶體管來(lái)完成實(shí)際的運(yùn)算工作;而GPU的控制相對(duì)簡(jiǎn)單,而且 對(duì)Cache的需求小,所以大部分晶體管可以組成各類專用電路、多條流水線,使得GPU的計(jì)算速度有了突破性的飛躍,擁有了驚人的處理浮點(diǎn)運(yùn)算的能力?,F(xiàn) 在CPU的技術(shù)進(jìn)步正在慢于摩爾定律,而GPU的運(yùn)行速度已超過(guò)摩爾定律,每6個(gè)月其性能加倍。
CPU 
的架構(gòu)是有利于X86指令集的串行架構(gòu),從設(shè)計(jì)思路上適合盡可能快的完成一個(gè)任務(wù);對(duì)于GPU來(lái)說(shuō),它最初的任務(wù)是在屏幕上合成顯示數(shù)百萬(wàn)個(gè)像素的圖像 ——也就是同時(shí)擁有幾百萬(wàn)個(gè)任務(wù)需要并行處理,因此GPU被設(shè)計(jì)成可并行處理很多任務(wù),天然具備了執(zhí)行大規(guī)模并行計(jì)算的優(yōu)勢(shì)。
現(xiàn) 在不僅谷歌、Netflix用GPU來(lái)搭建人工智能的神經(jīng)網(wǎng)絡(luò),F(xiàn)acebook、Amazon、Salesforce都擁有了基于GPU的云計(jì)算能力, 國(guó)內(nèi)的科大訊飛也采用了GPU集群支持自己的語(yǔ)音識(shí)別技術(shù)。GPU的這一優(yōu)勢(shì)被發(fā)現(xiàn)后,迅速承載起比之前的圖形處理更重要的使命:被用于人工智能的神經(jīng)網(wǎng) 絡(luò),使得神經(jīng)網(wǎng)絡(luò)能容納上億個(gè)節(jié)點(diǎn)間的連接。傳統(tǒng)的CPU集群需要數(shù)周才能計(jì)算出擁有1億節(jié)點(diǎn)的神經(jīng)網(wǎng)的級(jí)聯(lián)可能性,而一個(gè)GPU集群在一天內(nèi)就可完成同 一任務(wù),效率得到了極大的提升。另外,GPU隨著大規(guī)模生產(chǎn)帶來(lái)了價(jià)格下降,使其更能得到廣泛的商業(yè)化應(yīng)用。大數(shù)據(jù)訓(xùn)練有效提高人工智能水平機(jī)器學(xué)習(xí)是人工智能的核心和基礎(chǔ),是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域。該領(lǐng)域的頂級(jí)專家Alpaydin先生如此定義:“機(jī)器學(xué)習(xí)是用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)。”

 

 

 

我們已經(jīng)進(jìn)入到大數(shù)據(jù)時(shí)代,來(lái)自全球的海量數(shù)據(jù)為人工智能的發(fā)展提供了良好的條件。
根據(jù)IDC的監(jiān)測(cè)統(tǒng)計(jì),2011年全球數(shù)據(jù)總量已經(jīng)達(dá)到1.8ZB(1ZB等于1萬(wàn)億GB,1.8ZB也就相當(dāng)于18億個(gè)1TB的移動(dòng)硬盤(pán),人均200GB,這些信息的量相當(dāng)于可以填充572億個(gè)32GB的iPad),而這個(gè)數(shù)值還在以每?jī)赡攴环乃俣仍鲩L(zhǎng),預(yù)計(jì)到2020年全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量,增長(zhǎng)近20倍。“深度學(xué)習(xí)”技術(shù)的出現(xiàn)“深度學(xué)習(xí)”是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,它模擬人類大腦神經(jīng)網(wǎng)絡(luò)的工作原理,將輸出的信號(hào)通過(guò)多層處理,將底層特征抽象為高層類別,它的目標(biāo)是更有效率、更精確地處理信息。深度學(xué)習(xí)自2006年由Geoffrey Hinton教授和他的兩個(gè)學(xué)生被提出后,使得機(jī)器學(xué)習(xí)有了突破性的進(jìn)展,極大地推動(dòng)了人工智能水平的提升。2013年,《麻省理工技術(shù)評(píng)論》把它列入年度十大技術(shù)突破之一。
人腦具有一個(gè)深度結(jié)構(gòu),認(rèn)知過(guò)程是逐步進(jìn)行,逐層抽象的,能夠?qū)哟位亟M織思想和概念。深度學(xué)習(xí)之所以有如此大的作用,正是因?yàn)樗^好地模擬了人腦這種“分層”和“抽象”的認(rèn)知和思考方式。
深度學(xué)習(xí)的實(shí)質(zhì),是通過(guò)構(gòu)建具有很多隱層的機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù),來(lái)學(xué)習(xí)更有用的特征,從而最終提升分類或預(yù)測(cè)的準(zhǔn)確性。因此,“深度模型”是手段,“特征學(xué)習(xí)”是目的。區(qū)別于傳統(tǒng)的淺層學(xué)習(xí),深度學(xué)習(xí)的不同在于:1)強(qiáng)調(diào)了模型結(jié)構(gòu)的深度,通常有5層、6層,甚至10多層的隱層節(jié)點(diǎn);2)明確突出了特征學(xué)習(xí)的重要性,也就是說(shuō),通過(guò)逐層特征變換,將樣本在原空間的特征表示變換到一個(gè)新特征空間,從而使分類或預(yù)測(cè)更加容易。與人工規(guī)則構(gòu)造特征的方法相比,利用大數(shù)據(jù)來(lái)學(xué)習(xí)特征,更能夠刻畫(huà)數(shù)據(jù)的豐富內(nèi)在信息。深度學(xué)習(xí)使得人工智能在幾個(gè)主要領(lǐng)域都獲得了突破性進(jìn)展:在語(yǔ)音識(shí)別領(lǐng)域,深度學(xué)習(xí)用深層模型替換聲學(xué)模型中的混合高斯模型(Gaussian Mixture Model, GMM),獲得了相對(duì)30%左右的錯(cuò)誤率降低;在圖像識(shí)別領(lǐng)域,通過(guò)構(gòu)造深度卷積神經(jīng)網(wǎng)絡(luò)(CNN),將Top5錯(cuò)誤率由26%大幅降低至15%,又通過(guò)加大加深網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)一步降低到11%;在自然語(yǔ)言處理領(lǐng)域,深度學(xué)習(xí)基本獲得了與其他方法水平相當(dāng)?shù)慕Y(jié)果,但可以免去繁瑣的特征提取步驟。可以說(shuō)到目前為止,深度學(xué)習(xí)是最接近人類大腦的智能學(xué)習(xí)方法?!叭四X”芯片另一個(gè)方向打開(kāi)人工智能的大門(mén)前面提到了現(xiàn)代計(jì)算機(jī)的馮·諾依曼體系結(jié)構(gòu)阻礙了大規(guī)模并行計(jì)算的實(shí)現(xiàn),導(dǎo)致人工智能發(fā)展受限。而今天人工智能發(fā)展面臨突破,除了上文說(shuō)的云計(jì)算、大數(shù)據(jù)、深度學(xué)習(xí)三個(gè)原因之外,另外一個(gè)方向的努力也是不容忽視的,那就是徹底改變了馮·諾依曼體系結(jié)構(gòu)的“人腦”芯片。
“人腦”芯片,也叫神經(jīng)形態(tài)芯片,是從硬件方向?qū)θ四X物理結(jié)構(gòu)的模擬。這種芯片把數(shù)字處理器當(dāng)作神經(jīng)元,把內(nèi)存作為突觸,跟傳統(tǒng)·馮諾依曼結(jié)構(gòu)不一樣,它的內(nèi)存、CPU和通信部件是完全集成在一起,因此信息的處理完全在本地進(jìn)行。而且由于本地處理的數(shù)據(jù)量并不大,傳統(tǒng)計(jì)算機(jī)內(nèi)存與CPU之間的瓶頸不復(fù)存在了。同時(shí)神經(jīng)元之間可以方便快捷地相互溝通,只要接收到其他神經(jīng)元發(fā)過(guò)來(lái)的脈沖(動(dòng)作電位),這些神經(jīng)元就會(huì)同時(shí)做動(dòng)作。人工智能產(chǎn)業(yè)發(fā)展加速明顯技術(shù)“奇點(diǎn)”的到來(lái)使得人工智能發(fā)展明顯加速,這從產(chǎn)業(yè)層面能夠得到有力的佐證:我們已經(jīng)能夠看到IT業(yè)對(duì)人工智能的投入顯著加大,新型的應(yīng)用或產(chǎn)品也不斷問(wèn)世。國(guó)際IT巨頭頻頻放“大招”IT領(lǐng)域的國(guó)際巨頭近年來(lái)在人工智能領(lǐng)域頻頻發(fā)力,一方面網(wǎng)羅頂尖人才,一方面加大投資力度,這也昭示著人工智能新的春天已經(jīng)到來(lái)。
2013
年3月,谷歌以重金收購(gòu)DNNresearch的方式請(qǐng)到了Geoffrey Hinton教授(上文提到的深度學(xué)習(xí)技術(shù)的發(fā)明者);2013年12月,F(xiàn)acebook成立了人工智能實(shí)驗(yàn)室,聘請(qǐng)了卷積神經(jīng)網(wǎng)絡(luò)最負(fù)盛名的研究者、紐約大學(xué)終身教授Yann LeCun為負(fù)責(zé)人;2014年5月,有“谷歌大腦之父”美稱的Andrew NG(吳恩達(dá))加盟百度,擔(dān)任首席科學(xué)家,負(fù)責(zé)百度研究院的領(lǐng)導(dǎo)工作,尤其是“百度大腦”計(jì)劃。這幾位人工智能領(lǐng)域泰斗級(jí)人物的加入,充分展示了這些互聯(lián)網(wǎng)巨頭對(duì)人工智能領(lǐng)域志在必得的決心。
根據(jù)量化分析公司Quid的數(shù)據(jù),自2009年以來(lái),人工智能已經(jīng)吸引了超過(guò)170億美元的投資。僅去年一年,就有322家擁有類似人工智能技術(shù)的公司獲得了超過(guò)20億美元的投資。自2013年以來(lái),Yahoo、Intel、Dropbox、LinkedIn、Pinterest以及Twitter也都收購(gòu)了人工智能公司。過(guò)去四年間,人工智能領(lǐng)域的民間投資以平均每年62%的增長(zhǎng)速率增加,這一速率預(yù)計(jì)還會(huì)持續(xù)下去。 “新的AI應(yīng)用和產(chǎn)品屢有驚喜自然語(yǔ)言處理(NLP)微軟SkypeTranslator同聲傳譯Skype Translator是由Skype和微軟機(jī)器翻譯團(tuán)隊(duì)聯(lián)合開(kāi)發(fā),整合了微軟Skype語(yǔ)音和聊天技術(shù)、機(jī)器翻譯技術(shù)、神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別打造了一款面向消費(fèi)者用戶的產(chǎn)品,2014年5月在微軟Code大會(huì)上推出。兩個(gè)不同語(yǔ)種的人借助SkypeTranslator可實(shí)現(xiàn)無(wú)障礙交談,當(dāng)你說(shuō)出一個(gè)完整的句子后,系統(tǒng)便會(huì)開(kāi)始進(jìn)行記錄翻譯,對(duì)方即可聽(tīng)到翻譯后的句子,并可通過(guò)字幕顯示在屏幕上。這個(gè)實(shí)時(shí)語(yǔ)音翻譯系統(tǒng)能夠識(shí)別不同用戶間的不同語(yǔ)言不同口音的說(shuō)話方式。
目前,SkypeTranslator還處在早期開(kāi)發(fā)階段,但這一實(shí)時(shí)語(yǔ)音翻譯功能有可能幫助改變世界未來(lái)的交流方式。比如在線教育,2014年12月,微軟正式推出了Skype Translator預(yù)覽版,讓來(lái)自美國(guó)和墨西哥的小學(xué)生使用各自母語(yǔ)就能進(jìn)行語(yǔ)音通話。它可以識(shí)別美國(guó)小學(xué)生的英文語(yǔ)句并將其翻譯為西班牙語(yǔ),然后以文本的形式呈獻(xiàn)給墨西哥小學(xué)生,反之亦然。微軟計(jì)劃將Skype Translator服務(wù)推向教育領(lǐng)域,如此一來(lái)全世界各地的學(xué)生都能無(wú)障礙聆聽(tīng)任何語(yǔ)言的課程,顯然這對(duì)于促進(jìn)全球教育進(jìn)步有著非比尋常的意義。計(jì)算機(jī)視覺(jué)(CV)1格靈深瞳的智能視頻監(jiān)控系統(tǒng)在安防領(lǐng)域,攝像頭已經(jīng)得到大規(guī)模的使用,但監(jiān)控的有效性依然面臨兩個(gè)嚴(yán)峻的挑戰(zhàn):1、攝像頭只能起到記錄功能,識(shí)別還要依靠人眼,真正能實(shí)時(shí)監(jiān)控到的場(chǎng)景非常有限:一個(gè)像機(jī)場(chǎng)大小的公共場(chǎng)所,攝像頭的數(shù)量能夠達(dá)到幾萬(wàn)臺(tái),而同一時(shí)間負(fù)責(zé)監(jiān)控視頻的安保人員大概只有幾個(gè)人;此外,視頻監(jiān)控往往都采用畫(huà)面輪播機(jī)制,每過(guò)一定時(shí)間自動(dòng)切換屏幕上顯示的監(jiān)控視頻畫(huà)面。所以,那些真正有信息價(jià)值的畫(huà)面被人看到、注意到的幾率就很小。
2
、 難以有效查詢歷史記錄。據(jù)估計(jì)全球監(jiān)控視頻記錄的存儲(chǔ)已經(jīng)消耗了75%的硬盤(pán)資源,以北京天安門(mén)為例,每天產(chǎn)生的監(jiān)控視頻數(shù)據(jù),刻成光盤(pán)摞起來(lái),甚至超過(guò)埃菲爾鐵塔的高度。要在如此龐大的數(shù)據(jù)庫(kù)里依靠人眼尋找某個(gè)特定畫(huà)面或犯罪嫌疑人,需要?jiǎng)佑么罅康?a target="_blank" style="color: black;" >人力資源,并且效率低下。
格靈深瞳是一家專注于開(kāi)發(fā)計(jì)算機(jī)視覺(jué)的人工智能公司,致力于讓計(jì)算機(jī)像人一樣主動(dòng)獲取視覺(jué)信息并進(jìn)行精確的實(shí)時(shí)分析。公司成立于2013年初,創(chuàng)始人為Google眼鏡的核心團(tuán)隊(duì)成員,成立不久就獲得真格基金和聯(lián)創(chuàng)策源的天使投資,并于2014年6月獲得紅杉資本數(shù)千萬(wàn)美元的A輪投資。
格靈深瞳通過(guò)研發(fā)三維視覺(jué)感知技術(shù),實(shí)現(xiàn)對(duì)人物的精確檢測(cè)、跟蹤,對(duì)動(dòng)作姿態(tài)(包括暴力、跌倒等危險(xiǎn)行為)和人物運(yùn)動(dòng)軌跡(包括越界、逆行、徘徊等可疑軌跡)的檢測(cè)和分析。在自動(dòng)場(chǎng)景和人物檢測(cè)的基礎(chǔ)上,自動(dòng)給安保人員提供預(yù)警信號(hào),主動(dòng)提醒、報(bào)告異常,保障安保人員“看得到”。同時(shí),格靈深瞳利用感知技術(shù)抽象出人物的特征,從非時(shí)間的維度進(jìn)行監(jiān)測(cè)、跟蹤、搜索,真正做到“找得到”。目前格靈深瞳的視頻監(jiān)控系統(tǒng)已經(jīng)在對(duì)安防要求較高的銀行進(jìn)行應(yīng)用測(cè)試。如果該技術(shù)投入大規(guī)模商業(yè)化應(yīng)用,將有效改善上文提到的現(xiàn)有視頻監(jiān)控的缺陷,是人工智能改變世界邁出的非常積極的一步。2Face++的人臉識(shí)別云服務(wù)Face++是一個(gè)人臉識(shí)別云服務(wù)平臺(tái),通過(guò)它提供的開(kāi)放服務(wù),開(kāi)發(fā)者可以低成本的在自己的產(chǎn)品中實(shí)現(xiàn)若干面部識(shí)別功能。開(kāi)發(fā)者和合作方通過(guò)Face++提供的API接入和離線引擎就可以享受現(xiàn)成的人臉檢測(cè)、分析和識(shí)別等服務(wù)。Face++人臉識(shí)別技術(shù)主要有以下幾種基本功能:1)人臉檢測(cè):從圖片中快速、準(zhǔn)確的找到所有的或者有某些特征的臉。2)人臉?lè)治觯和ㄟ^(guò)人臉,對(duì)人的性別、年齡、情緒的信息進(jìn)行提取。3)人臉識(shí)別:匹配給定人臉的相似性,或者從成萬(wàn)上億的人臉資料庫(kù)中搜索、返回最相似的人臉?biāo)饕?span style="color: rgb(73, 73, 73);">
Face++為美圖秀秀、美顏相機(jī)App提供諸如:人臉檢測(cè)、人臉追蹤、關(guān)鍵點(diǎn)檢測(cè)技術(shù),可精準(zhǔn)定位人臉中需要美化的位置,實(shí)現(xiàn)精準(zhǔn)自動(dòng)人臉美化,但這些僅是人臉識(shí)別的初級(jí)階段。此外在稍高級(jí)的應(yīng)用階段——搜索領(lǐng)域,F(xiàn)ace++所做的人臉識(shí)別為世紀(jì)佳緣提供服務(wù),用戶可根據(jù)自己對(duì)另一半長(zhǎng)相的需求去搜索相似外貌的用戶,當(dāng)然這個(gè)搜索需要在數(shù)據(jù)庫(kù)中進(jìn)行,可以是世紀(jì)佳緣的數(shù)據(jù)庫(kù)、未來(lái)可以是社交網(wǎng)絡(luò)上的數(shù)據(jù)庫(kù)、更可以是在通用搜索引擎中。
第二個(gè)是Face++與360搜索達(dá)成了合作,在360的圖片搜索中使用到相關(guān)的技術(shù)。而在另一塊安全領(lǐng)域,F(xiàn)ace++推出了APP“云臉應(yīng)用鎖”,掃描一下人臉和設(shè)置一下備用密碼,就可以將需要加密的應(yīng)用添加到需要保護(hù)的應(yīng)用程序中。這樣打開(kāi)加密的應(yīng)用時(shí),就要事先經(jīng)過(guò)一個(gè)人臉識(shí)別的監(jiān)測(cè),才能成功打開(kāi)此應(yīng)用。非常適合于圖片、信息、支付軟件等等擁有私密信息較高的應(yīng)用程序當(dāng)中。知識(shí)表示、規(guī)劃和決策1Palantir:CIA的反恐秘密武器大數(shù)據(jù)挖掘分析公司Palantir成立于2004年,該平臺(tái)把人工智能算法和強(qiáng)大的引擎(可以同時(shí)掃描多個(gè)數(shù)據(jù)庫(kù))整合,可以同時(shí)處理大量數(shù)據(jù)庫(kù),并允許用戶通過(guò)多種方式快速瀏覽相關(guān)信息。其產(chǎn)品已被美國(guó)中情局(CIA)、聯(lián)邦調(diào)查局(FBI)、海陸空三軍、聯(lián)邦檢察官、私人調(diào)查機(jī)構(gòu)及其他客戶所使用。
類似CIA和FBI這樣的情報(bào)機(jī)構(gòu)有成千上萬(wàn)個(gè)數(shù)據(jù)庫(kù),并記錄著不同的數(shù)據(jù),比如財(cái)務(wù)數(shù)據(jù)、DNA樣本、語(yǔ)音資料、錄像片段以及世界各地的地圖。將這些數(shù)據(jù)建立聯(lián)系需要數(shù)年的時(shí)間,即便統(tǒng)一在一起,也很難駕馭不同種類的數(shù)據(jù),比如說(shuō)如何關(guān)聯(lián)銷(xiāo)售數(shù)據(jù)和監(jiān)控錄像資料,而Palantir公司所做的就是開(kāi)發(fā)軟件使這一切變得更容易。同時(shí),Palantir還對(duì)各種安全問(wèn)題高度敏感。
Palantir
引發(fā)了計(jì)算機(jī)時(shí)代的一場(chǎng)革命,它梳理所有可以獲得的數(shù)據(jù)庫(kù),對(duì)相關(guān)信息進(jìn)行確認(rèn),并他們整合起來(lái)。Palantir成立之初就獲的CIA基金公司In-Q-Tel的投資,現(xiàn)在成為了美國(guó)情報(bào)機(jī)關(guān)在反恐戰(zhàn)爭(zhēng)不能缺少的工具。Palantir有效的解決了911后對(duì)情報(bào)工作提出的技術(shù)難題:如何從大量的數(shù)據(jù)中快速獲取有價(jià)值的線索,可以說(shuō)是CIA的反恐秘密武器。
Palantir
公司相當(dāng)?shù)驼{(diào),但非常受政府情報(bào)機(jī)關(guān)和華爾街的熱捧。除了反恐,其關(guān)注重點(diǎn)也開(kāi)始轉(zhuǎn)向醫(yī)療、零售、保險(xiǎn)和生物科技,比如利用Palantir可以偵查醫(yī)療保險(xiǎn)詐騙以及發(fā)現(xiàn)病毒爆發(fā)的源頭。現(xiàn)在,Palantir年收入已超過(guò)10億美元,并且每年以3倍的速度增長(zhǎng)。2IBM Watson:認(rèn)知能力強(qiáng)勁Watson由90臺(tái)IBM服務(wù)器、360個(gè)計(jì)算機(jī)芯片驅(qū)動(dòng)組成,是一個(gè)有10臺(tái)普通冰箱那么大的計(jì)算機(jī)系統(tǒng)。它擁有15TB內(nèi)存、2880個(gè)處理器、每秒可進(jìn)行80萬(wàn)億次運(yùn)算。IBM為沃森配置的處理器是Power 7系列處理器,這是當(dāng)前RISC(精簡(jiǎn)指令集計(jì)算機(jī))架構(gòu)中最強(qiáng)的處理器。
Watson
存儲(chǔ)了大量圖書(shū)、新聞和電影劇本資料、辭海、文選和《世界圖書(shū)百科全書(shū)》等數(shù)百萬(wàn)份資料。每當(dāng)讀完問(wèn)題的提示后,Watson就在不到三秒鐘的時(shí)間里對(duì)自己長(zhǎng)達(dá)2億頁(yè)的料里展開(kāi)搜索。Watson是基于IBM“DeepQA”(深度開(kāi)放域問(wèn)答系統(tǒng)工程)技術(shù)開(kāi)發(fā)的,DeepQA技術(shù)可以讀取數(shù)百萬(wàn)頁(yè)文本數(shù)據(jù),利用深度自然語(yǔ)言處理技術(shù)產(chǎn)生候選答案,根據(jù)諸多不同尺度評(píng)估那些問(wèn)題。
IBM
研發(fā)團(tuán)隊(duì)為Watson開(kāi)發(fā)的100多套算法可以在3秒內(nèi)解析問(wèn)題,檢索數(shù)百萬(wàn)條信息然后再篩選還原成“答案”輸出成人類語(yǔ)言。每一種算法都有其專門(mén)的功能。
IBM
公司自2006年開(kāi)始研發(fā)沃森,并在2011年2月的《危險(xiǎn)地帶》(Jeopardy!)智力搶答游戲中一戰(zhàn)成名后,其商業(yè)化應(yīng)用有著清晰的脈絡(luò):2011年8月沃森開(kāi)始應(yīng)用于醫(yī)療領(lǐng)域;2012年3月,沃森則首次應(yīng)用于金融領(lǐng)域,花旗集團(tuán)成為了沃森的首位金融客戶,沃森幫助花旗分析用戶的需求,處理金融經(jīng)濟(jì)和用戶數(shù)據(jù)以及實(shí)現(xiàn)數(shù)字銀行的個(gè)性化,并幫助金融機(jī)構(gòu)找出行業(yè)專家可能忽略的風(fēng)險(xiǎn)、收益以及客戶需求。美國(guó)農(nóng)業(yè)銀行信貸證券公司的一份研究報(bào)告中預(yù)測(cè),Watson在2015年將為IBM帶來(lái)26.5億美元的收入。
例如在醫(yī)療領(lǐng)域,Watson已收錄了腫瘤學(xué)研究領(lǐng)域的42種醫(yī)學(xué)期刊、臨床試驗(yàn)的60多萬(wàn)條醫(yī)療證據(jù)和200萬(wàn)頁(yè)文本資料。Watson能夠在幾秒之內(nèi)篩選數(shù)十年癌癥治療歷史中的150萬(wàn)份患者記錄,包括病歷和患者治療結(jié)果,并為醫(yī)生提供可供選擇的循證治療方案。目前癌癥治療領(lǐng)域排名前三的醫(yī)院都在運(yùn)行Watson。研究表明,醫(yī)療信息數(shù)據(jù)正以每五年翻番的高速度增長(zhǎng)。這為將下一代認(rèn)知計(jì)算系統(tǒng)運(yùn)用于醫(yī)療行業(yè)以改善醫(yī)學(xué)的教學(xué)、實(shí)踐和支付模式提供了史無(wú)前例的商機(jī)。人工智能生態(tài)格局展望巨頭與新貴共舞人工智能將催生新一輪IT商業(yè)模式創(chuàng)新自從PC互聯(lián)網(wǎng)時(shí)代以來(lái),到移動(dòng)互聯(lián)網(wǎng),再到智能硬件時(shí)代,技術(shù)發(fā)展和商業(yè)模式創(chuàng)新一直處于相輔相成的狀態(tài)中,一旦技術(shù)進(jìn)步的紅利被商業(yè)模式創(chuàng)新挖掘殆盡后,面臨泡沫破裂的風(fēng)險(xiǎn),直到下一輪技術(shù)革命浪潮再來(lái),商業(yè)模式創(chuàng)新才會(huì)春風(fēng)吹又生。
我們認(rèn)為,移動(dòng)互聯(lián)網(wǎng)時(shí)代,萬(wàn)物互聯(lián)催生出了海量的數(shù)據(jù),觸摸屏的交互方式已經(jīng)滿足不了用戶多元化的輸入方式,商業(yè)模式創(chuàng)新已經(jīng)遭遇了技術(shù)無(wú)法支撐的瓶頸,如果人工智能技術(shù)突破,無(wú)疑將催生出新的商業(yè)模式,帶來(lái)巨大的市場(chǎng)想象空間。

 

 

 

 

現(xiàn)階段移動(dòng)互聯(lián)網(wǎng)的商業(yè)模式創(chuàng)新已經(jīng)將web2.0時(shí)代的技術(shù)紅利消耗殆盡,未來(lái)新的商業(yè)模式的開(kāi)發(fā)需要技術(shù)進(jìn)步的支撐,人工智能是重要的技術(shù)突破點(diǎn)。AI產(chǎn)業(yè)格局成形的路徑:“底層—中層—頂層”的生態(tài)圈逐步清晰人工智能發(fā)展的拐點(diǎn)已經(jīng)到來(lái),但需要指出的是,由于技術(shù)的復(fù)雜性,發(fā)展不會(huì)一蹴而就,必然經(jīng)歷一個(gè)由點(diǎn)到面,由專用領(lǐng)域(domain)到通用領(lǐng)域(general purpose)的歷程,通用領(lǐng)域的人工智能實(shí)現(xiàn)還比較遙遠(yuǎn)。
我們以計(jì)算機(jī)視覺(jué)的應(yīng)用為例,正常的成年人可以很容易地識(shí)別照片或視頻里的多種場(chǎng)景和人、物,但對(duì)于計(jì)算機(jī)來(lái)說(shuō)還難以做到。原因是識(shí)別是一個(gè)特征抽取的過(guò)程,而特征抽取是建立在識(shí)別模型的基礎(chǔ)之上的,要做到通用識(shí)別,則必須對(duì)世間萬(wàn)物都建立一一對(duì)應(yīng)的模型,工作量極大。而即使是同一事物,由于光線、角度、距離的原因,在不同的場(chǎng)景里也會(huì)呈現(xiàn)出很大的差異,這進(jìn)一步增加了建立識(shí)別模型的難度。
短期內(nèi)計(jì)算機(jī)的運(yùn)算能力(即使是超級(jí)運(yùn)算平臺(tái))還難以望人腦視覺(jué)中樞的項(xiàng)背,因此無(wú)法達(dá)成這一愿景。
在未來(lái)5-10年之內(nèi),專用領(lǐng)域的定向智能化將是AI主要的應(yīng)用發(fā)展方向。在更遠(yuǎn)的將來(lái),如果人腦芯片等硬件架構(gòu)能有所突破,運(yùn)算能力有極大提高,則專用智能將逐步進(jìn)化成為跨場(chǎng)景跨下游應(yīng)用的通用智能。而AI的生態(tài)格局,無(wú)論是專用還是通用領(lǐng)域,我們認(rèn)為都將圍繞“底層-中層-頂層”的技術(shù)和產(chǎn)品架構(gòu)逐漸成形。
人工智能產(chǎn)業(yè)生態(tài)格局的三層基本架構(gòu)如下:底層為基礎(chǔ)資源支持層,由運(yùn)算平臺(tái)和數(shù)據(jù)工廠組成;中層為AI技術(shù)層,通過(guò)不同類型的算法建立模型,形成有效的可供應(yīng)用的技術(shù);頂層為AI應(yīng)用層,利用中層輸出的AI技術(shù)為用戶提供智能化的服務(wù)和產(chǎn)品。每一層架構(gòu)中,都有不同的企業(yè)參與,最終形成圍繞AI技術(shù),產(chǎn)品和服務(wù)的生態(tài)圈。專用領(lǐng)域人工智能生態(tài)圈的格局基礎(chǔ)資源支持層實(shí)現(xiàn)路徑運(yùn)算平臺(tái)+數(shù)據(jù)工廠基礎(chǔ)資源支持層通過(guò)部署大規(guī)模GPU與CPU并行計(jì)算構(gòu)成的云計(jì)算資源池(定義為超級(jí)運(yùn)算平臺(tái))來(lái)解決AI所需要的超強(qiáng)存儲(chǔ)和運(yùn)算處理能力問(wèn)題,并輔以能夠抓取到匯聚了人類智慧的海量信息的大數(shù)據(jù)工廠作為數(shù)據(jù)集,為AI技術(shù)層的實(shí)現(xiàn)提供有利支持。
超算平臺(tái)負(fù)責(zé)存儲(chǔ)與運(yùn)算。人類沒(méi)有記憶就沒(méi)有關(guān)聯(lián),也更不用說(shuō)決策與創(chuàng)造,而構(gòu)成記憶的基礎(chǔ)正是有極大存儲(chǔ)能力的腦容量,那么機(jī)器要模仿人腦也必然首先要擁有龐大的存儲(chǔ)能力,海量數(shù)據(jù)的積累最終讓機(jī)器的“存儲(chǔ)”形成類似于人類的“記憶”。
百度在發(fā)展人工智能的道路上,首先做的也是不斷擴(kuò)大其存儲(chǔ)能力。除了存儲(chǔ)的絕對(duì)容量之外,運(yùn)算處理能力是第二個(gè)需要提升的硬實(shí)力。
運(yùn)算處理能力有兩個(gè)方面,第一是服務(wù)器規(guī)模,第二是特征向量大小。所謂特征向量簡(jiǎn)單理解的話就是指將文本語(yǔ)音圖像視頻等內(nèi)容轉(zhuǎn)化為機(jī)器能夠讀懂的一連串關(guān)鍵數(shù)據(jù),數(shù)據(jù)越多,機(jī)器學(xué)習(xí)的就會(huì)越好,但對(duì)服務(wù)器的壓力也會(huì)相應(yīng)加大。百度能夠僅用兩年時(shí)間從10萬(wàn)特征向量直接飆升到200億,足以見(jiàn)得百度服務(wù)器技術(shù)實(shí)力的雄厚。在這個(gè)過(guò)程中,還需要解決大規(guī)模GPU和CPU并行計(jì)算所帶來(lái)的錯(cuò)誤率提升以及散熱難度加大等問(wèn)題,因此,是否能夠搭建超算平臺(tái)成為了人工智能企業(yè)的重要進(jìn)入門(mén)檻。
數(shù)據(jù)工廠實(shí)現(xiàn)分類與關(guān)聯(lián)。數(shù)據(jù)工廠會(huì)對(duì)數(shù)據(jù)進(jìn)行基礎(chǔ)性的加工,而這種加工又非常關(guān)鍵。從人類的記憶聯(lián)想模式分析,要調(diào)取某部分的記憶,就會(huì)很自然的聯(lián)想到某個(gè)詞,某個(gè)畫(huà)面,某個(gè)音樂(lè)等等就能記起很多事情。這是因?yàn)槿祟惔竽X的神經(jīng)連接結(jié)構(gòu)允許我們這樣去檢索,而機(jī)器是不允許的,數(shù)據(jù)存儲(chǔ)在硬盤(pán)上,機(jī)器想要找到某個(gè)數(shù)據(jù),必須一個(gè)個(gè)訪問(wèn)過(guò)去,機(jī)器沒(méi)有分類的概念。
如果需要機(jī)器理解用戶的語(yǔ)言,這種搜索技術(shù)也依然要機(jī)器的大腦配合才能達(dá)到,對(duì)每一個(gè)詞的定義應(yīng)該是一個(gè)庫(kù),而這個(gè)庫(kù)中的每一個(gè)詞又都各自構(gòu)成庫(kù),數(shù)據(jù)工廠所依托的搜索算法,就是在這么一個(gè)數(shù)據(jù)海洋中去為他們建立管理,然后去索引。數(shù)據(jù)工廠相當(dāng)于人腦中的記憶關(guān)聯(lián)過(guò)程:將某個(gè)詞同時(shí)與其他詞或是某個(gè)場(chǎng)景等等建立起動(dòng)態(tài)關(guān)聯(lián)的過(guò)程。
因此,通過(guò)數(shù)據(jù)挖掘和搜索算法對(duì)數(shù)據(jù)工廠中的知識(shí)庫(kù)和信息庫(kù)進(jìn)行分類與關(guān)聯(lián)的技術(shù)能力同樣是人工智能企業(yè)的重要進(jìn)入門(mén)檻。AI技術(shù)層實(shí)現(xiàn)路徑面向特定場(chǎng)景的智能技術(shù)多姿多彩AI技術(shù)層的作用是基于底層提供的計(jì)算存儲(chǔ)資源和大數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)建模,開(kāi)發(fā)面向不同領(lǐng)域的應(yīng)用技術(shù),例如語(yǔ)音識(shí)別、語(yǔ)義識(shí)別和計(jì)算機(jī)視覺(jué)等。
中間層的運(yùn)行機(jī)制和人類的思維形成過(guò)程高度相似,是從感知到思考再到最終的決策行動(dòng)甚至是創(chuàng)造,核心是機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用。
首先,感知環(huán)節(jié)需要連接的是人、信息和物理世界,通過(guò)傳感器,搜索引擎和人機(jī)交互來(lái)獲取建模必須的數(shù)據(jù),相當(dāng)于人類的感知過(guò)程。依托于底層的高性能計(jì)算和彈性存儲(chǔ)能力,中間層對(duì)感知到的數(shù)據(jù)進(jìn)行建模運(yùn)算,相當(dāng)于人類的思考過(guò)程。最終,應(yīng)用層利用數(shù)據(jù)擬合出的模型結(jié)果,對(duì)智能應(yīng)用的服務(wù)和產(chǎn)品端輸出指令,指揮包括機(jī)器人、無(wú)人機(jī)、3D打印等在內(nèi)的各種設(shè)備響應(yīng)用戶需求。盡管目前由于思考層面的計(jì)算存儲(chǔ)能力和建模能力的不足,導(dǎo)致人工智能還無(wú)法達(dá)到和人類相接近的“智慧”程度,但也足以支撐包括語(yǔ)音識(shí)別、圖像識(shí)別和知識(shí)圖譜在內(nèi)的各種AI技術(shù)在特定場(chǎng)景下的應(yīng)用。另外一方面,在具體的應(yīng)用場(chǎng)景中,更為優(yōu)化的算法和更為準(zhǔn)確的背景知識(shí)庫(kù)數(shù)據(jù)集等因素都有助于在不提升計(jì)算資源的前提下實(shí)現(xiàn)更優(yōu)的結(jié)果。這就給眾多專業(yè)領(lǐng)域的AI公司帶來(lái)了巨大的市場(chǎng)機(jī)遇。
我們看到,專用智能的商業(yè)化應(yīng)用風(fēng)生水起,在這個(gè)領(lǐng)域,巨頭和新貴都處于同一起跑線上,產(chǎn)業(yè)格局會(huì)趨于分散,先入者優(yōu)勢(shì)明顯。我們判斷,在數(shù)據(jù)、算法、云計(jì)算資源等幾個(gè)關(guān)鍵因素中,數(shù)據(jù)的獲得以及算法的優(yōu)化是先入者的護(hù)城河,能夠幫助他們?cè)趯S妙I(lǐng)域的特定場(chǎng)景下,迅速實(shí)現(xiàn)AI的商業(yè)化應(yīng)用,從而搶占市場(chǎng)。我們關(guān)注到國(guó)內(nèi)市場(chǎng)已經(jīng)出現(xiàn)了這樣的局面:語(yǔ)音識(shí)別領(lǐng)域的科大訊飛、計(jì)算機(jī)視覺(jué)方面的格林深瞳、語(yǔ)義識(shí)別方面的小i機(jī)器人、人臉識(shí)別方面的face++等等細(xì)分行業(yè)龍頭,都在具體應(yīng)用場(chǎng)景的技術(shù)結(jié)果上,實(shí)現(xiàn)了對(duì)百度、谷歌、微軟和IBM等AI巨頭的超越。

 

 

 

 

AI應(yīng)用層實(shí)現(xiàn)路徑以Nest為代表的專用智能產(chǎn)品和服務(wù)風(fēng)起云涌專用智能的應(yīng)用水平不斷提升將推進(jìn)智能產(chǎn)品和服務(wù)的智能化程度。為了能夠滿足用戶需求,智能產(chǎn)品和服務(wù)需要多種不同的AI技術(shù)支撐:
(1)谷歌的無(wú)人駕駛汽車(chē),在駕駛過(guò)程中需要計(jì)算機(jī)視覺(jué)對(duì)不同路況做出相應(yīng)的決策。為了實(shí)現(xiàn)無(wú)人駕駛,車(chē)輛需要配置激光測(cè)距系統(tǒng)、車(chē)道保持系統(tǒng)、GPS/慣性導(dǎo)航系統(tǒng)、車(chē)輪角度編碼器等設(shè)備,通過(guò)收集到的數(shù)據(jù)實(shí)時(shí)生成前方路面的三維圖像,并用計(jì)算機(jī)視覺(jué)技術(shù)判斷潛在的風(fēng)險(xiǎn)。毫無(wú)疑問(wèn),脫離了谷歌大腦的計(jì)算機(jī)視覺(jué)技術(shù)的支撐,谷歌無(wú)人駕駛應(yīng)用就是空中樓閣。
(2)再以Nest的智能溫控技術(shù)為例。為了能夠通過(guò)不斷地觀測(cè)和學(xué)習(xí)用戶習(xí)慣的舒適溫度來(lái)對(duì)室溫進(jìn)行動(dòng)態(tài)調(diào)整,并節(jié)約能源,Nest安裝了六個(gè)傳感器,不停地對(duì)溫度、濕度、環(huán)境光以及設(shè)備周邊進(jìn)行監(jiān)控和衡量,它能判斷房間中是否有人,以決定是否自動(dòng)關(guān)閉調(diào)溫設(shè)備。依托于強(qiáng)大的機(jī)器學(xué)習(xí)算法,Nest則能自己學(xué)習(xí)控制溫度。在使用這款調(diào)溫器的第一個(gè)星期,用戶可以根據(jù)自己的喜好調(diào)節(jié)室內(nèi)溫度,此時(shí)Nest便會(huì)記錄并學(xué)習(xí)用戶的使用習(xí)慣。為了能讓居室變得更舒適,Nest還會(huì)通過(guò)Wi-Fi和相關(guān)應(yīng)用程序與室外的實(shí)時(shí)溫度進(jìn)行同步,內(nèi)置的濕度傳感器還能讓空調(diào)和新風(fēng)系統(tǒng)提供適宜的氣流。當(dāng)用戶外出時(shí),Nest的動(dòng)作傳感器就會(huì)通知處理器激活“外出模式”。毫無(wú)疑問(wèn),脫離了深度學(xué)習(xí)技術(shù)的支撐,Nest的智能溫控是無(wú)法實(shí)現(xiàn)的。
(3)微信朋友圈的推送廣告服務(wù)。微信朋友圈的信息流(Feeds)廣告推送基于自然語(yǔ)言解析、圖像識(shí)別和數(shù)據(jù)挖掘技術(shù),通過(guò)分析用戶朋友圈語(yǔ)言特性,以及朋友圈圖片內(nèi)容,根據(jù)對(duì)用戶收入和消費(fèi)能力的分析來(lái)刻畫(huà)用戶畫(huà)像,并決定投放何種廣告。信息流廣告與社交平臺(tái)上好友發(fā)布的信息形式類似,廣告本身內(nèi)容將基于微信公眾賬號(hào)生態(tài)體系,以類似朋友圈的原創(chuàng)內(nèi)容形式進(jìn)行展現(xiàn),融合在信息流中,在基于微信用戶畫(huà)像記性定向的同時(shí),通過(guò)實(shí)時(shí)社交的混排算法,依托關(guān)系鏈進(jìn)行互動(dòng)傳播。如果沒(méi)有自然語(yǔ)言解析和圖像識(shí)別等AI技術(shù)的支撐,微信的信息流廣告推送服務(wù)的用戶體驗(yàn)將大打折扣。通過(guò)以上三個(gè)例子,我們不難看出,智能產(chǎn)品和服務(wù)是否能夠切中用戶的痛點(diǎn)需求,依賴于人工智能技術(shù)在產(chǎn)品背后能夠給予多大的支撐。當(dāng)前的智能產(chǎn)品市場(chǎng)之所以出現(xiàn)產(chǎn)品熱,需求冷的局面,主要的癥結(jié)在于所謂的智能硬件大多是“偽智能”產(chǎn)品,只是把功能性電子產(chǎn)品加上聯(lián)網(wǎng)和搜集數(shù)據(jù)的功能,例如以手環(huán)為代表的可穿戴設(shè)備,以智能機(jī)頂盒為代表的智能家居設(shè)備等等。我們認(rèn)為,殺手級(jí)的智能產(chǎn)品和服務(wù)必然是建立在強(qiáng)大的AI技術(shù)支撐下的。AI具體應(yīng)用層應(yīng)該是以Nest及更為先進(jìn)的智能產(chǎn)品和服務(wù)為代表。我們梳理了當(dāng)前智能產(chǎn)品和服務(wù)產(chǎn)業(yè)鏈上主要參與公司,典型的戰(zhàn)略布局分別有:
(a)以海爾和美的為代表的家電企業(yè)轉(zhuǎn)型智能家居方向;(b)以小米和360為代表的互聯(lián)網(wǎng)新貴從硬件入口開(kāi)始卡位;(c)以百度和谷歌為代表的互聯(lián)網(wǎng)巨頭從AI技術(shù)發(fā)力打造生態(tài)圈;(d)以??低暫痛蠼畡?chuàng)新為代表的計(jì)算機(jī)硬件制造商轉(zhuǎn)型智能硬件的行業(yè)應(yīng)用。

 

未來(lái)跨場(chǎng)景通用人工智能生態(tài)圈的格局

 

 基礎(chǔ)資源支持層實(shí)現(xiàn)路徑:顛覆馮·諾依曼架構(gòu)人腦芯片等技術(shù)將突破計(jì)算能力極限未來(lái)的人工智能將致力于通過(guò)底層硬件架構(gòu)的變革來(lái)實(shí)現(xiàn)。不同于現(xiàn)階段底層對(duì)云計(jì)算的依賴,硬件模式將直接從芯片層面實(shí)現(xiàn)對(duì)人工神經(jīng)網(wǎng)絡(luò)的模擬,目標(biāo)是構(gòu)建一個(gè)硬件大腦。我們認(rèn)為,這種突破將是下一代計(jì)算機(jī)科學(xué)的發(fā)展的重要方向。
因?yàn)樽罱?0年計(jì)算機(jī)科學(xué)更多關(guān)注的技術(shù)進(jìn)步在于信息處理的標(biāo)的這一層面,可以稱之為“大數(shù)據(jù)”或者“數(shù)據(jù)大爆炸”時(shí)代。在不遠(yuǎn)的未來(lái),數(shù)據(jù)大爆炸造成的結(jié)果是信息處理能力的瓶頸很快達(dá)到,因此,未來(lái)10年計(jì)算機(jī)科學(xué)的關(guān)注點(diǎn)將會(huì)轉(zhuǎn)移到如何突破現(xiàn)階段的計(jì)算能力極限,也就是顛覆馮·諾依曼的硬件架構(gòu)。這個(gè)方向可能是AI在硬件設(shè)備上的一個(gè)終極解決方案,但從目前的技術(shù)成熟度上看,這條路徑距離目標(biāo)還有非常遙遠(yuǎn)的距離。目前已經(jīng)看到的方向大致有以下三種:
(1) 人腦芯片。2014年8月,IBM宣布研制成功了一款大腦原型芯片TrueNorth,主攻超級(jí)計(jì)算機(jī)專業(yè)學(xué)習(xí)領(lǐng)域。TrueNorth微芯片由三星電子為IBM生產(chǎn),使用了三星為生產(chǎn)智能機(jī)和其它移動(dòng)設(shè)備微處理器所使用的相同制造技術(shù)。IBM就該芯片的底層設(shè)計(jì)與紐約康奈爾大學(xué)(Cornell University)紐約校區(qū)的研究人員進(jìn)行了合作。自2008年以來(lái),這一項(xiàng)目獲得了美國(guó)五角大樓高級(jí)計(jì)劃研究局的5300萬(wàn)美元注資。這款芯片集成了100萬(wàn)個(gè)神經(jīng)元和2.56億個(gè)突觸,與普通蜜蜂的大腦水平相當(dāng),而人腦平均包含1000億個(gè)神經(jīng)元和難以統(tǒng)計(jì)數(shù)量的突觸。目前,這款芯片每秒每瓦可實(shí)現(xiàn)460億次神經(jīng)突觸操作,它能像人腦一樣去探測(cè)并識(shí)別模式。簡(jiǎn)而言之,當(dāng)人腦芯片發(fā)現(xiàn)與字母不同部分相關(guān)聯(lián)的模式時(shí),能夠?qū)⑦@些字母關(guān)聯(lián)在一起,從而識(shí)別出單詞和整句,但距離可以商用的智能化程度還遙不可及。除IBM外,芯片巨頭英特爾、高通等公司也擁有了被工程師稱之為“神經(jīng)形態(tài)”(neuromorphic)的自主芯片設(shè)計(jì)。人腦啟發(fā)軟件公司Numenta創(chuàng)始人杰夫霍金斯(Jeff Hawkins)認(rèn)為,類似TrueNorth這樣的二元芯片未來(lái)將讓位于能夠更有效地模擬出人腦聯(lián)系功能的芯片產(chǎn)品,找到正確的神經(jīng)元結(jié)構(gòu)需要經(jīng)歷多年的研究過(guò)程。
(2) 量子計(jì)算。量子計(jì)算機(jī)是一種使用量子邏輯實(shí)現(xiàn)通用計(jì)算的設(shè)備。普通計(jì)算機(jī)存儲(chǔ)數(shù)據(jù)的對(duì)象是晶體管電路的狀態(tài),而量子計(jì)算用來(lái)存儲(chǔ)數(shù)據(jù)的對(duì)象是粒子的量子狀態(tài),它使用量子算法來(lái)進(jìn)行數(shù)據(jù)操作。量子計(jì)算機(jī)的優(yōu)勢(shì)在于強(qiáng)大的并行計(jì)算速度?,F(xiàn)在的計(jì)算機(jī)畢竟是二進(jìn)制的,一遇到比較復(fù)雜的建模,像準(zhǔn)確預(yù)測(cè)天氣,預(yù)測(cè)更長(zhǎng)時(shí)間后的天氣等等,就會(huì)很費(fèi)力費(fèi)時(shí);而超快量子計(jì)算機(jī)就能算,算得超快。因?yàn)楫?dāng)許多個(gè)量子狀態(tài)的原子糾纏在一起時(shí),它們又因量子位的“疊加性”,可以同時(shí)一起展開(kāi)“并行計(jì)算”,從而使其具備超高速的運(yùn)算能力。2014年,谷歌公司與科學(xué)家聯(lián)手研制量子級(jí)計(jì)算機(jī)處理器,目的是未來(lái)使機(jī)器人像人類一樣“獨(dú)立思考問(wèn)題”。但達(dá)到這個(gè)未來(lái)需要多久,目前我們還無(wú)法預(yù)知。
(3) 仿生計(jì)算機(jī)。仿生計(jì)算機(jī)的提出是為了解決如何構(gòu)建大規(guī)模人工神經(jīng)網(wǎng)絡(luò)的問(wèn)題。通用的CPU/GPU處理神經(jīng)網(wǎng)絡(luò)效率低下,如谷歌大腦的1.6萬(wàn)個(gè)CPU運(yùn)行7天才能完成貓臉的無(wú)監(jiān)督學(xué)習(xí)訓(xùn)練。谷歌大腦實(shí)現(xiàn)模擬人腦的突觸數(shù)量?jī)H為100億個(gè),而實(shí)際的人腦突觸數(shù)量超過(guò)100萬(wàn)億。采用CPU/GPU的通用處理器構(gòu)建數(shù)據(jù)中心,占地、散熱以及耗電等都是非常嚴(yán)峻的問(wèn)題。成本方面,這樣級(jí)別的數(shù)據(jù)中心,除了谷歌、百度之外,其他互聯(lián)網(wǎng)企業(yè)根本無(wú)力搭建。專門(mén)的神經(jīng)網(wǎng)絡(luò)處理器成為解決以上問(wèn)題的鑰匙。目前國(guó)內(nèi)的陳云霽團(tuán)隊(duì)所搭建的寒武紀(jì)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)正是基于仿生學(xué)的原理,通過(guò)寒武紀(jì)生物大爆炸中獲取的線索,實(shí)現(xiàn)的無(wú)需訪問(wèn)內(nèi)存,減少90%以上的片上通訊時(shí)間,并支持幾乎現(xiàn)有主流機(jī)器學(xué)習(xí)算法的網(wǎng)絡(luò)計(jì)算機(jī)。寒武紀(jì)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)跟主流GPU相比,取得了21倍的性能和300倍的性能功耗比提升。AI技術(shù)層的實(shí)現(xiàn)路徑:通用智能實(shí)現(xiàn)跨場(chǎng)景的終極應(yīng)用在專用智能的時(shí)代,AI的技術(shù)應(yīng)用是要針對(duì)不同的場(chǎng)景才能有效的。例如,格靈深瞳的計(jì)算機(jī)視覺(jué)技術(shù),在安防視頻監(jiān)控領(lǐng)域可以識(shí)別出犯罪分子的異常行為舉動(dòng)并予以報(bào)警,但換做是商場(chǎng)中,格靈深瞳的三維攝像頭就無(wú)法識(shí)別出客戶的性別年紀(jì)等特征,并根據(jù)客戶在不同柜臺(tái)中逗留的時(shí)間,分析出客戶可能偏好的產(chǎn)品并向其推薦。這兩個(gè)應(yīng)用場(chǎng)景其實(shí)都是依托于計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行識(shí)別和響應(yīng)的,但是專用智能時(shí)代,受到計(jì)算能力和建模能力的約束,同樣的計(jì)算機(jī)視覺(jué)技術(shù)卻無(wú)法解決跨場(chǎng)景的應(yīng)用。
在未來(lái),通用智能到來(lái)后,AI技術(shù)層的普適性將極大地提升。同樣一個(gè)視頻監(jiān)控的攝像頭加上背后的計(jì)算機(jī)視覺(jué)的云平臺(tái),放在不同的場(chǎng)合中,就能夠根據(jù)用戶不同的需求進(jìn)行不同的識(shí)別并做出智能化的決策行為。這種終極應(yīng)用的到來(lái),必須依賴于計(jì)算資源上突破現(xiàn)有的能力極限,并且在建模上超越現(xiàn)階段的深度學(xué)習(xí)算法的極限,真正讓AI像人類一樣去觀察和思考并做出行為決策。
我們認(rèn)為:在通用智能時(shí)代,進(jìn)入門(mén)檻最高,護(hù)城河最寬的是底層AI資源支持的平臺(tái)企業(yè);其次是技術(shù)層中在細(xì)分領(lǐng)域具備核心競(jìng)爭(zhēng)力的領(lǐng)先企業(yè);門(mén)檻最低的是應(yīng)用層的企業(yè),標(biāo)準(zhǔn)化程度越高意味著同質(zhì)化競(jìng)爭(zhēng)越激烈,但消費(fèi)電子的產(chǎn)品屬性也將允許差異化競(jìng)爭(zhēng)的空間。



全部評(píng)論 (0)
熱門(mén)領(lǐng)域講師
互聯(lián)網(wǎng)營(yíng)銷(xiāo) 互聯(lián)網(wǎng) 新媒體運(yùn)營(yíng) 短視頻 電子商務(wù) 社群營(yíng)銷(xiāo) 抖音快手 新零售 網(wǎng)絡(luò)推廣 領(lǐng)導(dǎo)力 管理技能 中高層管理 中層管理 團(tuán)隊(duì)建設(shè) 團(tuán)隊(duì)管理 高績(jī)效團(tuán)隊(duì) 創(chuàng)新管理 溝通技巧 執(zhí)行力 阿米巴 MTP 銷(xiāo)售技巧 品牌營(yíng)銷(xiāo) 銷(xiāo)售 大客戶營(yíng)銷(xiāo) 經(jīng)銷(xiāo)商管理 銷(xiāo)講 門(mén)店管理 商務(wù)談判 經(jīng)濟(jì)形勢(shì) 宏觀經(jīng)濟(jì) 商業(yè)模式 私董會(huì) 轉(zhuǎn)型升級(jí) 股權(quán)激勵(lì) 納稅籌劃 非財(cái)管理 培訓(xùn)師培訓(xùn) TTT 公眾演說(shuō) 招聘面試 人力資源 非人管理 服裝行業(yè) 績(jī)效管理 商務(wù)禮儀 形象禮儀 職業(yè)素養(yǎng) 新員工培訓(xùn) 班組長(zhǎng)管理 生產(chǎn)管理 精益生產(chǎn) 采購(gòu)管理 易經(jīng)風(fēng)水 供應(yīng)鏈管理 國(guó)學(xué) 國(guó)學(xué)文化 國(guó)學(xué)管理 國(guó)學(xué)經(jīng)典 易經(jīng) 易經(jīng)與管理 易經(jīng)智慧 家居風(fēng)水 國(guó)際貿(mào)易
鮮花榜
頭像
+6107朵
頭像
+6098朵
頭像
+6087朵
頭像
+6087朵
頭像
+6065朵
頭像
+6059朵
頭像
+6054朵
頭像
+6049朵
頭像
+6019朵

Copyright©2008-2025 版權(quán)所有 浙ICP備06026258號(hào)-1 浙公網(wǎng)安備 33010802003509號(hào) 杭州講師網(wǎng)絡(luò)科技有限公司
講師網(wǎng) www.3969a.com 直接對(duì)接10000多名優(yōu)秀講師-省時(shí)省力省錢(qián)
講師網(wǎng)常年法律顧問(wèn):浙江麥迪律師事務(wù)所 梁俊景律師 李小平律師