?
\????吳桂林總是很樂于向人展示自己公司現(xiàn)在使用的語音智能技術(shù)。
????11月底,在百度語音平臺三周年發(fā)布會上,這位愛奇藝技術(shù)總監(jiān)拿出手機(jī)打開了自家的手機(jī)客戶端,對它發(fā)出語音指令:“我的會員沒錢了,給我打開VIP充值?!彪S后App就跳轉(zhuǎn)到了會員充值以及支付頁面。
????動(dòng)動(dòng)嘴就能給身邊的設(shè)備下達(dá)指令,實(shí)現(xiàn)自己的需求,眼下能享受這樣智能化服務(wù)的人越來越多。據(jù)吳桂林介紹,每天有上百萬愛奇藝App的用戶會使用語音搜索,其中80%以上可以轉(zhuǎn)化為有效點(diǎn)擊。
????作為移動(dòng)互聯(lián)網(wǎng)時(shí)代比較典型的應(yīng)用之一,視頻App的這一變化反映了許多用戶和開發(fā)者的共同感受:不知不覺間,我們使用的互聯(lián)網(wǎng)產(chǎn)品已經(jīng)變得更加智能化,人工智能、機(jī)器學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)等原本有些冷門的詞匯,也慢慢被社會廣泛討論起來。
????隨著人臉識別、語音合成等技術(shù)日趨成熟,走過PC、移動(dòng)兩大階段的互聯(lián)網(wǎng),下一個(gè)階段會不會是更加聰明、智能的智能互聯(lián)網(wǎng)?
????分歧
????今年11月中旬的第三屆世界互聯(lián)網(wǎng)大會上,兩位互聯(lián)網(wǎng)大佬關(guān)于人工智能的分歧成了最引人關(guān)注的焦點(diǎn)之一。
????百度公司創(chuàng)始人、CEO李彥宏聲稱,移動(dòng)互聯(lián)網(wǎng)時(shí)代已經(jīng)結(jié)束,這個(gè)風(fēng)口已經(jīng)沒有可能出現(xiàn)“獨(dú)角獸”企業(yè),未來的機(jī)會在人工智能。而騰訊公司控股董事局主席、CEO馬化騰則認(rèn)為,人工智能只是新技術(shù)和新工具,絕對不會因?yàn)槿斯ぶ悄軄砹?,移?dòng)互聯(lián)網(wǎng)就毀掉了。
????李彥宏支撐自己觀點(diǎn)的一個(gè)理由是,起步于2012年左右的移動(dòng)互聯(lián)網(wǎng)時(shí)代,主要得益于移動(dòng)端用戶的快速增長,但目前國內(nèi)互聯(lián)網(wǎng)滲透率已經(jīng)超過50%,如果把老人小孩都去掉,真正能成為移動(dòng)互聯(lián)網(wǎng)用戶的人群已經(jīng)不多了。
????一些數(shù)據(jù)和現(xiàn)象似乎也在說明移動(dòng)互聯(lián)網(wǎng)進(jìn)一步增長的機(jī)會減少了。根據(jù)美國市場研究公司IDC的預(yù)計(jì),今年全球智能手機(jī)出貨量將達(dá)到14.5億部,同比增長0.6%,遠(yuǎn)低于2015年的10.4%。
????在智能手機(jī)銷量只能勉強(qiáng)實(shí)現(xiàn)微幅增長的同時(shí),移動(dòng)互聯(lián)網(wǎng)的另一重要載體App的情況也不容樂觀。唱吧、魔漫相機(jī)、瘋狂猜圖、臉萌、圍住神經(jīng)貓、無秘、足記……爆款A(yù)pp越來越多,流行的時(shí)間卻似乎越來越短,甚至有行業(yè)分析師表示,App的生命周期平均只有10個(gè)月。
????在接受中國青年報(bào)·中青在線記者采訪時(shí),科大訊飛輪值總裁胡郁也表達(dá)了與李彥宏類似的觀點(diǎn)。在他看來,隨著人口紅利的逐漸消退,智能互聯(lián)網(wǎng)逐漸代替移動(dòng)互聯(lián)網(wǎng)的趨勢已經(jīng)逐漸清楚了。“盡管新的手機(jī)在不斷地賣出去,但總的用戶數(shù)相對穩(wěn)定,已經(jīng)基本進(jìn)入了飽和階段?!?/p>
????那么,下一輪機(jī)會在哪里?胡郁注意到,今年以來很多大企業(yè)和小型創(chuàng)業(yè)團(tuán)隊(duì)開展了不同的嘗試,有的在智能穿戴設(shè)備上發(fā)力,有的鉆研無人車,“這種狀態(tài)有點(diǎn)像前幾年智能機(jī)剛出現(xiàn)的時(shí)候”。但總結(jié)各種嘗試的方向后,胡郁發(fā)現(xiàn)它們有一個(gè)共同的趨勢:大多數(shù)設(shè)備都在智能化、開放化。
????在DCCI互聯(lián)網(wǎng)研究院院長劉興亮看來,移動(dòng)互聯(lián)網(wǎng)之后,互聯(lián)網(wǎng)的發(fā)展將會進(jìn)入一個(gè)“智能時(shí)代”。不同于PC和移動(dòng)互聯(lián)網(wǎng)時(shí)代以個(gè)人電腦、手機(jī)為終端接入互聯(lián)網(wǎng),那時(shí)候任何設(shè)備都可能成為互聯(lián)網(wǎng)的接入終端,而手機(jī)這樣的設(shè)備也可能會被淘汰。
????“智能互聯(lián)網(wǎng)更多強(qiáng)調(diào)的是每個(gè)設(shè)備能夠獨(dú)立地、有智慧、有感情地工作,可以理解為,以后每個(gè)物品都有可能成為一個(gè)機(jī)器人,一個(gè)電腦?!眲⑴d亮說。
????押寶
????因?yàn)榭春弥悄芑ヂ?lián)網(wǎng)的發(fā)展前景,百度已經(jīng)在這上面投入許多資源和精力,尤其是在語音智能方面。
????“語音識別是非常重要的交互辦法,有很大的潛力去徹底改變?nèi)藱C(jī)交互的效率和辦法?!?1月22日下午,百度首席科學(xué)家吳恩達(dá)在接受中國青年報(bào)·中青在線記者采訪時(shí)提到,語音是最自然而方便的交互方式,語音智能也是目前技術(shù)比較成熟、用戶感受比較直觀的智能交互方式。
????他舉例說:“比如未來你在家里想開電燈,想把空調(diào)調(diào)到24℃,如果可以不再需要拿出手機(jī),就可以使用準(zhǔn)確率很高的語音技術(shù)的話,我覺得很多用戶都會覺得有非常大的價(jià)值?!?/p>
????為此,當(dāng)天百度宣布向公眾開放4項(xiàng)全新的語音技術(shù)的接口:情感合成、遠(yuǎn)場方案、喚醒二期技術(shù)和長語音方案。從效果和作用來看,這4項(xiàng)新開放的技術(shù)能解決用戶在使用語音交互場合時(shí),經(jīng)常會面臨的一些普遍而關(guān)鍵的問題。例如,百度情感合成技術(shù)主要聚焦在為合成語音“加入情感”,目前可達(dá)到接近真人發(fā)聲的效果。
????選擇語音作為智能互聯(lián)網(wǎng)切入口的不止百度。11月21日~23日,搜狗、百度和科大訊飛3家公司先后召開了發(fā)布會,向外界展示了自己的語音智能產(chǎn)品和實(shí)力,并且都宣布其中文語音識別準(zhǔn)確率達(dá)到了97%。
????科大訊飛更是將野心延展到了物聯(lián)網(wǎng)上,推出了一款“萬物聯(lián)網(wǎng)輸入法”,想通過語音操作的方式解決物聯(lián)網(wǎng)設(shè)備的人機(jī)交互問題。在其最新推出的多款新產(chǎn)品中,既有可實(shí)現(xiàn)中、英等語言即時(shí)互譯的便攜式翻譯機(jī),也有汽車人機(jī)交互系統(tǒng)飛魚助理,還有通過AIUI技術(shù)識別身份、分析數(shù)據(jù)、辦理業(yè)務(wù)的曉曼機(jī)器人。
????科大訊飛董事長劉慶峰在演講中表示,以語音為主、鍵盤為輔的人機(jī)交互正逐漸成為剛需,語音智能技術(shù)的推出和開放也有利于全社會的創(chuàng)新。據(jù)他介紹,科大訊飛把智能云平臺開放給開發(fā)者之后,平臺上總用戶達(dá)到8.9億,每天30億人次訪問量,創(chuàng)業(yè)團(tuán)隊(duì)從去年的7萬增加到21萬個(gè)。
????對于一些企業(yè)在語音智能方面的布局,洪泰創(chuàng)新空間創(chuàng)始人、CEO王勝江認(rèn)為,從語音來切入智能互聯(lián)網(wǎng)領(lǐng)域是一個(gè)很好的入口,因?yàn)橹悄芑ヂ?lián)網(wǎng)最終要解決的還是人與機(jī)器的連接問題。但在此過程中也會遇到一些難題,例如語音難以完全標(biāo)準(zhǔn)化、人工智能的交互仍存在許多不足。
????預(yù)言
????對語音智能是否足夠智能的擔(dān)心不只出現(xiàn)在創(chuàng)投圈里,鉆研人工智能多年的專家也頗有擔(dān)心。
????“我們假設(shè)這樣一個(gè)場景。一個(gè)男人的聲音說:‘打啊,打啊,你打啊。’另一個(gè)女人的聲音說:‘反了,反了,反了你?!Z音智能的機(jī)器人會怎么判斷?它可能就會覺得這是兩夫妻在打架了。但如果我們走到窗戶前一看就會知道,場景其實(shí)是一男一女正在練習(xí)倒車?!?/p>
????11月23日,這個(gè)生動(dòng)的場景模擬引起了臺下觀眾的哈哈大笑。做出這個(gè)假設(shè)場景的是已經(jīng)關(guān)注語音智能領(lǐng)域十余年的中國人工智能學(xué)會理事長、中國工程院院士李德毅。
????李德毅認(rèn)為,對于語音智能的研究要盡量接近現(xiàn)實(shí)使用的場景,尤其是要讓語音智能置于語義和語境中去學(xué)習(xí)和理解,甚至實(shí)現(xiàn)交互認(rèn)知。目前的語音智能還不能達(dá)到這個(gè)水平。
????“現(xiàn)在我們到一些機(jī)器人展廳去看,不到3分鐘就覺得意思不大,如果你買了個(gè)(機(jī)器人)回家,不到兩個(gè)月你就把它處理掉了,原因是它太死板?!崩畹乱阕⒁獾?,目前很多語音智能技術(shù)還停留在簡單的語音對話階段,離交互認(rèn)知還遠(yuǎn)遠(yuǎn)不夠。
????根據(jù)新智元發(fā)布的《中國人工智能產(chǎn)業(yè)發(fā)展報(bào)告》的描述,在人工智能60年的發(fā)展歷程中,經(jīng)歷了兩次退潮:20世紀(jì)七八十年代,由于計(jì)算能力不足、難以應(yīng)對不確定環(huán)境等原因,人工智能的討論熱度逐漸冷卻;21世紀(jì)初,一些人工智能技術(shù)成功商用但跨越式發(fā)展失敗。
????根據(jù)上述《報(bào)告》的統(tǒng)計(jì),目前全國在人工智能領(lǐng)域創(chuàng)業(yè)的公司約有200多家,大部分創(chuàng)建于2010年以后,絕大多數(shù)融資仍處于天使輪或者A輪階段。但胡郁認(rèn)為,目前的人工智能技術(shù)還處于“弱人工智能”階段,大多還只能達(dá)到語音助手的水平。
????語音智能還未實(shí)現(xiàn)交互認(rèn)知,技術(shù)只達(dá)到語音助手的水平。智能互聯(lián)網(wǎng)的基礎(chǔ)人工智能技術(shù)會不會迎來第三次退潮?
????記者把這個(gè)問題拋給胡郁,他托著腮思考了好一會兒,然后說:“以前的人工智能退潮都有一個(gè)現(xiàn)實(shí)的問題,沒有從研究階段轉(zhuǎn)到使用階段,但現(xiàn)在這次浪潮中我們可以看到,已經(jīng)在很多方面真實(shí)應(yīng)用了?!?/p>
????作為技術(shù)研究出身的高管,胡郁認(rèn)為,人工智能的這一波浪潮能達(dá)到怎樣的高度目前還不知道,但他認(rèn)為,與其在浪潮中去預(yù)測,倒不如加速手頭正在進(jìn)行的研究。