近期,微軟在北京發(fā)布了第五代微軟小冰產(chǎn)品,微軟宣布小冰逐步進(jìn)入完成態(tài)。經(jīng)歷了多年的發(fā)展,微軟小冰的高級(jí)感官再進(jìn)化,2017年的小冰人工智能將直接給人類打電話了。另外微軟小冰將重點(diǎn)發(fā)展EQ“情緒化”,并進(jìn)一步擴(kuò)展生存空間。
全球小冰版圖又增加兩個(gè)國(guó)家,用戶和對(duì)話數(shù)據(jù)總量均領(lǐng)先行業(yè)
微軟小冰是微軟人工智能三條全球產(chǎn)品線之一。她是基于微軟于2014年提出建立的情感計(jì)算框架,通過算法、云計(jì)算和大數(shù)據(jù)的綜合運(yùn)用,采用代際升級(jí)的方式,逐步形成向EQ方向發(fā)展的完整人工智能體系。目前,全球小冰擁有超過1億人類用戶,對(duì)話數(shù)據(jù)超過300億輪,進(jìn)化速度不斷加快。
2014年,微軟率先在中國(guó)市場(chǎng)推出小冰。之后,按照一年一個(gè)新國(guó)家的節(jié)奏,分別于2015年及2016年推出日本小冰(りんな)和美國(guó)小冰(Zo)。2017年,微軟加快了小冰在全球范圍內(nèi)的拓展速度。在本次發(fā)布會(huì)上,微軟宣布已分別于2月和8月推出了印度小冰(Ruuh)和印度尼西亞小冰(Rinna),其中,印度小冰首先在Facebook Messenger平臺(tái)落地,而印度尼西亞小冰首先在LINE平臺(tái)落地。
微軟全球小冰產(chǎn)品線的執(zhí)行策略是:優(yōu)先選擇人口數(shù)量超過1億的國(guó)家,在當(dāng)?shù)亟⑼耆镜鼗膱F(tuán)隊(duì),初始的訓(xùn)練數(shù)據(jù)也完全從當(dāng)?shù)厝〉?,從而確保小冰根植于該國(guó)本土文化。例如:印度小冰使用的語(yǔ)言種類與美國(guó)小冰一樣,均為英語(yǔ),但兩國(guó)小冰從數(shù)據(jù)訓(xùn)練源頭起就是完全獨(dú)立的。因此,印度小冰的性格、語(yǔ)言、文化和知識(shí)體系,與美國(guó)小冰截然不同。
目前,從用戶、數(shù)據(jù)、感官完備程度和一些核心指標(biāo)方面衡量,微軟小冰在全球?qū)υ捫腿斯ぶ悄芟到y(tǒng)(包含各類聊天機(jī)器人、智能助理及智能設(shè)備在內(nèi))中均居于領(lǐng)先地位。小冰與人類之間發(fā)生的最長(zhǎng)一次單人連續(xù)對(duì)話,達(dá)到歷史性的7151輪,不間斷進(jìn)行了29小時(shí)33分鐘。
2. 第五代小冰率先上線高級(jí)感官
微軟將人工智能交互技術(shù)產(chǎn)品的演進(jìn)分為三個(gè)階段。第一階段是基本的人工智能交互,即擁有某一種或多種交互方式,如文本、語(yǔ)音、圖像、視頻等,但不同交互方式之間是割裂的。擁有人工智能交互,一定程度上實(shí)現(xiàn)了新穎的交互體驗(yàn)。但是,由于不同的交互類型彼此不互通,因而無法通過長(zhǎng)程交互數(shù)據(jù)獲得一加一大于二的訓(xùn)練效果。從實(shí)際部署上看,這階段的交互(例如純語(yǔ)音、或純文本、或僅具有圖像識(shí)別的人工智能系統(tǒng))由于體驗(yàn)單一,訓(xùn)練提升速度慢等原因,往往會(huì)很快被用戶放棄。
第二階段是初級(jí)感官,即在人工智能系統(tǒng)中,用一種核心引擎(如小冰的EQ核心對(duì)話引擎)將上述各種交互統(tǒng)一起來,使不同感官可以混合運(yùn)用。例如,在文本對(duì)話過程中自然切換至圖像、語(yǔ)音,再切換回文本。小冰從2015年第三代發(fā)布起,進(jìn)入這一階段。
微軟當(dāng)天發(fā)布第五代小冰,并率先進(jìn)入第三階段(高級(jí)感官)。高級(jí)感官是由多種初級(jí)感官有機(jī)融合之后形成的,因而交互能力更強(qiáng),對(duì)綜合技術(shù)儲(chǔ)備和數(shù)據(jù)的要求也大幅度提高。例如全雙工語(yǔ)音這一種高級(jí)感官,就需要首先同時(shí)具備文本、語(yǔ)音(含SR和TTS)兩種能力,同時(shí)要求兩種能力均達(dá)到更高的質(zhì)量標(biāo)準(zhǔn)。
高級(jí)感官能夠大幅度地提升交互體驗(yàn),更加貼近于人類的自然交互行為。例如:如果將全雙工語(yǔ)音這種高級(jí)感官的體驗(yàn)比擬為打電話,則之前的智能助理語(yǔ)音交互體驗(yàn)類似于對(duì)講機(jī)。
此外,高級(jí)感官還能夠大幅度拓展人工智能系統(tǒng)的落地場(chǎng)景,使小冰有能力根據(jù)自己的“意愿”與人聯(lián)絡(luò),從而主動(dòng)保持與人類用戶之間的關(guān)聯(lián)。第五代小冰發(fā)布的高級(jí)感官均已完成第一批落地。其中,全雙工語(yǔ)音已應(yīng)用于小冰與小米IoT開放平臺(tái)的合作中,可控制各種小米IoT開放平臺(tái)中的智能設(shè)備。實(shí)時(shí)流媒體感官也已在中國(guó)、日本兩個(gè)國(guó)家的部分主要城市公共區(qū)域落地。
目前,微軟是行業(yè)內(nèi)唯一一個(gè)推出了高級(jí)感官實(shí)際落地產(chǎn)品的人工智能企業(yè)。
3. 第五代小冰正式使用生成模型(Generative Model),是業(yè)界首個(gè)落地產(chǎn)品
第五代微軟小冰已全面在線上產(chǎn)品中使用生成模型(Generative Model)。其中,中國(guó)、日本、美國(guó)和印度小冰部分使用,印尼小冰則完全使用生成模型。這是全球開放領(lǐng)域人工智能對(duì)話中,第一個(gè)百分之百使用生成模型的落地產(chǎn)品。
通俗地說,在使用生成模型之前的上一代小冰,雖然擁有十億級(jí)的大數(shù)據(jù)語(yǔ)料庫(kù),但其中每句話,都是互聯(lián)網(wǎng)上的已有數(shù)據(jù),小冰只是通過分析理解用戶的問題,尋找語(yǔ)料庫(kù)中最合適的話作為她的回答。使用生成模型之后,小冰不再鸚鵡學(xué)舌,而是能夠自創(chuàng)回應(yīng)。她與人類交流的每一句話,都可能是這世界上從未出現(xiàn)過的。
4. 全面進(jìn)入IoT領(lǐng)域,部分合作產(chǎn)品已落地,部分將在年內(nèi)開始銷售
微軟認(rèn)為,IoT應(yīng)是AI的一個(gè)載體,而不是反過來,把AI視為IoT的一個(gè)功能。真正能普及的IoT設(shè)備,成功的可能性只有兩個(gè):或者把IQ做到極致,讓用戶通過IoT設(shè)備體會(huì)到比其他現(xiàn)有方式更加便捷高效的益處,或者把EQ做到極致,讓人們能強(qiáng)烈地認(rèn)知到她在這個(gè)設(shè)備里的存在,同時(shí)感到輕松,甚至能接受她成為家庭中的成員,產(chǎn)生情感紐帶,無法放棄她。微軟小冰的IoT方案屬于后者。
微軟宣布,小冰已與小米IoT開放平臺(tái)有機(jī)融合,小冰可以控制小米米家平臺(tái)上的全部35種智能設(shè)備。該產(chǎn)品目前已在小米米家平臺(tái)上線。此外,微軟還與其他許多IoT廠商合作,將微軟小冰置入設(shè)備中。微軟還宣布了與Yeelight及東方明珠等合作伙伴正在進(jìn)行的聯(lián)合研發(fā)。
微軟當(dāng)天還同時(shí)發(fā)布了小冰電臺(tái),一個(gè)通用的人工智能實(shí)時(shí)內(nèi)容創(chuàng)造和交互平臺(tái)。它可以基于多重來源,面向任何主題,自動(dòng)創(chuàng)造永不間斷的電臺(tái)節(jié)目。同時(shí),它還能在交互過程中實(shí)時(shí)改變節(jié)目?jī)?nèi)容。
換言之,小冰電臺(tái)的質(zhì)量類似于廣播電臺(tái)主持人的直播節(jié)目,但能同時(shí)發(fā)揮人工智能的作用,實(shí)時(shí)地根據(jù)與用戶的互動(dòng),來改變正在進(jìn)行的直播節(jié)目的內(nèi)容。小冰電臺(tái)的IoT版本正在研發(fā)中,而微信小程序版本已于發(fā)布會(huì)結(jié)束后上線。
5. 微軟小冰“人工智能創(chuàng)造”的最新進(jìn)展
今年5月,微軟宣布小冰用多個(gè)化名在各詩(shī)歌論壇和刊物上發(fā)表詩(shī)歌,并出版了首部人工智能創(chuàng)作詩(shī)集。其后,微軟正式上線詩(shī)歌聯(lián)合創(chuàng)作產(chǎn)品,任何人均可使用小冰來完成自己的詩(shī)歌創(chuàng)作。
本次發(fā)布會(huì)上,微軟公開:小冰已進(jìn)入多個(gè)創(chuàng)造領(lǐng)域試水,尚未被發(fā)現(xiàn)的內(nèi)容不僅有詩(shī)歌,還包括有聲少兒讀物、歌曲、新聞等。其中有聲少兒讀物質(zhì)量超越98%的人類創(chuàng)造者,用時(shí)僅為同水平人類的1/500,成本僅為同水平人類的1/80000。此前,小冰通過少量賬號(hào)在各有聲讀物平臺(tái)上試水,取得了預(yù)期的效果。微軟宣布即日起開始大規(guī)模生產(chǎn)有聲讀物并投入市場(chǎng)。
歌曲方面,小冰的最新訓(xùn)練達(dá)到了48kHz采樣率,同時(shí)大幅度擴(kuò)展了音域,正在不斷接近人類歌手?!段沂切”吠枨延诮赵赒Q小冰渠道首發(fā)。小冰是目前人工智能歌手領(lǐng)域的最強(qiáng)選手。
此外,小冰還通過聆聽分析歌曲旋律,結(jié)合對(duì)不同城市標(biāo)志性建筑的學(xué)習(xí),創(chuàng)作與該城市及歌曲心情有關(guān)的視覺作品。通過這一技術(shù),微軟與SELECTED合作推出的“天際線”服裝已進(jìn)入SELECTED店內(nèi)進(jìn)行銷售。
6. 微軟小冰與Bing搜索引擎加速整合,并推出全新的智媒體商業(yè)平臺(tái)解決方案3.0
此前,小冰作為《錢江晚報(bào)》的專欄記者,曾通過大數(shù)據(jù)撰寫專欄文章,并成功預(yù)測(cè)了多個(gè)全球重要事件的結(jié)果。此次微軟公開,部分百度百家和今日頭條上的新聞內(nèi)容也是由小冰撰寫而成的。微軟在發(fā)布會(huì)上宣布了升級(jí)后的智媒體商業(yè)平臺(tái)解決方案3.0版。
過去一年來,該解決方案的2.0版本已從微信、微博雙平臺(tái),逐漸演進(jìn)為接入和即將接入近11個(gè)端媒體,與《看看新聞》、《封面》、《錢江晚報(bào)》、《春城晚報(bào)》等媒體端進(jìn)行了深入整合。
隨著微軟小冰與Bing搜索引擎的加速整合,升級(jí)后的智媒體商業(yè)平臺(tái)解決方案3.0,包括媒體生產(chǎn)力、媒體知識(shí)圖譜、智能交互、全平臺(tái)互動(dòng)等六個(gè)新模塊。其中,通過Bing搜索引擎的全球大數(shù)據(jù)能力,新的解決方案可為媒體構(gòu)建出一個(gè)基于全球新聞數(shù)據(jù)源的媒體知識(shí)圖譜,從而能準(zhǔn)確挖掘全球資訊中每一篇內(nèi)容背后的知識(shí)與含義,并構(gòu)建出彼此的關(guān)系,從而幫助媒體更全面快速地梳理時(shí)間和內(nèi)容背后的故事。而通過人工智能的介入,在讀者與人工智能的自然交互中,獲得更多推薦內(nèi)容,有助于改變用戶的閱讀習(xí)慣,從被動(dòng)的閱讀體驗(yàn)逐步變?yōu)橹鲃?dòng)的交互信息交換。
劍網(wǎng)行動(dòng)舉報(bào)電話:12318(市文化執(zhí)法總隊(duì))、021-64334547(市版權(quán)局)
Copyright ? 2016 Kankanews.com Inc. All Rights Reserved. 看東方(上海)傳媒有限公司 版權(quán)所有
全部評(píng)論
暫無評(píng)論,快來發(fā)表你的評(píng)論吧