×

掃碼關(guān)注微信公眾號(hào)

未來智能胡郁出席達(dá)沃斯科學(xué)峰會(huì):下一代人機(jī)交互方式是什么?

2024/7/19 18:20:48      企業(yè)供稿

7月11日-12日,聚集了世界學(xué)術(shù)頂尖學(xué)者、科學(xué)精英、創(chuàng)新者和企業(yè)家的iCANX Davos Summit 達(dá)沃斯科學(xué)峰會(huì)在瑞士達(dá)沃斯圓滿舉辦。同期,由iCANX Association主辦、未來智能協(xié)辦的“人工智能+:探索發(fā)展前沿與引領(lǐng)趨勢(shì),培育新質(zhì)生產(chǎn)力論壇”,也邀請(qǐng)了全球范圍內(nèi)的人工智能交叉學(xué)科領(lǐng)域的科學(xué)家齊聚一堂,共同探討人工智能的前沿和趨勢(shì)。


image.png


未來智能董事長(zhǎng)胡郁在論壇上發(fā)表了主題演講,分享了他對(duì)AIoT時(shí)代人機(jī)交互方式的理解與展望——“經(jīng)歷了圖形交互界面、觸摸交互界面,下一個(gè)革命性的人機(jī)交互方式會(huì)是什么? ”


image.png


在漫長(zhǎng)的人機(jī)交互歷程中,人與實(shí)物如何產(chǎn)生自然、舒適的交互,一直是科學(xué)家和工程師們研究的重點(diǎn),而近年來隨著人工智能和物聯(lián)網(wǎng)的興起、深度學(xué)習(xí)和大數(shù)據(jù)技術(shù)的發(fā)展,人機(jī)交互也逐步從圖形、觸摸到語音不斷進(jìn)階,到如今,人類自然便捷的溝通方式——語音,早已成為人機(jī)交互的主流趨勢(shì)。

在胡郁看來,“語音之所以厲害,是因?yàn)闄C(jī)器有顯示屏,可以把文字、圖片、音頻和視頻直接播放給人看。而人并沒有顯示屏,要將大腦里的想法告訴機(jī)器,除了跳舞、畫畫、寫字、打手勢(shì),還有一個(gè)直接的辦法就是講話,而這就需要機(jī)器剛好聽得懂我們講話?!?/p>

但事實(shí)上,要讓機(jī)器聽清、聽懂人類語言并不是一件容易的事,在噪聲干擾、多人語音混疊的情況下如何精準(zhǔn)識(shí)別?在多語種情境下如何準(zhǔn)確翻譯?都是語音交互發(fā)展的關(guān)鍵瓶頸。

未來智能作為一家AI硬件公司,核心團(tuán)隊(duì)成員在AI語音領(lǐng)域已經(jīng)深耕超10年,從智能語音助手到AI會(huì)議辦公,訊飛會(huì)議耳機(jī)不僅可以在多人語音混疊的會(huì)議場(chǎng)景中智能識(shí)別出不同人物的聲紋特性,實(shí)現(xiàn)說話人角色區(qū)分;還支持32種語言同傳翻譯,在多種語境下也可以實(shí)現(xiàn)面對(duì)面實(shí)時(shí)翻譯以及同傳聽譯。5月剛發(fā)布的訊飛會(huì)議耳機(jī)Pro 2全新升級(jí)“紅點(diǎn)閃錄”,無需連接App即可一鍵開啟,為用戶帶來更便捷的錄音使用體驗(yàn)。

更重要的是,訊飛會(huì)議耳機(jī)搭載的viaim AI,可一鍵生成摘要總結(jié)和待辦事項(xiàng),內(nèi)置的“萬姆”助理有問必答,通過對(duì)話形式了解用戶需求,為其提供或有目的重點(diǎn)、或全面普適的方法與建議。


image.png


在本次達(dá)沃斯科學(xué)峰會(huì)上,胡郁就帶領(lǐng)專家學(xué)者們一同體驗(yàn)了未來智能會(huì)議耳機(jī)的同傳翻譯功能,相關(guān)學(xué)者們也“現(xiàn)學(xué)現(xiàn)用”,迅速將耳機(jī)的“同傳聽譯”和“摘要總結(jié)提取”功能用在了論壇的交流現(xiàn)場(chǎng)。


image.png


近年來,“大模型+語音”的發(fā)展模式,正在為智能語音技術(shù)和產(chǎn)業(yè)帶來新一輪的革命性突破,在胡郁看來,對(duì)于人機(jī)交互場(chǎng)景而言,這還只是一個(gè)開始——“隨著人工智能和機(jī)器人核心技術(shù)的發(fā)展,我們可以看到,以語音語言交互為主,以感知運(yùn)動(dòng)交互為輔的下一代人機(jī)交互系統(tǒng)的發(fā)展已經(jīng)迫在眉睫?!焙粽f。