當前位置: 首頁 > 工業控制產品 > 運動控制 > 工業機器人 > 直角坐標型工業機器人
發布日期:2022-04-18 點擊率:78
近年來,音樂選秀類節目層出不窮,無論是歌手蒙面還是導師轉身,其目的都在于尋找一種能夠排除其他因素、回歸音樂本身的評價方法。前不久,央視的一檔歌唱類節目《渴望現場》就請來了這樣一位客觀公正的音樂評審——機器人“小渴”。
這臺由中科院自動化研究所研制的機器人會對每位走進“歌詠亭”選手的演唱進行評分,只有分數超過80分才說明得到了“小渴”老師的青睞,并有機會走出“歌詠亭”與觀眾見面。
給歌唱者打分這聽起來早已不是什么新鮮事,KTV里的評分系統甚至能夠列舉出與演唱者音色相近的歌星,那么“小渴”又有什么獨門秘訣呢?“傳統的音樂評分軟件一般只是簡單地把演唱者的音準和標準音做相似性對比來進行評價,說白了就是看你有沒有跑調,這種單一的評價標準并不能全面地衡量音樂的好壞,更難以理解歌唱者所要傳達的情感信息。”中科院自動化所研究院研究員王金橋解釋說,相比之下“小渴”復雜多了,它是第一次從音準、音域、調性、節奏、語感、樂感六個維度對演唱進行客觀評斷,兼顧了音樂欣賞的維度和量化的難度,是用科技在評價藝術。
“機器人評價藝術其實是一件非常困難的事情,最大的難點在于如何讓機器人去自動發現音樂中美的元素。”王金橋告訴《經濟日報》記者,我們邀請了大批音樂專家從多個維度對演唱進行評分,在此基礎上,通過卷積神經網絡的層級式結構對音樂頻譜進行層級式抽象和凝練,自動發現音樂中每一段每一句里蘊含樂符的共性之美。從而分別學習音樂中音準、音高、顫音振幅和顫音頻率等規律,完成整段音樂的美學量化。
同時神經網絡的逐層信息抽象特性能夠幫助機器人從音階傳遞到演唱技巧再到情感表達,進行逐層量化和分析,進而讓機器人能夠相對客觀地學習專家對音樂的評判,最終實現對音符“美”的“理解”。
由于各個歌手在演唱方式、曲風等方面有所不同,歌聲之間會呈現出較大的差異,但當海量音樂專家評分數據匯總在一起時,基本能夠代表當前主流音樂評審專家對音樂的評價。基于人工智能技術的音樂評判系統就是根據這些數據,讓“小渴”對音樂進行較為客觀和科學的評判。
此外,“小渴”的順風耳——卷積神經網絡所抽取到的多維語音特征具有精確量化的特性,在對音準信息進行量化區分時,精度能夠達到1‰。在此基礎上,再配合專家對歌聲音準表現的經驗打分作為監督信息,神經網絡模型就能夠對音準信息建立準確的數學表達模型,從而進行量化的音準打分。
而聽起來最縹緲的“樂感”,也有特定的數學模型支撐。音樂作為一種藝術,需要傳達某種情感,樂感就是人們了解這種感覺的感官能力。表現力是歌手演唱過程中的綜合表現,目前的評判標準更多是依賴于音樂專家的權威判別。“專家用1到10十個分數對表現力進行打分,我們通過卷積網絡、雙向長短期記憶模型提取音樂表現力的特征,該特征能對音樂在時間維度上的表現力進行充分分析,從而模擬專家對音樂表現力的評判。”王金橋說。
從已經播出的多期節目來看,“小渴”對多種音樂唱法都能給出公正的評價,如秦腔、說唱、英文歌曲等。在現場,“小渴”是與歌手的麥克風直接相連,任何一點小小的瑕疵都能被它捕捉到。“在具體的打分過程中,機器人是聽一句給一句的分數,專家可能偶爾走神沒聽見,但機器人不存在這種情況,并且不會受到現場氣氛和環境的影響。”王金橋說,“小渴”對歌手的一視同仁、對打分的公正合理也同樣得到了觀眾的認可,大家都親切地稱它為“史上最冷靜的評審”。
“‘小渴’目前還是初級版本,我們會引入更多的算法和更多元的維度來評價音樂,我們也會嘗試讓它學著創造音樂,使一個個動人的音符完成美妙的組合。”談及“小渴”的未來,王金橋和他的團隊希望把它推廣到各種音樂評分系統中,比如唱吧,KTV等。唱歌愛好者們可以結合“小渴”的評價,不斷改進自己的唱法。有朝一日,說不定“小渴”也會從“音樂評審”升級為“夢想導師”。(中國經濟網)
下一篇: PLC、DCS、FCS三大控
上一篇: 索爾維全系列Solef?PV