Blog

人工智慧在音樂創作中的應用:「Magenta」計畫

1_I-tE7z7UiXfwyHtw-cYLOg

阿塔利(Jacques Attali)認為,音樂是一面鏡子,反映出社會現實,同時映射著未來。今日我們可以說:演算法才是那面映射著未來的鏡子。人工智慧正引領人們穿越那道虛實界牆,在物理與數位模型間遊走,致使人類、機器與音樂的關係產生質變。本文將透過選介數個人工智慧與音樂結合的專案,藉以描繪此類工具被應用於創作上的可能性,以及所延伸出的美學想像。

以開源資料庫實現有趣而易近的音樂互動

Google於2016年中開展「Magenta」計畫,探索機器學習在音樂與藝術創作過程中所能扮演的角色,以實現更趨近於人類表現性的數位語言。即使背後運算原理相當複雜,但成果都是為了使創作過程能夠變得更直覺且具啟發性,讓每個人都能運用這些工具體驗全新的音樂生成路徑,而非憑藉大數據來取代人的創意。

Nsynth合成器可找出相異樂器特徵組合的可能性。(圖源/NSynth Super官方網站)

以此專案下的「NSynth」項目為例,受到以資料庫為基礎的圖像辨識技術啟發,團隊為NSynth建立了一個龐大的聲音數據庫,包含一千多種原音與電聲類樂器,涵蓋音色、質地與力度變化等數值。其與傳統合成器的主要差異,在於NSynth並非直接指定參數來改變波形與音色,而是藉由將數十萬種聲音的特徵標籤化,創建出深度神經網絡系統,使其具備自行探索、生成全新音色的能力。創作者能藉由混合不同樂器來生成出新的聲響。

Making music with NSynth Super

Magenta計畫中有許多有趣的網頁互動項目,例如「無限鼓機(The Infinite Drum Machine)」與「AI重奏(AI Duet)」。「無限鼓機」是透過深度學習來分類聲音素材的節奏編曲機,以日常聲響取樣為主軸,依其聲紋特徵來視覺化每一個聲音間的關聯,最終以節奏編曲機為操作介面來呈現。只要選擇某個聲音區塊,就能在鄰近區域探索這些連續、漸變的聲響,找出近似或同質的音色。「AI重奏」則是以琴鍵為操作介面,系統會於使用者互動過程中,將所輸入的一串音符視為一個個事件,經由機器學習功能,將彼此在音高與時間的相關性建構為一個音樂地圖。當我們彈奏出不同的旋律,「AI重奏」便能從中即時創作出相對應的樂句,就像人與機器的即興演奏。隨著互動次數增加,系統所生成的回饋將會與演奏者的風格越來越相似。

Write a comment