
早在 Siri 出現之前,就有了 Audrey。但即便在 Audrey 之前,就已經有了那個名字不太好取的語音助理(Voice-trol)的雛形。
1950年6月,《大眾科學》雜誌撰稿人、來自紐約州北部的電子技術員卡爾·格雷夫(Karl Greif)發布了一篇關於如何自製聲控開關的教程,這款開關後來被命名為“語音控制”(Voice-trol)。當時,聲控技術還非常新穎,DIY幾乎是愛好者唯一的選擇。 「你的聲音蘊藏著力量,」格雷夫寫道,「它可以讓許多設備聽從你的指令。」如今,語音控制方案層出不窮,但對於大多數「設備」而言,要真正發揮聲音的力量,至少需要一些DIY技巧,例如安裝一個控制中心並將其與電器整合。
格雷夫1950年的說明書附帶電路圖和零件清單,其中包括電阻器、電容器、開關、變壓器和麥克風。由於他的設計需要使用者拆解被聲控設備的電子內部結構,因此他的DIY聲控裝置並不適合業餘愛好者。熟練使用電烙鐵和電壓表是必備條件。儘管如此,他的裝置仍然能夠響應簡單的語音指令——更準確地說,是響應聲音——來控制玩具火車、在廣告期間將收音機靜音或打開車庫門。例如,像「停」這樣的單音節字會觸發一個繼電器,讓火車停止(任何單音節字都可以,甚至拍手也可以)。像「前進」這樣的雙音節字會觸發繼電器兩次,使火車開始行駛。格雷夫甚至還提供了製作嬰兒監視器的說明。聲控裝置可以放在嬰兒床旁邊,並連接到安裝在另一個房間的警報器上。每當嬰兒哭鬧時,警報器就會響起。四年後,在《大眾電子》雜誌上,格雷夫描述了他開發的一款名為 Voice-trol 的語音啟動原型,該原型旨在以更少的努力和組裝插入當時流行的玩具火車模型。
1952年,貝爾實驗室推出了更先進的語音指令機器。這款名為奧黛麗(Audrey,即自動數位辨識器)的機器體積龐大,足以容納整個房間,能夠辨識0到9的數位語音;它甚至可以自動撥號。
自從 Voice-trol 和 Audrey 誕生以來,語音控制技術已經取得了長足的進步。然而,即便在經歷了半個多世紀語音技術發展歷程中諸多里程碑式的事件之後,語音控制的家用電器(除了聯網電視或「智慧型」電視之外)仍然沒有像 Greif 設想的那樣普及。雖然我們已經習慣與設備對話,並藉助亞馬遜 Alexa、蘋果 Siri、谷歌助手和微軟 Cortana 等如今流行的語音助手,但它們主要用於控制短信和電話等通信,或操作網絡搜索、導航、網上購物和音樂等虛擬服務。與只能辨識聲音的 20 世紀 50 年代的「前輩」不同,它們完全能夠解析「打電話給媽媽」或「播放 Dire Straits 的歌」等基本語音指令。但是,當涉及控製家用電器等實體物品時,語音啟動就顯得有些力不從心了。你不僅需要花一些時間來設定這些智慧家電,而且每台設備似乎都有自己的應用程式和特定的指令,需要一段時間才能適應。如果設備沒有連接到像 Alexa 這樣成熟的語音助手,甚至可能還需要進行語音訓練。即便如此,像 Google Nest 這樣的控制器仍然需要進一步的直接訓練。更重要的是,據報道,至少對亞馬遜和谷歌來說,語音助理從未獲利過。
不過,如果你是2020年代版的1950年代語音愛好者,好消息是你不需要電烙鐵。雖然仍然可以按照Greif的說明製作他的語音控制設備,但這與如今的技術相比相形見絀。此外,你可能還會遇到一些難題,例如如何將這個設備整合到如今高度緊湊的電子設備中,例如遙控火車模型或收音機鬧鐘。但是,DIY達人可以(某種程度上)從零開始建立一個基本的語音辨識指令模組,使用樹莓派(例如運行AIY Google Voice Kit的ReSpeaker 2-Mics Pi HAT)來開發語音助理。然後,使用執行TinyML的Arduino Nano(例如33 BLE Sense)添加自訂關鍵字辨識功能,該TinyML可以解析一些基本關鍵字(例如「嘿,PopSci 」)。或者,你也可以直接訪問AIY Google Voice Kit專案教學。
幸運的是,大多數主流家電製造商都提供可與應用程式和語音助理互動的智慧家電。 《大眾科學》雜誌介紹如何使用蘋果的HomeKit、Google的Assistant和亞馬遜的Alexa等語音助理智慧家庭中心來控制你的家。然而,在Voice-trol問世約70年後,想要用語音控制實體物品,仍然需要一些DIY技巧——例如如何連接無線設備、使用客製化應用程式以及了解設備的特性。
閱讀更多《大眾科學》文章。