在 XR(擴展現實)領域,高效文本輸入依舊是一道亟待攻克的難題。特別是在沒有實體鍵盤的情境下,如何提升輸入效率、降低誤差,成為影響生產力場景落地的關鍵因素。
為了應對這一挑戰,由英國伯明罕大學 VR 實驗室的研究團隊牽頭,聯合谷歌、哥本哈根大學、亞利桑那州立大學、德國馬克斯·普朗克智能系統研究所和西北大學的專家,共同推出了 XR TEXT Trove——全球首個系統化聚合 XR 文本輸入技術的資料庫。
這個資料庫堪稱一個「技術寶庫」,已收錄超過 170 種文本輸入技術,涵蓋了學術界與產業界在 XR 文本交互領域的研究成果。通過 32 項分類編碼指標,該資料庫對各技術的交互特徵與性能表現進行了細緻梳理。交互維度包括輸入設備、使用身體部位、是否支持並發輸入、觸覺反饋形式等;性能維度則聚焦於每分鐘輸入詞數(WPM)、錯誤率(TER)等關鍵指標。
XR TEXT Trove 背後的主導者、伯明罕大學心理與電腦科學雙聘副教授 Max Di Luca 介紹說:「我們打造這個開源資料庫,旨在助力研究者和開發者更快地找到合適的文本交互路徑,推動XR在辦公、遠程協作、社交等領域的實際應用。」
研究團隊指出,在現有的文本輸入方法中,多指輸入是唯一能夠接近傳統鍵盤打字效率的方式。根據資料庫中的數據繪製的圖表顯示,每增加一個手指進行並發輸入,平均可提升 5WPM 的輸入速度。然而,懸空輸入方式仍然面臨著效率與疲勞並存的困境。
此外,研究還發現,觸覺反饋、外部支撐表面(如桌面)以及僅顯示手指末端可視化,都是當前能夠顯著提升輸入體驗的關鍵因素。藉助物理支撐面,可以有效減少肌肉的持續緊繃,從而避免「大猩猩手臂綜合症(Gorilla Arm Syndrome)」的發生。
儘管已有大量創新探索,但 XR 領域中尚無任何輸入技術能夠真正替代傳統鍵盤格式。主要瓶頸仍然在於輸入效率與學習曲線之間的矛盾。
研究者認為,XR 領域若想迎來真正的文本輸入突破,可能需要一場類似於手機「滑動輸入(swipe typing)」的創新革命——藉助AI和機器學習技術,大幅縮短手指移動路徑,在多指鍵盤布局中實現超越 PC 的輸入速度。
Di Luca 表示:「我們堅信,這項工作將為 XR 社區提供堅實的資源基礎,就像我們此前發布的『Locomotion Vault』資料庫為 VR 運動交互提供了統一參考一樣。」
這一研究成果已被 ACM CHI 2025 國際人機交互大會正式接收,並將於下月在日本橫濱會議上發表。屆時,全球的研究者和開發者將有機會共同探討 XR 文本輸入技術的未來發展方向。