宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

跨物種交流成為可能!谷歌AI研究室實現初步與海豚的語言溝通!

2025年04月17日 首頁 » 熱門科技

谷歌旗下的 AI 研究實驗室谷歌 DeepMind 近日宣布,成功開發出一款名為 DolphinGemma 的 AI 模型,根據谷歌的介紹,未來通過AI技術與海豚交流逐漸成為了可能。

DolphinGemma 是谷歌 DeepMind 於 2025 年 4 月 15 日宣布開發成功的一款 AI 模型。它基於谷歌開放的 Gemma 系列模型構建,DolphinGemma基於與谷歌Gemini系統相同的技術構建,擁有約4億個參數,其運作方式與ChatGPT等生成式語言模型類似,但生成的是海豚聲音而非文字。

跨物種交流成為可能!谷歌AI研究室實現初步與海豚的語言溝通!

目前的研究方向是讓DolphinGemma在聽完海豚聲音的「前半部分」後,由AI生成「後半部分」,並比對AI生成的後半部分與海豚實際發出的後半部分是否一致,以初步判斷「海豚語」是否有固定的單詞或結構。

技術原理:使用了谷歌獨特的音頻技術,其中 SoundStream 分詞器能快速把海豚聲音變成電腦能理解的信號,隨後由適合處理複雜序列的模型架構進行處理。

跨物種交流成為可能!谷歌AI研究室實現初步與海豚的語言溝通!

 

從目前的研究來看,海豚之間不僅存在他們種族的「語言」而且這種語言的溝通方式還可能與人類能實現跨物種交流。這是因為海豚的「語言」和人類語言高度接近。

一項發表在《皇家社會生物學通訊》的研究表明,海豚相互間交流的方式近乎於人類。

當一些海豚發出像吹口哨一樣的聲音時,這些聲音是由特定組織震動發出的,其運作原理類似於人類和許多陸生生物的聲帶振動。

跨物種交流成為可能!谷歌AI研究室實現初步與海豚的語言溝通!

 

‌聲音類型劃分‌

海豚主要使用三種聲音進行交流:

‌哨聲(Whistles)‌:用於群體間情感傳遞與個體識別,類似人類「姓名」。研究顯示不同哨聲組合可表達情緒變化(如興奮時頻率升高)。

‌脈衝聲(Burst-pulsed sounds)‌:構成「單詞」級資訊單元,通過排列組合形成完整「語句」,科學家已觀測到包含5個「詞彙」的句子結構。

‌滴答聲(Clicks)‌:主要用於回聲定位,通過發射


f=120−130 kHz 的超聲波探測環境,精度可達70米距離內識別2.5厘米物體。

‌聲納系統的精妙設計‌,前額超聲波發射器可聚焦信號,對特定區域進行高清探測。群體活動中採用避讓機制,同類聲納信號互不干擾,實現集群協作。

 

跨物種交流成為可能!谷歌AI研究室實現初步與海豚的語言溝通!

 

彼得·麥德森曾表示:

實際上,它們是通過鼻腔中結締組織的共振頻率來發聲的,而且它們能隨意調節肌肉緊張度和通過的氣流。這和人類用聲帶說話時做的一模一樣。和海豚類似,事實上谷歌2024年9月還推出了一款鯨魚聲音識別模型,它能夠識別出八種鯨魚的獨特叫聲,並精細區分其中兩種鯨魚的不同發聲類型。

而鯨魚也和海豚一樣,其語言和人類語言也具有相似性。

今年年初發表在《科學》雜誌上的一項研究驚奇地發現,通過模仿兒童學習語言的過程,鯨魚的歌聲與人類使用的語言存在統計相似性。

 

跨物種交流成為可能!谷歌AI研究室實現初步與海豚的語言溝通!

 

更好地理解海豚的溝通方式。例如,母海豚在團聚時常用的標誌性口哨聲,以及在戰鬥中發出的脈衝 「尖叫聲」,還有在求偶或追逐鯊魚時使用的 「嗡嗡」 聲,DolphinGemma 能夠捕捉和解讀這些不同聲音,將聲音與行為情境相結合。

WDP 計劃在 2025 年夏季使用新款 Pixel 9 搭建一個集聲音合成與監聽於一體的海豚溝通研究平台,使研究人員能夠實時聆聽海豚發出的聲音,並生成相應的 「回應」,從而極大提升研究的效率與準確性。

NatureLM 模型在揭開動物語言的神秘面紗之路上,再一次遞進一步,讓人們更接近理解大自然的真實面貌,幫助人們識別動物的種類、年齡以及它們發出的信號是痛苦還是遊戲等。

 

跨物種交流成為可能!谷歌AI研究室實現初步與海豚的語言溝通!
宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新