宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

能戰勝行測圖形推理題目嗎?阿里推出QVQ-Max視覺推理模型

2025年03月28日 首頁 » 熱門科技

今日凌晨,阿里旗下的通義千問推出了一款視覺推理模型——QVQ-Max,Qwen團隊稱該模型具備理解圖片與影片內容的能力,並且還能根據所提供的資訊展開分析推理。

我們目前所用到的常見大模型雖然也能上傳圖片,但是只能識別圖片裡的文字,對畫面圖形則缺少概念,因此不能算作視覺推理模型,QVQ-Max則著重提升了這一點。

「例如,在一道幾何題中,它可以根據題目附帶的圖形推導出答案;在一段影片裡,它能根據畫面內容推測出接下來可能發生的情節。」

能戰勝行測圖形推理題目嗎?阿里推出QVQ-Max視覺推理模型

不過光看千問團隊的宣傳好像也感覺不出來到底有多厲害,不如我們直接來給它上上強度。

熱點科技這裡準備了幾道公務員行測的圖形推理模擬題,來看看QVQ-Max到底能不能給出正確答案。

首先我們在QWEN CHAT平台選擇這一模型,將從網上收集到的題目圖片上傳,直接詢問答案。不過需要注意的是,或許是由於該模型今天才上線,在上傳題目圖片時總是提示網路錯誤,稍後再試。大家可能需要耐心點多試幾次。

第一題如圖,QVQ-Max響應很快,但是想的好像有點多,思考了足足3500個漢字才給出答案D選項,但是回答錯誤,正確答案是B。

能戰勝行測圖形推理題目嗎?阿里推出QVQ-Max視覺推理模型

能戰勝行測圖形推理題目嗎?阿里推出QVQ-Max視覺推理模型

一題好像並不能證明實力,我們又上傳了新的一題,看看QVQ-Max能不能一雪前恥。不過這一題對於QVQ-Max來說好像有點困難,竟然思考了多達6000個漢字才給出答案,仍然是D選項,仍然是錯誤的,正確答案是B。

能戰勝行測圖形推理題目嗎?阿里推出QVQ-Max視覺推理模型

能戰勝行測圖形推理題目嗎?阿里推出QVQ-Max視覺推理模型

能戰勝行測圖形推理題目嗎?阿里推出QVQ-Max視覺推理模型

最後一次,再來一題。好在這次結果還算好,QVQ-Max給出了正確的答案B選項,但是思考時間實在太長,依然足足有6000個漢字,等待時間接近十分鐘,如果QVQ-Max去考試,恐怕沒做完題目就要收卷了。

能戰勝行測圖形推理題目嗎?阿里推出QVQ-Max視覺推理模型

能戰勝行測圖形推理題目嗎?阿里推出QVQ-Max視覺推理模型

看起來行測的圖形推理題目對於QVQ-Max來說有點超綱,本想試著上傳一段影片,測測QVQ-Max的影片能力,但是顯示一直上傳失敗,只得作罷。有興趣的朋友可以自行去測試一下QVQ-Max的其他能力噢。

根據Qwen團隊的解釋,QVQ-Max目前只是第一版,還有很多提升空間。希望Qwen團隊加把勁,讓QVQ-Max早日拿捏行測圖形推理。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新