直接說結論:
ChatGPT 3.5描述圖片內容大都是參照URL上的文字去做聯想,所以如果URL的文字和圖片內容關聯性極高,會讓使用者誤以為ChatGPT真的看得懂圖片。如果URL上的文字和圖片內容無關,就會出現牛頭不對馬嘴的狀況。
ChatGPT 4好像可以,但是需要申請API使用才行
Ref 1: https://the-decoder.com/visual-chatgpt-chatbot-can-now-process-images/
Ref 2: https://silentpcreview.com/gpt-4-image-input-chatgpt/
Ref 3: https://www.ithome.com.tw/news/155929
以下為使用ChatGPT 3.5測試結果
測試圖片1:
用ChatGPT詢問圖片內容:

測試圖片2:
用ChatGPT詢問圖片內容:

測試圖片3:
用ChatGPT詢問圖片內容:

測試圖片4:


測試圖片5:


測試圖片6:
