ChatGPT測試_20 (來玩Whisper)

Github原始連結:

https://github.com/ggerganov/whisper.cpp?fbclid=IwAR11EmaJ7kCkPb0ymkMbXX_HmdaPFm_XPmXhRhr2Qp3UBvPfPfNWvobe33Q

  • 輕鬆玩測試語音檔
  • 來測試跑在IOS(英文語音)
  • 來測試跑在IOS(中文語音)
  • Whisper v.s. 離線版的Siri

Note: Whisper有多個Model可以選,中文語音轉文字我是採用「Large」Model來進行測試

Ref: https://github.com/ggerganov/whisper.cpp/tree/master/models


以下皆是依照Github上的Readme操作

輕鬆玩測試語音檔

輸出結果

得到輸出的結果: And so my fellow Americans, ask not what your country can do for you, ask what you can do for your country.


來測試跑在IOS(英文語音)

(1) 開啟examples/whisper.swiftui中的whisper.swiftui.xcodeproj

(2)一樣先看Readme

記得把「Model檔」和「Sample Audio file」放到指定的project目錄底下

(3)把「Model檔」和「Sample Audio file」放到指定的project目錄底下

(4)來執行語音轉文字測試

可以讀聲音檔轉文字,也可錄聲音,再轉成文字(p.s. 這裡無法即時轉成文字,一定要「停止錄音」後才能轉成文字)


來測試跑在IOS(中文語音)

(1)改一段code

LibWhisper.swift中的fullTrancribe function的language改成zh

(2)下載支援中文的Model檔(ex: ggml-large.bin (檔案大小3GB) )

(3)執行結果

Whisper也懂中文喔!! (p.s. 記得要用支援中文的Model檔(ex: ggml-large.bin))


Whisper v.s. 離線版的Siri

原始文字內容:

你是 Google One 的會員嗎?跟大家說 Google One 不只可讓你有更多的雲端儲存空間,還有提供好用的照片編輯功能可以用,不管是要修圖、調色,甚至是要 P 掉路人都行哦

Ref: https://agirls.aotter.net/post/62037


以下是我自己對Whisper & Siri各別念3次得到語音轉文字的結果:

(p.s. 因為Whisper沒法透過念「逗號」和「句號」轉成實際標點符號,故以下挑戰省略標點符號

Whisper(with ‘Large‘ Model)執行結果:

離線版的Siri的執行結果:

個人心得:

在沒有標點符號的前提下,Siri挑戰Whisper中文轉譯能力失敗XD

探索更多來自 LifeJourney 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading