[請問] 有關於語音檔轉文字的軟體

看板EZsoft (小軟體)作者 (飛影)時間8年前 (2016/09/23 16:23), 8年前編輯推噓2(2024)
留言26則, 5人參與, 最新討論串1/1
除了麥克風輸入轉文字外 想請問各位版友 是否有其他的語音檔(EX:開會或簡報的錄音檔案)轉文字的軟體? 因有現成的語音檔 想從語音檔裡讀檔成文字 畢竟以現況來說是 一邊聽錄音檔 一邊自行繕打至Word 但因為錄音檔理的內容 有時候會聽不清楚而暫停 甚至重複聽取 這樣會耗太多時間了 想說以電腦軟體來輔助的話 應該可以節省時間 即使電腦的辨識能力可能不是很正確 那也沒關係 辨識不正確 再自行修正即可 目前我在網路上爬文 得知的是這種的 https://speechnotes.co/zh/ 後來又爬文到 有網友找到我要的點 就是 http://www.mobile01.com/topicdetail.php?f=512&t=4838622 該網友ID是:ahwaiyuen98 他提到說:音訊檔轉換輸入PC LINE IN、可以轉換就行 line on laptop 到底是什麼意思呢!? 依他圖示所列 一個錄音檔播放 在該網頁上按下麥克風 就是沒出現轉檔文字 想請教各位版友 不知問題點在哪呢!? 還有 若有其他的語音檔轉文字的軟體 還要煩請各位版友為我解惑了 謝謝! 再次感謝電腦軟體版版友的答覆與指教!(鞠躬 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 163.30.93.1 ※ 文章網址: https://www.ptt.cc/bbs/EZsoft/M.1474618983.A.7D8.html

09/24 05:35, , 1F
人都聽不清楚的部份,電腦更難辨識。
09/24 05:35, 1F

09/24 05:36, , 2F
倒不如讓人戴耳機聽,然後用麥克風複誦給電腦辨識。
09/24 05:36, 2F

09/24 07:13, , 3F
樓上中肯
09/24 07:13, 3F
如果可以我也希望 (淚 但該錄音檔是經由會議上的委員談話 故很難給予委員戴上耳機 用麥克風對話到電腦上 爾後若有機會 會徵求委員的意願 不然真的只能用聽打方式來記錄電腦了

09/24 08:56, , 4F
ahwaiyuen98的意思應該就是j557558說的耳機孔與麥克
09/24 08:56, 4F

09/24 09:00, , 5F
風孔(或Line in孔)用3.5公對公音源線對接的方式,這樣
09/24 09:00, 5F

09/24 09:02, , 6F
網頁的麥克風功能才能清晰收到錄音檔的聲音來語音辨識
09/24 09:02, 6F
原來如此 我會再試試看 若有疑問 會再請教n大了! (感恩 ※ 編輯: linmarkyu (111.251.17.151), 09/26/2016 00:20:40

09/26 08:46, , 7F
是教你聽錄音檔委員講的話,由你複誦給電腦辨識。
09/26 08:46, 7F

09/26 08:51, , 8F
委員聽自己錄音再複誦給電腦?乾脆讓他打講稿給你就好。
09/26 08:51, 8F
原來您的意思是這個 這樣的話 由我再複誦給予電腦辨識 也不是跟聽打類似嗎? 雖然這樣做也會比較快一些 但我覺得這樣感覺與聽打類似 只是做法不同 不過 還是感謝您的建議 這個方法 我會詳細考慮 或許這個方法會比聽打好一些!

09/26 09:41, , 9F
如果你的需求是"先經由電腦做完整語音辨識 再由人力修改錯誤
09/26 09:41, 9F

09/26 09:42, , 10F
這樣可以試試看(前提是語音檔本身夠清晰 否則你會修到瘋掉)
09/26 09:42, 10F

09/26 09:43, , 11F
如果只是希望由電腦語音辨識來修正連人力都聽不清楚的部分
09/26 09:43, 11F

09/26 09:43, , 12F
那效果應該很差
09/26 09:43, 12F
基本上 我聽錄音檔時 多少會有些雜音 畢竟一個會議室 隔音效果沒這麼好 但有聽不清楚的地方 以重複聽取多次且放慢速度 勉強還可以辨識出來 所以 我想修正程度的部分 應該不會太大 但還是希望經由電腦語音辨識 節省聽打與複誦之時間 若是別無他法之時 我會以C大的方式試試 用自己複誦方式 來給電腦語音辨識 這樣多少會省去聽打的耗時! 最後 也謝謝樓上各位大大的回覆 昨日與前天本來要即時回覆 但因為礙於昨日颱風天與前天的忙碌之困擾 拖到今日才回覆 也沒想到小軟體版 還會有版友查看與回覆 真的很感謝以上版友 您們的意見與建議 我會再加以試試 再次感謝樓上各位大大們的回覆! (再度敬禮 ※ 編輯: linmarkyu (59.115.81.112), 09/28/2016 14:43:33

11/27 01:11, , 13F
如果是含滷蛋的委員 你只好認命了
11/27 01:11, 13F

11/27 01:19, , 14F
這是TTS的逆向工程 以現在的技術 也才剛啟蒙而已
11/27 01:19, 14F

11/27 01:24, , 15F
而且也只在歐美的拼音字稍有點進展 還要發音標準才行
11/27 01:24, 15F

11/27 01:28, , 16F
youtube的字幕並不是即時口譯 而是有人先處理好字幕
11/27 01:28, 16F

11/27 01:32, , 17F
聯合國各國語言的即時口譯 也是口譯室的口譯人員為之
11/27 01:32, 17F

11/27 01:38, , 18F
至於機器人(寵物)聽懂人語 則是有限制的語句pattern
11/27 01:38, 18F

11/27 01:40, , 19F
這根本不是人工智慧 只是資料庫的配對處理
11/27 01:40, 19F

11/27 01:45, , 20F
語音助手 在winxp前就有了 至今一樣也是資料庫的搜尋
11/27 01:45, 20F

11/27 01:48, , 21F
這也是win10遲遲推不出中文語音助手 因為沒人去建立
11/27 01:48, 21F

11/27 02:00, , 22F
龐大的資料庫 日文的發音字不超過100個也是如同歐美的
11/27 02:00, 22F

11/27 02:04, , 23F
拼音字組合 但中文的發音字則有近萬個(加上四聲)
11/27 02:04, 23F

11/27 02:13, , 24F
加上組句(context)處理 語意加語法 夠龐大的資料庫
11/27 02:13, 24F

11/27 02:18, , 25F
這還要委員們的發音標準才可行 所以認命吧 不變才是最好
11/27 02:18, 25F

11/27 02:26, , 26F
用mp3splt-gtk 它可設多個段點 方便你聽取 把它當播放器
11/27 02:26, 26F
文章代碼(AID): #1NvEPdVO (EZsoft)
文章代碼(AID): #1NvEPdVO (EZsoft)