[問題] 辨識影片中人聲起始時間

看板Python作者 (黑心人)時間6年前 (2019/05/17 09:42), 編輯推噓2(203)
留言5則, 2人參與, 6年前最新討論串1/1
請問版友, 若我有一隻五分鐘的mp4影片, 想要辨識影片中的人講話時的起始時間。 例如:00:02 大家好 00:03 很高興今天能夠參與此次會議 並不需要辨識語音內容再轉文字, 只要能抓到起始時間即可, 不知道有什麼套件可以達成這個任務呢? 感謝閱讀。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.149.99 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1558057351.A.8F7.html

05/17 11:17, 6年前 , 1F
若你的影片包含了除了人聲以外的聲音,那這個問題就很難
05/17 11:17, 1F

05/17 11:18, 6年前 , 2F
反之,若影片裡的聲音非常乾淨主要都是人聲,那人工抽抽
05/17 11:18, 2F

05/17 11:18, 6年前 , 3F
Feature,自己調一下應該就可以做個7.8成
05/17 11:18, 3F

05/17 11:22, 6年前 , 4F
自動上字幕這種事情大家都想做,但是技術上還是存在瓶頸
05/17 11:22, 4F

05/17 11:46, 6年前 , 5F
Voice Activity Detection (VAD)
05/17 11:46, 5F
文章代碼(AID): #1StX67Zt (Python)
文章代碼(AID): #1StX67Zt (Python)