[問題] 想知道影片內容寫了什麼

看板DataScience作者 (03lii)時間3年前 (2021/12/07 20:14), 編輯推噓11(11041)
留言52則, 11人參與, 3年前最新討論串1/1
請求板上大大支援 5年前朋友寄給我的一封手寫信寄丟 多年後沒了交集 但還是很想知道內容寫了什麼 但影片是手機錄影 畫質不佳 有無方式可以增強解析 以下為影片截圖 https://i.imgur.com/qsyQpQg.jpg
在ask板被告知可以來這裡問問 如有錯板會刪文 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.129.87.75 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1638879290.A.1A9.html

12/07 23:58, 3年前 , 1F
只看這張照片的話,很難救了
12/07 23:58, 1F

12/08 10:50, 3年前 , 2F
其實是可以做的,但會是很大的一個問題
12/08 10:50, 2F

12/08 10:51, 3年前 , 3F
思路是這樣的,影片看來雖然解析度不夠文字不清楚,但是因
12/08 10:51, 3F

12/08 10:51, 3年前 , 4F
為文字大致外形還是可辨識,因此至少每一個字可以得到一個
12/08 10:51, 4F

12/08 10:52, 3年前 , 5F
可能是哪些字的文字分佈機率函數
12/08 10:52, 5F

12/08 10:53, 3年前 , 6F
然後再靠自然語言相關的技術,從機率函數中去挑選最可能組
12/08 10:53, 6F

12/08 10:53, 3年前 , 7F
成有意義句子的可能性
12/08 10:53, 7F

12/08 10:54, 3年前 , 8F
好了,概念說起來很簡單,但是技術難度就高了,特別是第二
12/08 10:54, 8F

12/08 10:54, 3年前 , 9F
階段的組句難度很高XD
12/08 10:54, 9F

12/08 11:32, 3年前 , 10F
不不 這連外型都很難辨識了吧= =
12/08 11:32, 10F

12/08 11:33, 3年前 , 11F
我倒是覺得如果是影片的話 也許能靠相鄰的frame救一
12/08 11:33, 11F

12/08 11:33, 3年前 , 12F
點點資訊回來 不知道有沒有類似task
12/08 11:33, 12F

12/08 11:36, 3年前 , 13F
這種restoration的問題我的看法是 如果人都很難猜出
12/08 11:36, 13F

12/08 11:36, 3年前 , 14F
原本的資料長怎樣 那機器也不會好到哪去
12/08 11:36, 14F

12/08 12:14, 3年前 , 15F
覺得要靠相鄰來救+1
12/08 12:14, 15F

12/08 19:57, 3年前 , 16F
你可以故意創造這類模糊文字的照片 然後自己 train model
12/08 19:57, 16F

12/08 19:57, 3年前 , 17F
去解
12/08 19:57, 17F

12/08 19:57, 3年前 , 18F
不然就有看有沒有現成的 model 和資料集 但應該有點難
12/08 19:57, 18F

12/09 12:32, 3年前 , 19F
其實還是有可能啦
12/09 12:32, 19F

12/09 12:32, 3年前 , 20F
現在的sr技術真的蠻強的
12/09 12:32, 20F

12/09 12:32, 3年前 , 21F
尤其是這種很特定、有固定pattern的資料
12/09 12:32, 21F

12/09 23:43, 3年前 , 22F
對於我這普通人看來是很困難的工程 感謝大家的回覆
12/09 23:43, 22F

12/10 02:25, 3年前 , 23F
這個題目很難作
12/10 02:25, 23F

12/13 21:52, 3年前 , 24F
現行去躁比較強的都英文
12/13 21:52, 24F

12/13 21:52, 3年前 , 25F
繁體中文dataset 來源根本不足xd
12/13 21:52, 25F

12/15 22:42, 3年前 , 26F
這種程度的模糊應該可以解
12/15 22:42, 26F

12/15 22:47, 3年前 , 27F
今年玉山不是有辦手寫辨識賽,資料集可以拿來用
12/15 22:47, 27F

12/16 01:39, 3年前 , 28F
請通靈王可能較容易0.0
12/16 01:39, 28F

12/24 15:41, 3年前 , 29F
同感是影片的話,比一張照片有更多的資訊
12/24 15:41, 29F

01/21 11:15, 3年前 , 30F
@yoyololicon 我說的外型,是指一些明顯可見的特徵
01/21 11:15, 30F

01/21 11:16, 3年前 , 31F
比如就算這麼模糊,但其中很多字明顯可見是左右兩塊組成,
01/21 11:16, 31F

01/21 11:17, 3年前 , 32F
中間那一頁最右上角那個字明顯有像「地」或「他」右下那個
01/21 11:17, 32F

01/21 11:18, 3年前 , 33F
彎勾形狀,另外從文字色的密度可猜測筆畫的密集程度等等
01/21 11:18, 33F

01/21 11:20, 3年前 , 34F
更細微還能看出一些如「然」「無」這些上密下疏,或是「喝
01/21 11:20, 34F

01/21 11:21, 3年前 , 35F
」左短右長而「和」會左長右短的特徵
01/21 11:21, 35F

01/21 11:22, 3年前 , 36F
因此先弄到大量手寫字庫訓練針對這類特徵的模型後,就有機
01/21 11:22, 36F

01/21 11:23, 3年前 , 37F
會嘗試對模糊的字進行辨識輸出候選字列表與對應機率
01/21 11:23, 37F

01/21 11:24, 3年前 , 38F
進一步就是上面講的,再串自然語言模型嘗試最可能組詞組句
01/21 11:24, 38F

01/21 11:24, 3年前 , 39F
的選項,就有機會輸出候選句子
01/21 11:24, 39F

01/21 11:25, 3年前 , 40F
但這真的是個可以寫無數篇 Paper 的大題目XD
01/21 11:25, 40F

01/21 14:02, 3年前 , 41F
我懂你的意思 但這個糊到學出來的分佈也不會很sharp
01/21 14:02, 41F

01/21 14:03, 3年前 , 42F
再拿來生可能的字句,可能會有數千條候選字句
01/21 14:03, 42F

01/21 14:04, 3年前 , 43F
題目worth trying 但不能保證是原po需要的解答
01/21 14:04, 43F

01/21 16:11, 3年前 , 44F
候選句可能很多,但特徵取得夠好夠多的話,有可能意外地機
01/21 16:11, 44F

01/21 16:12, 3年前 , 45F
率處理後高低機率差距很容易拉開,畢竟有些特徵事實上蠻容
01/21 16:12, 45F

01/21 16:13, 3年前 , 46F
易鎖定到相對少數的字,而文字本身就已經有字頻差距,再套
01/21 16:13, 46F

01/21 16:14, 3年前 , 47F
到詞庫又可以篩選掉很多低機率可能性,再進一步到了自然語
01/21 16:14, 47F

01/21 16:15, 3年前 , 48F
言模型又可以除去文法上直接不可能或低機率的組合
01/21 16:15, 48F

01/21 16:17, 3年前 , 49F
我直覺上是認為過程超級繁複且運算量很大,但做完的結果有
01/21 16:17, 49F

01/21 16:18, 3年前 , 50F
可能意外地不會有大量高機率候選句,因為某些特徵的篩選力
01/21 16:18, 50F

01/21 16:18, 3年前 , 51F
還是蠻強大的
01/21 16:18, 51F

01/21 16:20, 3年前 , 52F
當然,如果寫作者本身行文的文法就很特別或很糟會是麻煩
01/21 16:20, 52F
文章代碼(AID): #1Xhr0w6f (DataScience)
文章代碼(AID): #1Xhr0w6f (DataScience)