[問題] 從文字評論探勘分類器特徵值

看板DataScience作者 (batman)時間4年前 (2020/07/14 00:34), 4年前編輯推噓6(609)
留言15則, 6人參與, 4年前最新討論串1/1
作業系統: win10 問題類別:ML, NLP 使用工具: Python 問題內容: 主要任務是從餐飲評論中,找出能夠套用在篩選餐飲的特徵值 例如所有評論都有類似「東西很好吃,價錢也不貴,可是服務不太好」的內容,就可以推 論餐飲普遍重視食物口味、服務、以及價錢 在知道口味,服務,價錢很重要後,該怎麼針對這三個特徵去給值呢? 例如A餐廳「東西 很好吃,價錢也不貴,可是服務不太好」,B餐廳「東西不好吃,價錢偏貴,可是服務很 好」,該怎麼給出A餐廳跟B餐廳,在口味,服務,價錢這三個面向的分數呢? 我目前的想法是不知道有沒有專屬於各個面向的情緒分析,或是專屬於各個面向的分類模 型,用那個情緒分析或分類模型來給值 想知道有沒有其他方法呢? 或是有我說明不清的地方也麻煩各位提出,感謝~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.136.251.155 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1594658097.A.491.html

07/14 00:48, 4年前 , 1F
Train 3個model啊
07/14 00:48, 1F
可是那三個面向沒有標籤,請問要怎麼訓練呢orz

07/14 00:50, 4年前 , 2F
你找找multiple choice
07/14 00:50, 2F
請問是直接搜multiple choice嗎?我搜出來是如何用python出選擇題@@ 感謝回答! ※ 編輯: nchunerdy120 (36.231.57.7 臺灣), 07/14/2020 07:00:35

07/14 07:23, 4年前 , 3F
直接rule base人工標記關鍵字感覺最簡單,肯定跟否定關鍵
07/14 07:23, 3F

07/14 07:23, 4年前 , 4F
可以拿別人做好的
07/14 07:23, 4F
請問別人做好的rule based是從kaggle抓嗎? 還是有其他管道呢? 感謝! ※ 編輯: nchunerdy120 (223.136.251.155 臺灣), 07/14/2020 07:54:26

07/14 08:58, 4年前 , 5F
一樓說的應該是 bert multiple choice
07/14 08:58, 5F
好的,我研究看看,感謝~

07/14 12:08, 4年前 , 6F
自己label啊 不要指望別人幫你label
07/14 12:08, 6F
所以這種情況一般都是自己標籤嗎? 因為我第一次處理這種東西,然後數據量又很大( 八百萬筆),所以問題比較多,感謝

07/14 12:36, 4年前 , 7F
我個人是推薦從github抓
07/14 12:36, 7F
好的我查查看,感謝~ ※ 編輯: nchunerdy120 (223.136.251.155 臺灣), 07/14/2020 16:30:31

07/14 21:07, 4年前 , 8F
關鍵字: aspect level sentiment analysis
07/14 21:07, 8F
感謝您,我查查看~ ※ 編輯: nchunerdy120 (223.136.138.95 臺灣), 07/15/2020 10:20:07

07/17 21:11, 4年前 , 9F
可以考慮用bert接三個分類器,出來就是三個類的評分,
07/17 21:11, 9F

07/17 21:11, 4年前 , 10F
初期可以考慮請人手動標出一百篇三項評分,或是爬蟲看
07/17 21:11, 10F

07/17 21:11, 4年前 , 11F
看有沒有現成網站資料可以蒐集,在嘗試用snorkel做資料
07/17 21:11, 11F

07/17 21:11, 4年前 , 12F
增強。個人認為表現應該就很不錯了
07/17 21:11, 12F

07/28 07:23, 4年前 , 13F
bert 加上一層NN負責分類就可以
07/28 07:23, 13F

07/28 07:24, 4年前 , 14F
花錢找labeling company幫忙 印度有 台灣好像也有些慈
07/28 07:24, 14F

07/28 07:24, 4年前 , 15F
善機構有
07/28 07:24, 15F
文章代碼(AID): #1V38qnIH (DataScience)
文章代碼(AID): #1V38qnIH (DataScience)