[問題] Word2Vec LSTM sentiment classification

看板DataScience作者 (ep)時間6年前 (2018/04/10 13:11), 6年前編輯推噓3(302)
留言5則, 1人參與, 6年前最新討論串1/2 (看更多)
ctrl + y 可以刪除一整行,請將不需要的內容刪除 文章分類提示: - 問題: 當你想要問問題時,請使用這個類別。 - 討論: 當你自己已經有答案,但是也想聽聽版友意見時。 - 情報: 當你看到消息時,請使用這個類別。 根據板規規定,做適當的轉換,以及摘錄重要文意。 - 心得: 當你自己想要分享經驗時,請使用這個類別。 (回答並非義務,所以當有人回答時,哪怕句謝謝也好,多多回應,大E可編輯文章) (如果用不到以下框架,如觀念問題請自行視情況刪除作業系統,使用工具等項目) 作業系統:(win10) 問題類別:(DL, RNN, NLP) 使用工具:(python,keras,gensim word2vec) 問題內容: 最近嘗試對文本進行正負面評價分類 先自己訓練了word2vec模型(一個詞256維) 然後參考網路上的code https://blog.keras.io/using-pre-trained-word-embeddings-in-a-keras-model.html 利用tokenizer和sequence padding把文章轉成對應的編碼(400維向量) 再利用embedding 層設置權重讓匯入的文章變成400*256的矩陣 Embedding層後接著三層LSTM然後Flatten和Dense輸出2維向量用softmax和crossentropy 預測正負面 目前已經都訓練完成,但是現在想要實際丟入一些新資料進去預測,新的文章該如何轉換 成這個model的輸入呢? 直接參考上面的code用一樣的方法將文章編碼就可以輸入了嗎? 感謝各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.26.70.117 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1523337118.A.C01.html ※ 編輯: CaptPlanet (110.26.70.117), 04/10/2018 13:12:49 ※ 編輯: CaptPlanet (110.26.70.117), 04/10/2018 13:51:04

04/11 00:01, 6年前 , 1F

04/11 00:03, 6年前 , 2F
這個研討會的task 3 是推特的語意分析
04/11 00:03, 2F

04/11 00:10, 6年前 , 3F
沒有回答到你的問題 但你可以看看state of the art
04/11 00:10, 3F

04/11 00:10, 6年前 , 4F
用什麼方法
04/11 00:10, 4F

04/11 00:22, 6年前 , 5F
我說錯了 語意分析是task 4 不是3
04/11 00:22, 5F
文章代碼(AID): #1Qp4UUm1 (DataScience)
文章代碼(AID): #1Qp4UUm1 (DataScience)