[問題] 計算多字詞的關聯並視覺化

看板R_Language作者 (Mike)時間10年前 (2015/08/17 01:24), 編輯推噓0(001)
留言1則, 1人參與, 最新討論串1/1
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 現在收集完需要分析的字詞 要建構出字詞與字詞間的關聯性,會以節點與連線的方式呈現。 假設關鍵字中Apple Apple是節點 連線出去連結到的節點就是與之相關的關鍵字 像是iOS、iPhone、iPad等等 1.想了解有那些Package能夠做到文字關聯性分析的效果 2.那些Package可以把計算完的結果視覺化成節點與連線的樣式 [程式範例]: 自己還沒開始寫 但找到Normalized Google distance法 Normalized Google distance是用google的搜尋當基礎 資料量計算強度後會證明兩字關聯性 若兩者越接近0表示兩字關聯越強的方式計算 但不太知道還有沒有更精確的方法可以做做看 [環境敘述]: 目前抓取的字詞約800多筆 以CSV檔案的形式存取 由於小弟的目標是論文的關鍵字 所以同一篇論文使用的關鍵字會存在同一行 [關鍵字]: 字詞 計算文字關聯 視覺化(節點與連線) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.238.37.101 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1439745890.A.A6C.html

08/17 20:57, , 1F
也許用word2vec 加上一些高維度資料的視覺化工具
08/17 20:57, 1F
文章代碼(AID): #1LqCTYfi (R_Language)
文章代碼(AID): #1LqCTYfi (R_Language)