PTT數位生活區 / DataScience

Fw: [問題] Bag of words 中文單字詞問題

看板DataScience作者ctr1 (【積π】)時間7年前 (2018/06/26 11:12)推噓2(2推 0噓 2→)

留言4則, 3人參與討論串1/2 (看更多)

※ [本文轉錄自 Python 看板 #1RCQbiCM ] 作者: ctr1 (【積π】) 看板: Python 標題: [問題] Bag of words 中文單字詞問題時間: Tue Jun 26 10:48:06 2018 from sklearn.feature_extraction.text import CountVectorizer text = [ "我|愛你", "他|愛狗", "貓|愛鼠" ] vectorizer = CountVectorizer() vectorizer.fit(text) vector = vectorizer.transform(text) print (vectorizer.vocabulary_) # 維度 print (vector.shape) print (vector.toarray()) ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂ 輸出： {'愛你': 0, '愛狗': 1, '愛鼠': 2} (3, 3) [[1 0 0] [0 1 0] [0 0 1]] ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂ 想請問版上的各位大大若是我希望單字(我、他、貓)也要放在bag內要如何改寫這段程式或要用什麼關鍵字去google查詢呢謝謝打家 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.124.158.195 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1529981292.A.316.html ※ 編輯: ctr1 (59.124.158.195), 06/26/2018 10:50:29 ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: ctr1 (59.124.158.195), 06/26/2018 11:12:34

推

06/26 16:29, 7年前 , 1^F

06/26 16:29, 1^F

推

06/27 07:05, 7年前 , 2^F

06/27 07:05, 2^F

→

06/27 07:07, 7年前 , 3^F

06/27 07:07, 3^F

→

06/27 08:29, 7年前 , 4^F

06/27 08:29, 4^F

‣ 返回看板[ DataScience ] 研討

‣ 更多 ctr1 的文章

文章代碼(AID): #1RCQyaWe (DataScience)

討論串 (同標題文章)

以下文章回應了本文：

Re: [問題] Bag of words 中文單字詞問題

7年前, 06/27

完整討論串 (本文為第 1 之 2 篇)：

排序：最新先 | 最舊先 | 留言數

Re: [問題] Bag of words 中文單字詞問題

7年前, 06/27

2

4

Fw: [問題] Bag of words 中文單字詞問題

7年前, 06/26

在新視窗開啟完整討論串 (共2篇)

DataScience 近期熱門文章

2

6

[問題] 文字探勘的特徵選取問題

[ DataScience ]

2月前, 07/01

1

9

[問題] 請問kaggle有商業方案嗎? 它每週gpu的限

[ DataScience ]

6月前, 02/26

4

4

[徵才] 美國Amazon暑期實習生

[ DataScience ]

7月前, 01/23

1

6

[問題] 請教大家有推薦的GPU租用服務嗎?

[ DataScience ]

9月前, 12/20

3

8

[討論] 如何計算兩個不同欄的相似度？

[ DataScience ]

1年前, 09/07

1

4

Re: [問題] 如何在python中訓練好autoencoder?已刪文

[ DataScience ]

1年前, 08/06

2

12

[討論] 有人開始用KAN了嗎？

[ DataScience ]

1年前, 08/04

4

13

Re: [討論] cognitive model/causal ML執行的細節

[ DataScience ]

1年前, 05/15

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

7

14

Re: [情報] 勁敵變盟友！輝達砸50億美元入股英特爾

[ PC_Shopping ]

4小時前, 09/19

76

143

Re: [心得] 欣亞藍寶石9070xt nitro+出任務失敗

[ PC_Shopping ]

6小時前, 09/18

4

16

[請益]如何選擇跟單交易員

[ DigiCurrency ]

6小時前, 09/18

3

7

[問題] 鎖定畫面無法顯示3D效果?

6小時前, 09/18

3

9

[麥書] Macbook air M4丐板vs M3 24/512

6小時前, 09/18

38

106

Re: [心得] 欣亞藍寶石9070xt nitro+出任務失敗心得

[ PC_Shopping ]

7小時前, 09/18

37

52

Re: [心得] 欣亞藍寶石9070xt nitro+出任務失敗心得

[ PC_Shopping ]

7小時前, 09/18

10

82

[問題] Google Pay 問題很多?

7小時前, 09/18

更多即時熱門文章 >>

‣ 返回看板[ DataScience ] 研討

‣ 更多 ctr1 的文章

文章代碼(AID): #1RCQyaWe (DataScience)