Re: [問題] 如何判別不同字個數

看板Python作者 (卓)時間14年前 (2011/07/13 12:27), 編輯推噓0(001)
留言1則, 1人參與, 最新討論串3/3 (看更多)
※ 引述《timTan (用口頭禪區分年記)》之銘言: : ※ 引述《a0954153 (卓)》之銘言: : : 就是例如 有一個 test.txt , 裡面是一篇文章 : : test.txt內容如下: i am a pig pig pig pig : : 則 判別出 4 : : 有四個不同的單字 : : 我只有想到這樣做, : : import string : : t=open('test.txt') : : G={} : : a=string.split(t.readline()) : : for i in range(len(a)) : : G[a[i]]=1 : : print len(G) : : 只能拿現有的弄 : : 請問還有更好的方法嗎:( : print len(set( "i am a pig pig pig pig".split() )) 恩恩,我把它改成了這樣不知道會不會好一點 t=open(r'C:\_____.txt') G=t.readlines() K=set() for i in range(len(G)): G[i]=G[i].replace(',',' ').replace('.',' ').replace('!',' ').replace('?',' ').replace('\n',' ').split() K=K|set(G[i]) print len(K) 這樣應該可以把, . ! ? \n 都給拿掉 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 111.243.151.4

07/14 00:18, , 1F
那你可以試試 re.findall(r"\w+"
07/14 00:18, 1F
文章代碼(AID): #1E7Hx9jT (Python)
文章代碼(AID): #1E7Hx9jT (Python)