[問題] 有關utf-8字串的問題
假設我有一個檔案叫test.txt,內容只有一行字:
中文
然後我用如下的碼讀入(省略之前之後的各個動作)
string = infile.readline().decode('utf-8')
這樣得到的變數跟以下我手動給初值有何不同?
string = u'中文'
我用sunburnt把資料加入solr時兩者都可以加入
但只有後者得到的結果可以下中文關鍵字搜尋到
請問一下各位先進我應該如何修改呢?
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.147.239.158
推
10/28 16:58, , 1F
10/28 16:58, 1F
→
10/28 17:06, , 2F
10/28 17:06, 2F
→
10/28 17:07, , 3F
10/28 17:07, 3F
→
10/28 17:07, , 4F
10/28 17:07, 4F
→
10/28 17:07, , 5F
10/28 17:07, 5F
→
10/28 17:08, , 6F
10/28 17:08, 6F
→
10/28 21:07, , 7F
10/28 21:07, 7F
→
10/28 22:34, , 8F
10/28 22:34, 8F
→
10/28 22:34, , 9F
10/28 22:34, 9F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):
Python 近期熱門文章
PTT數位生活區 即時熱門文章