[問題] 多欄位去除重複元素方式?(求思路)
多欄位去除重複元素方式?(求思路)
目前爬取公司名稱和電話
將各個網站爬取資料整合起來時
會有以下狀況
欄位一(地區) 欄位二(公司名) 欄位三(電話)
台中市 公司名1 123456
中市 公司名1- 123456
中市西區 公司1 123456
以電話相同為基準去重 公司名任意留一個
三列處理完 希望只剩下一列
請問有什麼方式處理嗎
提個思路或套件都可以
感謝大家
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.218.52.174
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1550884019.A.C9F.html
推
02/23 09:16,
6年前
, 1F
02/23 09:16, 1F
→
02/23 09:16,
6年前
, 2F
02/23 09:16, 2F
→
02/23 21:34,
6年前
, 3F
02/23 21:34, 3F
推
02/24 09:32,
6年前
, 4F
02/24 09:32, 4F
→
02/24 09:33,
6年前
, 5F
02/24 09:33, 5F
這只處理單一欄位吧?
推
02/24 18:29,
6年前
, 6F
02/24 18:29, 6F
看不懂 還是謝謝您
※ 編輯: nini200 (101.13.177.69), 02/25/2019 09:38:22
推
02/26 13:10,
6年前
, 7F
02/26 13:10, 7F
→
02/26 13:10,
6年前
, 8F
02/26 13:10, 8F
推
02/26 13:13,
6年前
, 9F
02/26 13:13, 9F
討論串 (同標題文章)
完整討論串 (本文為第 1 之 2 篇):
Python 近期熱門文章
PTT數位生活區 即時熱門文章