[問題] 超新(文)手(盲)如何建立知識架構

看板Python作者 (世界真奇妙)時間10年前 (2015/11/02 13:22), 10年前編輯推噓6(6028)
留言34則, 12人參與, 最新討論串1/2 (看更多)
小妹(想用關鍵字減少被批的情形XD)完全是與coding無關的財會背景 因緣際會之下聽聞了python可以下載網頁的數據庫 最近因為興趣想要做個副業來兼差 想要加速進貨速度(進貨來源目前是日本的雅虎拍賣) 朋友說python可以存取資料庫 原本想要花錢請人寫個程式 然後又聽另外的朋友建議有可能我買了一個程式 可能日本雅虎端那邊更改設定變成我程式只能用一次 才突發奇想想自己學寫看看(主要也是想省點錢囧) 後來上了cousera的課,但發現萊斯的課比較像教寫遊戲 因為毫無基礎,也很難從遊戲舉一反三變成資料庫存取 原本想報名台大的python課,想說有老師的話還可以順便偷問幾招額外的 但朋友一直用我根本不知道要學幾年才能學會爬蟲打壓我的信心QQ 叫我還是趕快找個專業人士合作比較實在(但我這idea這麼low怎麼吸引專業人士XD) 想問一下如果要自學的話,要達成上述目標我能做什麼呢? 實在沒有相熟的朋友是資工背景且嫻熟爬蟲的提供我協助 所以才想上版來請教大家 我有看一些書單,但也爬了很多文有說應該要再懂OOXX才可以XXOO 不曉得是否有熱心的版友讓我請教請教 謝謝大家 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.44.181.94 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1446441740.A.731.html

11/02 14:42, , 1F
你的需求不用全部自己寫,有爬蟲套件scrapy
11/02 14:42, 1F

11/02 15:15, , 2F
謝謝樓上再度指引!! 我真的太無知了什麼都不懂
11/02 15:15, 2F

11/02 15:15, , 3F
我再研究研究該套件內容QQQQQQ 感謝感謝
11/02 15:15, 3F

11/02 15:40, , 4F
參考這本 http://oreil.ly/1WqxJlP,基礎還是要先學
11/02 15:40, 4F

11/02 19:34, , 5F
謝謝N大:D!
11/02 19:34, 5F

11/02 20:21, , 6F
跟你想的不太依樣 不是存取資料庫 只是抓資料下來
11/02 20:21, 6F

11/02 20:22, , 7F
另外就是 拍賣的東西 他設定的關鍵字很不一定
11/02 20:22, 7F

11/02 20:22, , 8F
所以跟你想的東西到最後會有誤差是一定的
11/02 20:22, 8F

11/02 21:27, , 9F
我是用 lxml 模組啦,還蠻方便的,Google 一下吧 :)
11/02 21:27, 9F

11/02 22:56, , 10F
喔喔 原來是這樣 我再研究研究 有誤差沒關係 因為一頁頁
11/02 22:56, 10F

11/02 22:56, , 11F
點真的好漫長囧> 才想說要怎麼提高效率
11/02 22:56, 11F

11/02 22:58, , 12F
謝謝b大M大的建議!
11/02 22:58, 12F

11/03 02:25, , 13F
coursera有另一堂programming for everyone(Python)系列
11/03 02:25, 13F

11/03 02:25, , 14F
教的非常好
11/03 02:25, 14F

11/03 10:19, , 15F
舉例來講 你去露天查"洛克人"就好了
11/03 10:19, 15F

11/03 10:20, , 16F
然後注意一樣商品 在去看同樣商品 其他賣家的描述
11/03 10:20, 16F

11/03 10:20, , 17F
你就會知道困難點在哪邊了...最終還是要回歸到人來辨識
11/03 10:20, 17F

11/03 10:21, , 18F
如果你是要固定同一個賣家 那就當我沒說
11/03 10:21, 18F

11/03 11:00, , 19F
謝謝g大建議 來去看看該堂課 我這兩天也有看到python有門
11/03 11:00, 19F

11/03 11:00, , 20F
新課程 看起來似乎比較貼近我想做的事
11/03 11:00, 20F

11/03 11:01, , 21F
謝謝m大 其實我當初就是想說先下載下來再人工辨識每一樣
11/03 11:01, 21F

11/03 11:01, , 22F
商品 因為日本雅虎的商品量是台灣的好幾百倍了 滑鼠都點
11/03 11:01, 22F

11/03 11:02, , 23F
到要起火了XD 我會再試試看的 謝謝QQ (雖然那步可能還很
11/03 11:02, 23F

11/03 11:02, , 24F
遠 我現在連爬都不會爬 現在還很難想像障礙賽的未來
11/03 11:02, 24F

11/03 16:47, , 25F
可不可以簡易敘述一下需求呢?說不定有適合度很高的
11/03 16:47, 25F

11/03 16:47, , 26F
套件可以用
11/03 16:47, 26F
謝謝T大 因為目前想從日本購買某些品牌的單品,所以想說可以設定關鍵字之後 ex: エルメス スカーフ 下去單品有4,391件 雖然旁邊有一些檢索工具可以讓範圍縮小 但還是需要一個頁面一個頁面點開 看該物品的物品狀況 比如其中一個 http://page8.auctions.yahoo.co.jp/jp/auction/h212480074 商品說明有關鍵字 未使用 那可能我就會優先看這項物品的照片 評價 等資料 然後想精簡這部分的動作(一樣樣點真的很累<囧>) 我想增加效率這個應該是可以透過python完成的吧@@?? ※ 編輯: tonglie (42.70.124.202), 11/03/2015 17:13:57


11/03 20:59, , 28F
用 API 應該會比自已爬網頁再 parse 來得快
11/03 20:59, 28F

11/03 21:00, , 29F
不過,自已爬網頁比較靈活就是了
11/03 21:00, 29F

11/03 22:26, , 30F
推programming for everyone的python課程 基礎教很多
11/03 22:26, 30F

11/06 23:39, , 31F
推密西根大學的那個禿頭教授+1 講得很好
11/06 23:39, 31F

11/08 22:50, , 32F
快來加入DrChuck神教XD
11/08 22:50, 32F

11/17 17:33, , 33F
udacity的intro to CS就是用寫爬蟲來入門,你可以試試
11/17 17:33, 33F

12/05 02:01, , 34F
Requests beautiful soup4
12/05 02:01, 34F
文章代碼(AID): #1MDlCCSn (Python)
文章代碼(AID): #1MDlCCSn (Python)