[問題] 用BeautifulSoup解析的網頁碼與原本不同

看板Python作者 (干我屁事喔北七)時間7年前 (2018/07/11 12:09), 7年前編輯推噓1(109)
留言10則, 3人參與, 7年前最新討論串1/1
url = 'http://www.58b.tv/vod-play-id-87084-sid-0-pid-1.html' html = urllib.request.Request(url,headers = headers) req = urllib.request.urlopen(html).read().decode('utf-8') soup = BeautifulSoup(req,features = 'lxml') 這是我餵給beautifulsoup的程式碼 我要抓取的內容是那個網頁裡面的"xfplay://dna.xxxxxxxx"也就是"先鋒傳送門"那裏的連結 但我發現beautifulsoup怎麼樣也抓不到 於是我直接print(soup)來看 發現沒有那個"xfplay://" 怎麼會這樣@@ 該怎麼辦 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.24.117.198 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1531282149.A.C70.html

07/11 17:18, 7年前 , 1F
那個網址看起來是js組出來的 我覺得你要是不想動腦筋
07/11 17:18, 1F

07/11 17:19, 7年前 , 2F
就用web-driver跑一遍自然有 不然的話你看response 293行
07/11 17:19, 2F

07/11 17:22, 7年前 , 3F
那段應該是給js的資料 我猜應該可以用這個拼出下一層
07/11 17:22, 3F

07/11 17:23, 7年前 , 4F
然後再從第二個檔案拿撥放器的url
07/11 17:23, 4F
我目前是有在該網頁的右鍵-檢查-network中發現某一個"name"裡面包含我要的網址, 我該怎麼取得那裏的資料呢 ※ 編輯: ponwar87123 (36.227.137.209), 07/11/2018 19:47:39

07/12 02:47, 7年前 , 5F
.name .herf 可以直接取值 沒記錯的話
07/12 02:47, 5F

07/12 02:48, 7年前 , 6F
等等name 在network 他是個封包吧,看你瀏覽器喂給他什
07/12 02:48, 6F

07/12 02:48, 7年前 , 7F
麼去處理
07/12 02:48, 7F

07/13 01:33, 7年前 , 8F
那我應該怎麼取得那個封包呢
07/13 01:33, 8F

07/13 19:26, 7年前 , 9F
看你那個封包怎麼傳帶了什麼資訊,用Python仿造出來,依
07/13 19:26, 9F

07/13 19:26, 7年前 , 10F
照你的說法你要的網址就在回應中
07/13 19:26, 10F
文章代碼(AID): #1RHOBbnm (Python)
文章代碼(AID): #1RHOBbnm (Python)