Re: [問題] 如何解析youtube的網址

看板PHP作者 (be me)時間18年前 (2007/12/09 21:59), 編輯推噓3(300)
留言3則, 3人參與, 最新討論串3/6 (看更多)
※ 引述《kenshieh (Not always blank)》之銘言: : ※ 引述《lottemarines (一平)》之銘言: : : 作者: lottemarines (一平) 看板: Google : : 標題: [問題] 如何解析youtube的網址 : : 時間: Sat Dec 8 16:36:05 2007 : : 使用這個網站的話 : : http://kej.tw/flvretriever/ : : 就可以下載 youtube的影片 網址有點眼熟..................... XD : : 原先網址是: http://tw.youtube.com/watch?v=j75Kl7_ERdM : : 可以解析成:http://lax-v239.lax.youtube.com/get_video?video_id=j75Kl7_ERdM : : 小弟猜測:j75Kl7_ERdM 這段跟:lax-v239.lax 有某種關係 : : 另一例: : : http://www.youtube.com/watch?v=em-ZhJDjayM
: : http://ash-v250.ash.youtube.com/get_video?video_id=em-ZhJDjayM : : 小弟猜測:em-ZhJDjayM 這段跟:ash-v250.ash 有某種關係 : : 我想知道要怎樣做才可以像上面那個網站那樣寫出一個解析下載影片網址的程式 : : 有強者可以解答嗎? j75Kl7_ERdM 跟 lax-v239.lax 以及 em-ZhJDjayM 跟 ash-v250.ash 之間應該沒有什麼關係,而只是單純的 server hostname 罷了 你可以用 firebug 觀察 flv 檔案的 url,會發現多 reload 個幾次 hostname 是會變的(應該是影片的 server 有好幾台) : 懶人做法( 不確定是不是全都可以用, 但隨手試二三個都行 ): : // $source == '網頁內容' : $pattern = '/watch_fullscreen\?video_id=([\w-]+)&l=\d+&t=([\w-]+)'; : if (preg_match('#$pattern#s", $source, $m)) : { : echo "GetTube: http://tw.youtube.com/get_video?video_id={$m[1]}&t={$m[2]}"; : } 基本上要取得 youtube 的影片位址,最主要的參數就是 video_id 跟 t 像上面那樣的作法是很 OK 的,我一開始也是這樣的方式做的 可是當時間久了或量變大了之後,問題就來了 不曉得 youtube 是會偵測你今天總共 request 了幾次還是會記錄傳輸量 總之當程式抓網頁抓到一個一定的量的時候,youtube 就會把你的連線擋了 過了一段時間之後才會再開放讓你連線 當初我就一天到晚被擋,後來只好找 open proxy 後來我發現了一個方法,不需要找 proxy 也不會被 youtube 擋: 以 http://www.youtube.com/watch?v=em-ZhJDjayM
為例 我們可以知道他 embed 的標籤裡 影片的 src 會是 http://www.youtube.com/v/em-ZhJDjayM 而這個 url 會做 redirect 最後的網址就像下面這樣:(三行連起來) http://www.youtube.com/swf/l.swf?video_id=em-ZhJDjayM& eurl=&iurl=http%3A//img.youtube.com/vi/em-ZhJDjayM/default.jpg& t=OEgsToPDskLvttI1e7cLfmL15TOMbN24&rel=1&border=0 所以程式就可以改成這樣: (1). 抓原始 url 裡的參數 v (2). 重新組合成 http://www.youtube.com/v/xxxxxxxxxxx 的格式 (3). 用 fsockopen 讀取 (2),取得 header 的 Location 的 url (4). 從 (3) 得到的 url 中,parse 出參數 t (5). 組合成 http://www.youtube.com/get_video?video_id=$video_id&t=$t 的格式 基本上只要做到這個步驟就可以抓的到檔案了,但是你還可以更進一步: (6). 用 fsockopen 讀取 (5),取得 header 的 Location 的 url 從 (6) 這步驟得到的 url 就會是像 http://ash-v250.ash.youtube.com/get_video?video_id=em-ZhJDjayM 這樣子的 url that's all~!! 只要 fsockopen parse_url parse_str 就好 不用撈網頁(省流量!),也不用做 regular expression (省腦力!) 不會被 youtube 擋,也不會因為 open proxy 關了你的站就死翹翹了(我掛了好幾次orz) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.133.102.122 ※ 編輯: Kej 來自: 220.133.102.122 (12/09 22:03)

12/10 16:17, , 1F
12/10 16:17, 1F

12/11 19:45, , 2F
原作者出現了~~推
12/11 19:45, 2F

09/06 12:45, , 3F
如果不擋連線 youtube的server大概會爆掉吧XD
09/06 12:45, 3F
文章代碼(AID): #17M_JJAF (PHP)
文章代碼(AID): #17M_JJAF (PHP)