Re: [騾子] kad搜尋語法?

看板P2PSoftWare作者 (Patrick)時間17年前 (2007/09/22 21:42), 編輯推噓52(5312)
留言56則, 53人參與, 最新討論串3/5 (看更多)
原文吃光光~~~ 以原PO舉的例子 要搜尋zip [*penoffic*] 請改輸入zip penoffic 不要加上星號 也不要加上中括號 那個中括號是說ed2k-expression是optional的 只有Kad keyword而沒有ed2k-expression也可以搜尋 這樣出來的結果 就會找出檔名中有zip和*penoffic*的交集 ======以下是經驗分享======= KAD的搜尋方式和ed2k server不太一樣 剛開始使用一定會很不習慣(廢話) XD 最常見的問題 就是"為什麼KAD都找不到東西" 而這個現象會在剛啟動eMule時最明顯 先來看一下KAD的運作原理 KAD是由大量的使用者自行組成的網路 每台電腦(每個Node)在KAD Network上都有自己的Hash 就像ed2k Network一樣 這個Hash你可以把它想成是門牌號碼 當你第一次使用KAD時 只要能連上任一台已經連到KAD的電腦 它就能帶你進入KAD的世界 這個動作叫做Bootstrap 如果同事、同學是eMule的新使用者 並且你的KAD箭號是綠色 你可以先啟動自己的eMule 並且把自己的IP位址和Port(預設4672)給對方 填在對方eMule的KAD頁裡面Bootstrap的地方 再按下下面的Bootstrap鈕 過一陣子後 他也能進入KAD的世界! 這時候會發現 即使Server List是空的 一樣可以下載的很高興 XD 隨著使用時間的增加(約數小時) 你的eMule就會慢慢的連線到離自己的電腦 這個遠、近是Hash層次的距離 並不是地理位置的遠和近 像是F1174C017CCD3E63D604A3AA5145AB38 離 F117FC017CCD3E63D604A3AA5145AB38 近 而和00174C017CCD3E63D604A3AA5145AB38 遠很多 這個現象可以由KAD那頁裡面 右邊有個圖可以看得出來 最左邊是0000開頭的 最右邊是FFFF開頭的 連線時間夠長 就會以你的KAD Hash為中心整個凸起來 同一區域Contacts的數量超過15 就會變成灰色 以你的Hash旁邊為最多 而越遠會越少 有點常態分佈的那種樣子 你的KAD Hash可在右下角雙箭號的地方 點兩下可以找到 裡面有比Server->My Info更詳細的資料 當你正常結束eMule 它會儲存200個好的KAD ID起來 至於什麼是好的 要看下面提到的燈號來決定 一般都是存綠燈 存那些不能連線的紅燈 也只是浪費空間而已 要存就存綠色燈 而有很多綠燈的話 可能就是依常態分佈的樣子 等比例減少再存起來 這部分比較不清楚 反正會存就對了 XD 這樣下次啟動時 就不需要再重新Bootstrap 存200個node的用意 應該是避免某些node停止運作 還有機會再去try其它的node 防止長時間沒開eMule 整個清單裡面的node都沒在跑 這樣就連不上KAD了 至於為什麼剛好是200個就不知道了 看到的是這樣子 儲存200個應該也是足夠的 畢竟同時200個上次連線穩定的Node 同時都不能連線的機率相當低 儲存的位置是在config\nodes.dat 但不知道為什麼 有時候eMule當掉 會使得nodes.dat壞掉 所以就要重新Bootstrap一次 所以完全依靠KAD的用戶(很堅持不使用ed2k server的人) 建議可以手動備份最後一次eMule正常關閉後的nodes.dat 並且定期備份 避免所有node都消失 個人使用MorphXT 有自動建立雙備份的功能 所以可以從備份裡把nodes.dat放回去conig 這樣就不用Bootstrap了 而KAD的燈號又是怎麼回事呢? 根據個人的觀察 它應該指的是每個ID的連線狀況 而燈號的顏色是從Type對應過來的 0=>綠色, 1=>淺藍色, 2=>黃色(較亮的), 3=>金黃色、土黃色(比2要深的), 4=>紅色 Type的決定 可以把它看成像做記號一樣 剛啟動的時候 所有的Node都是土黃色(Type 3)的 這當成是基準線 而第一次連線失敗 則減一分 變成Type 4 有點像是這樣 實際上還會分更多級 而比4還要差的話就出局了 從清單上移除 最好的當然就是0囉 每連必通 先前有提到KAD是由很多的Node組成 所以當你要搜尋、下載 KAD如果連不到夠多的Node的話 想必不會有好的搜尋結果 個人的經驗 最好的搜尋時機 是綠色Node非常多的時候 效果最好 我會先以Type來排序 這時候會發現前面的燈號都排整齊了 接著拉動Scroll bar 找出綠色和淺藍色的交界線 拉動Scroll bar時 你可以大略知道綠色的Node佔多少比例 如果綠色數量多過整個list的1/2, 3/4 表示這時候搜尋會有相當好的效果 實際上啟動eMule後 約4小時可以達到3/4都綠色的水準 我都是在這時候才搜尋的 至於重新啟動eMule 而下載Queue裡面還有檔案 要用KAD找來源的就不需要理它了 反正eMule每隔一段時間就會自動找一次來源 缺少的來源會在稍後被找到 檔案清單是怎麼來的? 如果各位有在設定裡面開過Verbose Mode的話 在選Server的畫面下方 會多出一個叫做Verbose的Tab 裡面會記錄很多eMule內部運作的情形 使用ed2k server時 只要一連上server 在Verbose裡面 就可以看到eMule把目前的分享清單 一次幾KB的上傳到server 這樣連到同一個server的使用者就可以搜尋 而KAD並無一集中的server 所以每個node都負責儲存一部分的資訊 在KAD上分別儲存幾種資訊 其中可以在KAD那頁看到的有Keyword, File, Note 其它似乎不會顯示在裡面 而eMule裡面有適當的演算法 決定每個Keyword該存到哪個Hash對應的Node 這有點像是寫一個公式 然後把你的Keyword代入 會得到一個門牌號碼 而檔案的擁有者 就會試著把相關資訊 存到那個門牌號碼或它附近的電腦 這樣的話 今天有人要找同樣的Keyword 只需要把Keyword代入同樣的公式 就能知道哪些電腦會有想要的答案 原理上是這樣子 實際運作很複雜 會有很多的exception XD KAD會把每個檔名 依照內部的規則 把可以拆開的"Word"當成是Keyword來儲存 例:Adobe Creative Suite.zip 這個會被拆成Adobe,Creative,Suite,zip四個Keyword Keyword不分大小寫(其實應該是全部都轉成小寫或大寫來儲存) 所以找大寫和小寫的結果應該會相同 例:[Conan][Tv][By IQ小子][244]毛利小五郎的冒充者(下).rmvb => Conan,TV,By,IQ小子,244,毛利小五郎的冒充者,下,rmvb 等Keywords 一般而言 ASCII的符號會被當成Keyword間的分隔符號 所以今天如果出現 毛利小五郎的冒充者【下】 的話 整串字都會變成同一個Keyword! 因為那個是只有中文才會有的符號 每個Keyword對應到負責的Node 都會儲存完整的檔名 例如上面的例2 會分別把同個檔名送至負責Conan,TV,By等Keyword的Node 搜尋的時候 會以第一個Word為Keyword來搜尋 Keyword後面的東西 可以當成是一個濾水器 把符合規則的內容留下來 在eMule搜尋框裡面 只有空白(space)才能把Keyword和ed2k expression切開 所以當Keyword裡包含特殊字元時 會出現無法搜尋的提示 好的搜尋方式 1.確認你的KAD處在最佳狀態: 像是前面提到的綠色要過或接近3/4 至少要過半就是了 這樣可以增加找到Keyword的機率 2.確認同時進行的KAD Search數量不會太多: 在KAD那頁的下面 可以看到目前正在跑的Searches KAD把所有的動作都當成是一種Search 像是Store Keyword, File, Note, Node Lookup, Search Keywords等等 由於KAD使用UDP Protocol 本身就是遺失不重送封包的那種 所以如果你的Searches太多 則很有可能因為eMule來不及處理而被drop 導致收不到別人傳回來的結果 一般建議是不要超過10 否則效率會很差 3.網路流量不要太過接近上/下傳頻寬之上限: 同2 UDP封包的特性 當流量過大而超過頻寬上限 很有可能封包送不出去或收不到而被Drop 不確定使用CFosSpeed是否仍會使UDP Packet loss掉 網路高度壅塞的情況下 UDP Packet通常會被Drop掉 4.決定Keyword: 這應該是最關鍵 同時也是最難的部分 XD 原則上 同一類型的檔案 要多試數次 或長時間下來 才會比較抓得到特定類別的關鍵字 以Conan卡通為例 我會使用Conan NNN的方式來找 NNN為集數 然後不加其它的東西 直接去搜尋 基本上要去假設哪些Keyword一定會在檔名上 像是分享社群的名稱(APTX4869) 或是集數 這個只能憑經驗累積 Keyword的部分 尤其是亞洲文字 請注意前面提到Keyword斷字的問題 例如"愛在西元前" 如果搜尋"西元前" 一定會找不到 英文亦同 日文的話 以歌曲為例 通常需要連羅馬拼音一起下去找 很多是不打中文譯名 或者是使用簡體字 原始的日文平、片假名都有 這些都要考慮進去 XD 韓文亦同 有些Keyword你會不知道到底有沒有被斷字 最保險的就是都找一下吧 XD 像Photoshop && Photo shop, Image Ready && ImageReady 還有一種比較尷尬的 像是某救援軟體*-Studio 本來該當Keyword的 裡面竟然有多一dash XD 所以要改找*Studio 這是很特別的例子 XD 如果你需要找不特定檔名 但同一類別的東西(*新聞*,有星號的) KAD可能就不太適合了 因為KAD Keyword本身架構的關係 只能做exactly match 所以只打部分字是一定找不到的 實際上也沒辦法在Keyword直接打上有*號的東西 5.對調你的Keyword: 很多人會忽略這一步 從儲存Keyword的原理 可以知道Conan 489489 Conan儲存的Node是不一樣的 所以時間足夠且想得到更多、更準確的結果 一定要對調一下你所有的Keyword 例:Adobe Creative Suite可變成本身的算一種 再加上Creative Suite Adobe和Suite Creative Adobe 共三種 只要變Keyword就可以了 ed2k expression的順序並不影響結果 6.適時的增加搜尋條件 當你一次搜尋下來 出現相當多的結果 通常我會認為不見得是件好事 XD 這個部分又牽涉到KAD運作的原理: KAD通常為了有效利用網路資源 通常收到特定數量的Responses時 就會停止搜尋的動作 這個部分可以看KAD那頁 下面的最右邊是Responses 一般如果超過10 或是到了內定的Timeout時間 前面的Active就會變成Stopping 表示不會再繼續送出搜尋的request 你得到的是相對較少的結果 有的來源數實際上很多 但在那裡面卻只有2 就是因為這樣子 這時候可以再加上其它的Keyword 以縮小搜尋的範圍 提高精確度 以軟體類為例 通常我會加上我想要的版本名稱(或Build Number)上去 並在Type選擇Archive 表示我只要搜尋壓縮格式&&特定版本的軟體 這時候想要的東西、來源數都會特別突出 因為它只會找特定的Node 得到足夠的Responses 一般越熱門、General的關鍵字 最會發生這樣的現象 像是Ne*o, O**ice XP 這些一丟出去 馬上會有破千的responses 所以加以過濾結果是必要的 電影的話 可以限制你想要的extension或是預期的檔案大小 例如一般Xvid影片1小時可能是700MB上下 那就可以設最小600MB&&最大750MB之類的 這樣就不會找到幾KB的"影片檔" XD ke*gen的話大多是幾百KB 所以也可以把1MB以上的檔案刷掉 依此類推 反正不要認為一次出來越多result是件好事 XD 特別是找特定檔案時 當然其它情況則另當別論 需要多重篩選的話 別忘了還有Boolean Operator(AND, OR, NOT)可以用 這部分就是純ed2k expression的用法 預設值的空白(space)就是使用所謂的Google Style 所以不需要特別加AND 同樣也有相同的效果 而NOT也可以用'-'(減號)來取代 同樣也是Google Style 例如 某Keyword -spanish -espanol -Español -fr -rus -german -ita -ps2 -xbox某Keyword ( 繁 OR 中 OR 正 OR cht OR tlf OR big OR big5 OR zh OR tw ) 之類的用法 XDXD 注意 若要用AND OR NOT 一定要大寫 eMule才會當成Boolean Operator 在ed2k expression的部分 可以輸入部分的字 就可以找到其它也符合的完整字 例: noffic可找到OpenOffice和unofficial 7.一次下載數個來源多的檔案 這樣做的原因 是因為KAD的來源數並不一定是目前真正的來源數 所以你下載了一個來源第一多的 實際上可能排名第二的才是當時最多的 所以一次下載數個 然後再來挑哪個來源多的 通常下載成功率會比較高 當然並不保證來源多 速度就一定快 XD 來源數的部分 建議等Statistics那頁下面的Connections降到接近下載前的量 再進行挑選 因為你剛點選並下載數個檔案 這時候會大量建立連線 而每台電腦同時能處理的連線是有限的 所以有些檔案會先連線 有些比較晚 比較早連的 通常看到的來源數會比較多 但實際上晚連線的檔案可能會更多 XD 所以建議是等大家的連線都差不多之後 再決定要留哪些檔案 以我的經驗是從Top 5都一起來 最後再挑1個來源數最多 且符合以下(8)原則的 8.看別人的檔名挑假檔 來源數夠多 並不一定是你要的檔案 XDXD 這大家應該都很有經驗 最簡單、準確的辦法 就是看這個檔案 在別人的硬碟裡是叫什麼名字 在你下載的檔案上按右鍵->Details->Name就可以看到 如果檔名一下是NBA 2008 一下又是Office 還有一堆的XXX Hot 就不用浪費時間了 XD 最後要來推一下KAD XD KAD真的是很好用的工具 個人認為比ed2k server要好用 Global Search也是到了特定數量就會被切掉 而且有些人連線的Server 根本就不在你的清單中 這也是很難被找到的 而KAD解決了這些問題 當然前提是大家都有開KAD XD 至少自己用起來是這樣 別人我不保證 XD 現在一天到晚風聲鶴唳的時代 哪個Server又被抄 哪個Server是有星條旗的 實在是太難搞了 XD KAD可以有效避開Fake Server的問題 我已經很久都不連Server了 看這個就知道 XD Runtime: 963 Days, Total Server Duration: 367 Days 其它的時間就是在KAD Searches中度過的 還有很多的小技巧 現在一時都想不起來 但到需要用時 自然就會用出來 XD 有任何建議 還請鞭小力一點 感謝大家收看 希望能對大家有幫助 XDXD -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.132.13.10

09/22 21:47, , 1F
09/22 21:47, 1F

09/22 22:01, , 2F
真詳細 推一個
09/22 22:01, 2F

09/22 22:06, , 3F
09/22 22:06, 3F

09/22 22:09, , 4F
好文大推..雖然沒辦法完全看懂XD
09/22 22:09, 4F

09/22 22:17, , 5F
09/22 22:17, 5F

09/22 22:27, , 6F
強者好文 推一個!
09/22 22:27, 6F

09/22 22:32, , 7F
好文
09/22 22:32, 7F

09/22 23:01, , 8F
專業好文
09/22 23:01, 8F

09/22 23:04, , 9F
09/22 23:04, 9F

09/22 23:07, , 10F
超詳細~給你一個推!!!
09/22 23:07, 10F

09/22 23:06, , 11F
終於理解KAD運作的原理了.感謝你的用心分享!
09/22 23:06, 11F

09/22 23:21, , 12F
推!
09/22 23:21, 12F

09/22 23:23, , 13F
噓錯.
09/22 23:23, 13F

09/22 23:33, , 14F
這篇文章真該 mark 起來,專業!
09/22 23:33, 14F

09/22 23:38, , 15F
感謝教學^^b
09/22 23:38, 15F

09/22 23:48, , 16F
強者!!
09/22 23:48, 16F

09/22 23:49, , 17F
太詳細了﹐詳細到看到50%就看不下去了
09/22 23:49, 17F

09/23 00:01, , 18F
專業
09/23 00:01, 18F

09/23 00:10, , 19F
好文推
09/23 00:10, 19F

09/23 00:23, , 20F
◆ 這一篇文章值 1000 銀
09/23 00:23, 20F

09/23 00:33, , 21F
09/23 00:33, 21F

09/23 01:13, , 22F
推到爆啦 版主m了啦 經典好文耶!!!
09/23 01:13, 22F

09/23 02:04, , 23F
09/23 02:04, 23F

09/23 02:10, , 24F
好文 推~
09/23 02:10, 24F

09/23 03:38, , 25F
原PO會不會太強 XD
09/23 03:38, 25F

09/23 08:18, , 26F
有請M字夾!!
09/23 08:18, 26F

09/23 08:46, , 27F
太詳細了..我要印出來有空時時慢慢讀完,期待您的續作喔感恩!
09/23 08:46, 27F

09/23 08:54, , 28F
09/23 08:54, 28F

09/23 08:58, , 29F
此文必M
09/23 08:58, 29F
※ 編輯: jyhfang 來自: 220.132.13.10 (09/23 10:15)

09/23 10:15, , 30F
好文章...感謝..讓我了解KAD..
09/23 10:15, 30F

09/23 12:15, , 31F
好文 不過總覺得例子舉的關鍵字都還滿危險的 XD
09/23 12:15, 31F

09/23 13:46, , 32F
真強者 推 XDy
09/23 13:46, 32F

09/23 16:48, , 33F
好強阿...陌生的kad總算了解一點!
09/23 16:48, 33F

09/23 19:43, , 34F
推專業
09/23 19:43, 34F

09/23 21:30, , 35F
推推
09/23 21:30, 35F

09/23 22:42, , 36F
強者 請大家備份kad的節點資料 如果你在不能連到server的
09/23 22:42, 36F

09/23 22:43, , 37F
可以考慮把dat2檔放入config 妳會有意想不到結果 嘿嘿
09/23 22:43, 37F

09/23 23:13, , 38F
09/23 23:13, 38F

09/24 00:00, , 39F
09/24 00:00, 39F

09/24 00:25, , 40F
強推!!
09/24 00:25, 40F

09/24 02:10, , 41F
好文推
09/24 02:10, 41F

09/24 09:15, , 42F
這篇要M
09/24 09:15, 42F

09/24 12:03, , 43F
大推好文!感謝原PO詳細的教學!~
09/24 12:03, 43F

09/24 13:31, , 44F
專業好文!
09/24 13:31, 44F

09/24 13:33, , 45F
真強者 我也來測測看 大推!!
09/24 13:33, 45F

09/24 14:32, , 46F
補推
09/24 14:32, 46F

09/24 22:40, , 47F
真是好文一篇,不推不行!!
09/24 22:40, 47F

10/04 20:29, , 48F
推~雖然以前我也都有開KAD,不過都是找不到檔案才用
10/04 20:29, 48F

10/04 20:30, , 49F
現在看來只能靠KAD了,多謝詳盡的說明XD
10/04 20:30, 49F

10/10 11:06, , 50F
推!長知識!^_^
10/10 11:06, 50F

10/10 13:47, , 51F
超詳細,一時間看不完
10/10 13:47, 51F

10/18 03:49, , 52F
@@
10/18 03:49, 52F

04/24 18:05, , 53F
好文 推
04/24 18:05, 53F

06/24 13:41, , 54F
強! 專業!
06/24 13:41, 54F

06/28 00:20, , 55F
06/28 00:20, 55F

03/15 10:38, , 56F
專業推 ,順便借轉
03/15 10:38, 56F
文章代碼(AID): #16zHkpxs (P2PSoftWare)
文章代碼(AID): #16zHkpxs (P2PSoftWare)