[問題] 能否給個方向呢...關於機器學習

看板Python作者 (你媽比痲瘋地精還臭)時間6年前 (2018/09/14 15:16), 6年前編輯推噓3(3011)
留言14則, 5人參與, 6年前最新討論串1/1
最近某堂課老師要我們做跟機器學習有關的程式 我們這組是做有關網路安全的, 分析xss攻擊....等等,用機器學習去分析log檔,之後就可以準確判斷是否為網路攻擊 但是我毫無方向, 老師有給log檔, 但我不知道怎麼去做分析, 有高手能給個大方向嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.126.194.203 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1536909363.A.5FD.html

09/14 15:24, 6年前 , 1F
有多少時間?
09/14 15:24, 1F

09/14 15:46, 6年前 , 2F
anomaly detection可以查看看
09/14 15:46, 2F

09/14 15:50, 6年前 , 3F
到明年6月左右
09/14 15:50, 3F

09/14 15:50, 6年前 , 4F
有需要log檔格式嗎
09/14 15:50, 4F

09/14 19:13, 6年前 , 5F
先看你有沒有任何ML相關的知識吧,再來要看這些資料
09/14 19:13, 5F

09/14 19:13, 6年前 , 6F
有沒有label,也就是有沒有標註哪段時間是被攻擊之類
09/14 19:13, 6F

09/14 20:20, 6年前 , 7F
有攻擊時間、ip、stature、等等,ML知識倒是淺淺
09/14 20:20, 7F

09/14 22:33, 6年前 , 8F
有label的話就簡單多了 先從基本的logistic regressio
09/14 22:33, 8F

09/14 22:33, 6年前 , 9F
n, svm, random forest試試吧,把資料處理成一些你覺
09/14 22:33, 9F

09/14 22:33, 6年前 , 10F
得有用的feature,然後直接套現有的方法做做看,再根
09/14 22:33, 10F

09/14 22:33, 6年前 , 11F
據不足慢慢改進
09/14 22:33, 11F
那,處理成feature是人工處理,還是可以用python處理? 因為ML做training的data不是都要好幾萬筆,如果人工處理不會太沒效率嗎? ※ 編輯: ericerix (118.166.122.119), 09/14/2018 23:42:37

09/14 23:49, 6年前 , 12F
當然是寫程式處理呀
09/14 23:49, 12F

09/15 19:24, 6年前 , 13F
我說的處理feature是指"feature engineering"
09/15 19:24, 13F

09/15 19:25, 6年前 , 14F
轉換當然是程式執行,但如何轉換就是你要去思考的了
09/15 19:25, 14F
謝謝各位,正在努力學習了 ※ 編輯: ericerix (118.166.122.119), 09/16/2018 00:32:38
文章代碼(AID): #1Rcs0pNz (Python)
文章代碼(AID): #1Rcs0pNz (Python)