[情報] 10 Hadoop-able Problems (a summary)

看板Cloud作者 (Cary)時間14年前 (2010/08/20 09:01), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
摘要 此篇作者提到了十項Hadoop-able problem,也就是能夠以Hadoop有效處理的問題。 其中大多以商業用途為主。 1. 風險評估(Modelling True Risk) 2. 客戶流失分析(Customer Churn Analysis) 3. 推薦引擎(Recommendation engines, ex:google PageRank) 4. 廣告瞄準(ad targeting) 5. POS交易分析(Point Of Sale Transaction Analysis) 6. 以網絡資料分析預測錯誤(Analysing Network Data To Predict Failure, 此處的network並非意指Internet) 7. 威脅分析、詐欺偵測(Threat Analysis/Fraud Detection) 8. 貿易監控(Trade Surveillance) 9. 搜尋品質(Search Quality) 10.資料沙盒(Data "Sandbox") 最後文中提及,多數以上的task都可以歸類為以下動作: "整合資料、評測資料、以評測結果排序", 而這正是Hadoop最善長且基本的能力。 註:Cloudera為Hadoop的一個distribution,提供一種以Hadoop為基礎的檔案管理系統   新標準。而Sqoop為其SQL to Hadoop database的工具。 -- 摘自 Mike Pearce – blog http://blog.mikepearce.net/2010/08/18/10-hadoop-able-problems-a-summary/ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.36.168.54
文章代碼(AID): #1CRTFnX6 (Cloud)
文章代碼(AID): #1CRTFnX6 (Cloud)