[情報] 10 Hadoop-able Problems (a summary)
摘要
此篇作者提到了十項Hadoop-able problem,也就是能夠以Hadoop有效處理的問題。
其中大多以商業用途為主。
1. 風險評估(Modelling True Risk)
2. 客戶流失分析(Customer Churn Analysis)
3. 推薦引擎(Recommendation engines, ex:google PageRank)
4. 廣告瞄準(ad targeting)
5. POS交易分析(Point Of Sale Transaction Analysis)
6. 以網絡資料分析預測錯誤(Analysing Network Data To Predict Failure,
此處的network並非意指Internet)
7. 威脅分析、詐欺偵測(Threat Analysis/Fraud Detection)
8. 貿易監控(Trade Surveillance)
9. 搜尋品質(Search Quality)
10.資料沙盒(Data "Sandbox")
最後文中提及,多數以上的task都可以歸類為以下動作:
"整合資料、評測資料、以評測結果排序",
而這正是Hadoop最善長且基本的能力。
註:Cloudera為Hadoop的一個distribution,提供一種以Hadoop為基礎的檔案管理系統
新標準。而Sqoop為其SQL to Hadoop database的工具。
--
摘自 Mike Pearce – blog
http://blog.mikepearce.net/2010/08/18/10-hadoop-able-problems-a-summary/
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.36.168.54
Cloud 近期熱門文章
PTT數位生活區 即時熱門文章