[問題]Hadoop能幹啥?

看板Cloud作者 (不買美債=人權倒退XD)時間10年前 (2014/08/27 16:05), 編輯推噓10(10047)
留言57則, 4人參與, 最新討論串1/1
說到hadoop 以廣告來說 就是大數據分析 而最著名的例子就是尿布和啤酒 我對於尿布和啤酒的例子有疑問 當然 找到兩個相關的產品 互做廣告有增加銷售的效果 但是 首先 我有2個問題 1. 首先 我要花多少錢 建制哪些東西 才可以得到這類型結論? 2. 我在得知這結論之前 我要怎麼知道我要這個結論? 而除了搜尋引擎(基本上搞論文才有價值) hadoop在一般應用上 能做啥 找尿布和啤酒這類型相關的題目? 而這種題目 而我得到這結論又能幹啥事? 我為何要花這麼大的功夫去得到這結論? 我說個情境好了 當我得到尿布和啤酒相關的結論 "我可能在啤酒那做尿布廣告嗎?" 根據尿布和啤酒的結論 事實上 當然也可以得到 尿布和紙杯 尿布和花生 啤酒和花生 啤酒和小魚乾 啤酒和紙牌 花生和烤肉 烤肉和烤肉醬 衛生紙和烤肉醬 沙茶醬和火鍋料 這類型的常識性結論 問題是 我可能做相關的廣告嗎? 這樣 我啤酒那要貼多少傳單? 就算我得到這類型的結論 實務上的應用又在哪裡? 這類型的銷售結論 不用透過大資料應用 實際上你隨便想想都有常識性的結論 以此例而言 為啥我要特別為尿布和啤酒打廣告? 而不會常識性的結論打廣告? 當然 這個問題和hadoop的架設以及資訊的價值 沒有很大的關係 只是 實務上 到底能用來幹"什麼" 又這個"什麼" 能帶來哪些價值? -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.134.23.142 ※ 文章網址: http://www.ptt.cc/bbs/Cloud/M.1409126751.A.5FC.html

08/27 16:43, , 1F
尿布和啤酒,並不是用hadoop找到的
08/27 16:43, 1F

08/27 16:44, , 2F
以往的資料分析,是要下載資料後才分析
08/27 16:44, 2F

08/27 16:45, , 3F
但hadoop改變了這架構,程式上傳至儲存的地方分析
08/27 16:45, 3F

08/27 16:45, , 4F
最後再統計結果
08/27 16:45, 4F

08/27 16:46, , 5F
你舉的尿布與啤酒,似乎只是特解示一個特殊的現象
08/27 16:46, 5F

08/27 16:47, , 6F
就是買尿布的人,會順帶一打啤酒(因為是男人在買的)
08/27 16:47, 6F

08/27 16:47, , 7F
實際應用應該是將啤酒廣告或商品,放在附近
08/27 16:47, 7F

08/27 16:48, , 8F
不一定是隔壁,達到方便客人的角度
08/27 16:48, 8F

08/27 16:48, , 9F
或是將兩者放得很遠,為了取得兩樣商品,客人將走過
08/27 16:48, 9F

08/27 16:49, , 10F
全賣場,反而有可助於提升業績(可能會心動多買東西)
08/27 16:49, 10F

08/27 16:55, , 11F
多少錢→就硬碟大小,每筆交易記錄如何存下
08/27 16:55, 11F

08/27 16:58, , 12F
如何知此相關→有目的找也是可以,沒目的找也可。本
08/27 16:58, 12F

08/27 16:58, , 13F
例子重於說用資料採礦技術,發現法奇怪的結果。而如
08/27 16:58, 13F

08/27 16:58, , 14F
何正確解示此結果才是重點
08/27 16:58, 14F

08/27 17:00, , 15F
至於hadoop 只是用些技術,將「發現」這個結果的過程
08/27 17:00, 15F

08/27 17:00, , 16F
「加快」而已。要如何去找到你要的東西,還是依賴演
08/27 17:00, 16F

08/27 17:00, , 17F
算去達成
08/27 17:00, 17F

08/27 17:05, , 18F
不知以上有沒解答到您的問題?
08/27 17:05, 18F

08/28 10:20, , 19F
thx 我再想想看~
08/28 10:20, 19F

08/28 14:20, , 20F
我大概理解了 事實上我該朝向資料探勘去看
08/28 14:20, 20F

08/28 14:21, , 21F
而不是被廣告詞導向 而使用實際上不見得實用的工具
08/28 14:21, 21F

08/28 14:21, , 22F
thx
08/28 14:21, 22F

08/28 19:37, , 23F
有時挖這個東西不一定是廣告,行銷不是只有廣告一途
08/28 19:37, 23F

08/28 19:37, , 24F
如何使用此結果來賺更多錢,對商人來說才是重要的
08/28 19:37, 24F

08/28 19:38, , 25F
所以別被框架框住了
08/28 19:38, 25F

08/28 22:08, , 26F
其實我覺得那就是資料探勘,Hadoop只是簡化分析的工具。
08/28 22:08, 26F

08/28 22:09, , 27F
T大其實可以回篇文章了XD
08/28 22:09, 27F

08/28 23:16, , 28F
http://ppt.cc/a2xt 別人做的 記得是用實價交易去分析房
08/28 23:16, 28F

08/28 23:17, , 29F
事交易的種類
08/28 23:17, 29F

08/29 07:46, , 30F
啤酒跟尿布,只是資料分析過後的觀察,不是一開始的假設
08/29 07:46, 30F

08/29 15:14, , 31F
事實上 我稍微看了一下 這類的系統 都要非常大才有價值
08/29 15:14, 31F

08/29 15:15, , 32F
舉個例子 對沃爾瑪的商品銷售資料做資料探勘 舉例奶粉尿布
08/29 15:15, 32F

08/29 15:15, , 33F
或許可能利用到 但是對於傳統的店家 甚至於大潤發
08/29 15:15, 33F

08/29 15:17, , 34F
似乎不太需要.(以找出最相關的兩件商品這種事上為例)
08/29 15:17, 34F

08/29 15:18, , 35F
不過 我大概有點了解 要搞懂這方面的知識 似乎不是一天兩
08/29 15:18, 35F

08/29 15:19, , 36F
天可以搞定. 且銷售資料也得累積. 舉例來說 我如果要用
08/29 15:19, 36F

08/29 15:20, , 37F
就是要 1.先找人設計或是找到工具 2.根據工具特性輸入資料
08/29 15:20, 37F

08/29 15:20, , 38F
做成資料倉儲的東西 3.經過一年後, 開始可以做些相關產品
08/29 15:20, 38F

08/29 15:21, , 39F
的銷售調查(資料探勘) 這樣 真的合成本嗎? 之前的系統是
08/29 15:21, 39F

08/29 15:22, , 40F
得全部換掉? 假設以10間超商就好了, 換掉POS換掉銷售資料
08/29 15:22, 40F

08/29 15:22, , 41F
庫, 不用太多, 上百萬還是要的. 這樣要做啥才能真正讓
08/29 15:22, 41F

08/29 15:22, , 42F
引入類似技術有價值呢? 還是說 這類技術是設計給沃爾瑪
08/29 15:22, 42F

08/29 15:23, , 43F
類型的大公司使用, 如果規模不夠 實際上不該使用呢?
08/29 15:23, 43F

08/29 19:36, , 44F
樣本數要夠大 價值比較能顯現出來 因為在巨量資料的情況
08/29 19:36, 44F

08/29 19:37, , 45F
下用傳統人力已經無力去分析..
08/29 19:37, 45F

08/30 14:25, , 46F
樣本數不夠大還是可以分析。只是分析出來的結果會有些
08/30 14:25, 46F

08/30 14:26, , 47F
雜訊,會導致誤判之類的。至於pos之類的,大多都有
08/30 14:26, 47F

08/30 14:26, , 48F
收據系統,就是買完後就給張收據,這也是未來公司對帳
08/30 14:26, 48F

08/30 14:27, , 49F
的資訊。若舊有pos好用的話,不如只增加存資料的功能
08/30 14:27, 49F

08/30 14:27, , 50F
也就是收據記錄功能就好了。
08/30 14:27, 50F

08/30 14:28, , 51F
資料方面,不是有需要才記錄,而是平時就在記錄,需要
08/30 14:28, 51F

08/30 14:28, , 52F
時才能快速取得,快速送去運算,得到結果
08/30 14:28, 52F

08/30 14:30, , 53F
說真的,如果公司沒計畫去記錄下所有可能的數據,那就
08/30 14:30, 53F

08/30 14:31, , 54F
用普通的市場調查就可以解決了。而大數據也算是市場調
08/30 14:31, 54F

08/30 14:32, , 55F
查的一部份,準確度比去一個一個問還準(資料多,且全
08/30 14:32, 55F

08/30 14:32, , 56F
部的資料都算),且較方便(用幾台電腦就跑出來了,不
08/30 14:32, 56F

08/30 14:32, , 57F
用花心思設計問卷、吸引別人來填之類的)
08/30 14:32, 57F
文章代碼(AID): #1J_P5VNy (Cloud)
文章代碼(AID): #1J_P5VNy (Cloud)