[問題] 請教一個機率問題

看板DataScience作者 (HANA)時間4年前 (2020/01/12 14:39), 編輯推噓3(308)
留言11則, 5人參與, 4年前最新討論串1/1
大家好 小弟想請教一個機率模型問題 最近在處裡一個預測訂房機率的問題 手上有兩個類型房間 單人房跟雙人房的歷史訂單數據 現在想預測的是兩個類型房間 在未來某一天被訂購的機率有多少 input features這邊先假設就是(日期, 房間類型, 各種feature) 這邊想請教的對於目標函數的設定 目前就是假定目標Y就是某個房間類型在某一天的訂購機率 現在很簡單的設定當天的訂購機率就是 某一天的訂購數量/房間數量 所以訓練數據的長相像是 (2019/12/01, 單人房, 各種feature, 訂購機率) 但現在遇到一個問題 這個機率會是一個離散的數字 比如說雙人房只有一間可以訂 他的目標機率要嘛是100% 要嘛是0% 但是單人房有100間,他的機率分布會比較漂亮 可以畫出一個近似高斯的圖形 想請教這種情況下 這個目標函數的設定是否合乎邏輯 有沒有辦法改善對於Y的定義 還請高手指教m(_ _)m -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 92.203.228.53 (日本) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1578811172.A.830.html

01/13 16:58, 4年前 , 1F
直接拿 是否(1/0)被訂購 這個feature做為target就好?
01/13 16:58, 1F

01/14 11:24, 4年前 , 2F
嗯 ...直接對單筆紀錄做整理好像也行
01/14 11:24, 2F

01/14 23:18, 4年前 , 3F
想成1/0分群 在估算機率就好啦
01/14 23:18, 3F

01/15 17:48, 4年前 , 4F
我是有點看不懂 一個硬幣投下去也不會有0.5的結果不是嗎
01/15 17:48, 4F

01/16 16:08, 4年前 , 5F
覺得你要預測的比較不像是機率,應該比較像是單/雙
01/16 16:08, 5F

01/16 16:08, 4年前 , 6F
人房的 訂房率 (例如 單人房被訂間數/全部單人房
01/16 16:08, 6F

01/16 16:08, 4年前 , 7F
的房數)
01/16 16:08, 7F

01/16 16:19, 4年前 , 8F
我的想法是直接預測訂單數 如果有收的話也把客滿接
01/16 16:19, 8F

01/16 16:19, 4年前 , 9F
不下的訂單也納入預測target,預測完再轉成訂房比例
01/16 16:19, 9F

01/16 16:19, 4年前 , 10F
,個人淺見供您參考
01/16 16:19, 10F

01/16 18:37, 4年前 , 11F
感謝意見
01/16 18:37, 11F
文章代碼(AID): #1U6hyaWm (DataScience)
文章代碼(AID): #1U6hyaWm (DataScience)