資料科學不是報表或模型競賽,而是理解資料如何被產生、被解讀,並如何進入決策。數字看起來客觀,實際上常是流程、制度與行為共同留下的結果。
延伸看 AI 趨勢
我做的不是 model-first data science,而是 decision-first data science。
data-driven 的核心不是更多數據,而是更好的問題、更可信的資料,以及更清楚的決策邏輯。
我的資料科學訓練,不是從「可以用什麼技術」開始,而是從「這個問題如何影響決策」開始。
我會追問資料如何被流程、制度與人為行為產生,哪些行為沒有被記錄,哪些指標受到定義或流程改版影響。
因此,我理解的資料科學,不只是建模型,而是辨識資料限制、挑戰表面相關,並把分析結果轉成可執行、可追蹤、可修正的決策能力。
我不先問要用什麼模型,而是先問這是不是值得解的問題、決策點在哪裡、結果會影響誰。
我不只看欄位能不能用,也會追問資料如何被流程、制度與人為行為產生。
我重視的不只是相關性、準確率與特徵重要性,也包括因果邏輯、反事實、選擇偏誤與誘因結構。
我關注模型會如何改變流程、行為、風險與責任,而不只是準不準、能不能部署。
資料要可信、可追溯、定義一致。沒有共同口徑,數字不會帶來共識,反而會放大部門之間的誤解。
資料不應只停留在少數技術團隊手上。真正的數據民主化,是在清楚權限與資料素養的基礎上,讓業務端能理解資料、提出好問題,並參與決策。
分析結果必須能進入流程,轉成行動、指標、責任分工與追蹤機制。沒有人使用的 dashboard,不會讓企業更 data-driven;無法被監控與修正的模型,也不會成為真正的營運能力。
好的圖表不是把數字變漂亮,而是降低判斷成本。KPI、趨勢、分布、漏斗與流向,都應該服務同一個決策問題:現在發生了什麼、為什麼發生、接下來該採取什麼行動。
我不只看資料表裡有什麼,也會追問資料表外發生了什麼。哪些行為沒有被記錄、哪些欄位來自人工判斷、哪些樣本一開始就沒有進入系統,都會影響後續判斷。
Accuracy Trap、Data Leakage、樣本偏誤、倖存者偏差、相關不等於因果,都會讓漂亮數字變成錯誤決策。資料科學的專業,也包括知道哪些結論不能輕易相信。
資料科學不只是在資料中尋找規律,也要判斷這些規律是否能支持決策。相關性可能來自共同因素、選擇偏誤、流程設計或資料紀錄方式,而不一定代表真正的因果關係。
ML/DL、AutoML、可解釋 AI、MLOps 與 AI 中台,都必須建立在清楚場景、資料品質、治理機制與監控流程上。模型真正的價值,不在於一次性的準確率,而在於能否穩定支援業務決策,並在環境變化時持續被管理。
Fraud · Risk Cost
從警示帳戶、詐騙風險與異常交易出發,重點不是追求單一準確率,而是在誤報、漏報、人工覆核、客戶體驗與風險成本之間,找到可執行的平衡。
Segmentation · Customer Strategy
用交易行為、產品持有、數位互動與價值貢獻理解客戶差異,讓行銷、服務與產品推薦不只依賴直覺,而能依據客群特徵設計策略。
Corporate Banking · Network
從企業匯款與資金往來建立關係網絡,讓銀行不只看單一客戶,而能看見供應鏈、資金流與企業關係中的潛在機會與風險。
HR Tech · Evaluation Design
將 AI 應用在人才評估時,重點不只是自動化,而是定義評估指標、降低流程摩擦、維持一致性,並保留必要的人為判斷與治理邊界。
Transportation · Time-series
以高鐵運量預測為例,時間序列與需求預測的價值不只是預測數字,而是協助班次安排、人力配置、尖離峰管理與服務規劃。
MarTech · Campaign Intelligence
協助廣告代理商分析投放成效、素材表現與受眾反應,讓行銷判斷不只停留在點擊率或轉換率,而能看見渠道、訊息、版位與素材組合背後的差異。