資料科學

資料科學不是把資料丟進模型,
而是理解它如何進入決策

資料科學不是報表或模型競賽,而是理解資料如何被產生、被解讀,並如何進入決策。數字看起來客觀,實際上常是流程、制度與行為共同留下的結果。

延伸看 AI 趨勢
資料治理、決策分析與預測模型
資料不是事實本身,
而是流程、制度與行為留下的痕跡

我做的不是 model-first data science,而是 decision-first data science。

data-driven 的核心不是更多數據,而是更好的問題、更可信的資料,以及更清楚的決策邏輯。

My Difference

我關注的不是模型本身,而是模型背後的決策邏輯。

我的資料科學訓練,不是從「可以用什麼技術」開始,而是從「這個問題如何影響決策」開始。

我會追問資料如何被流程、制度與人為行為產生,哪些行為沒有被記錄,哪些指標受到定義或流程改版影響。

因此,我理解的資料科學,不只是建模型,而是辨識資料限制、挑戰表面相關,並把分析結果轉成可執行、可追蹤、可修正的決策能力。

01 · 問題定義

我不先問要用什麼模型,而是先問這是不是值得解的問題、決策點在哪裡、結果會影響誰。

02 · 資料理解

我不只看欄位能不能用,也會追問資料如何被流程、制度與人為行為產生。

03 · 分析邏輯

我重視的不只是相關性、準確率與特徵重要性,也包括因果邏輯、反事實、選擇偏誤與誘因結構。

04 · 模型落地

我關注模型會如何改變流程、行為、風險與責任,而不只是準不準、能不能部署。

Core View

data-driven 的三個基礎。

01 · 數據治理

資料要可信、可追溯、定義一致。沒有共同口徑,數字不會帶來共識,反而會放大部門之間的誤解。

02 · 數據民主化

資料不應只停留在少數技術團隊手上。真正的數據民主化,是在清楚權限與資料素養的基礎上,讓業務端能理解資料、提出好問題,並參與決策。

03 · 決策流程

分析結果必須能進入流程,轉成行動、指標、責任分工與追蹤機制。沒有人使用的 dashboard,不會讓企業更 data-driven;無法被監控與修正的模型,也不會成為真正的營運能力。

Decision Lens

資料科學的核心判斷。

01 · 數據視覺化

好的圖表不是把數字變漂亮,而是降低判斷成本。KPI、趨勢、分布、漏斗與流向,都應該服務同一個決策問題:現在發生了什麼、為什麼發生、接下來該採取什麼行動。

02 · 資料生成過程

我不只看資料表裡有什麼,也會追問資料表外發生了什麼。哪些行為沒有被記錄、哪些欄位來自人工判斷、哪些樣本一開始就沒有進入系統,都會影響後續判斷。

03 · 分析陷阱

Accuracy Trap、Data Leakage、樣本偏誤、倖存者偏差、相關不等於因果,都會讓漂亮數字變成錯誤決策。資料科學的專業,也包括知道哪些結論不能輕易相信。

04 · 因果邏輯

資料科學不只是在資料中尋找規律,也要判斷這些規律是否能支持決策。相關性可能來自共同因素、選擇偏誤、流程設計或資料紀錄方式,而不一定代表真正的因果關係。

05 · 模型落地

ML/DL、AutoML、可解釋 AI、MLOps 與 AI 中台,都必須建立在清楚場景、資料品質、治理機制與監控流程上。模型真正的價值,不在於一次性的準確率,而在於能否穩定支援業務決策,並在環境變化時持續被管理。

Industry Cases

不同場景,同一套資料邏輯。

01 · 銀行防詐預警

Fraud · Risk Cost

從警示帳戶、詐騙風險與異常交易出發,重點不是追求單一準確率,而是在誤報、漏報、人工覆核、客戶體驗與風險成本之間,找到可執行的平衡。

02 · 銀行客戶分群

Segmentation · Customer Strategy

用交易行為、產品持有、數位互動與價值貢獻理解客戶差異,讓行銷、服務與產品推薦不只依賴直覺,而能依據客群特徵設計策略。

03 · 企業現金流網路

Corporate Banking · Network

從企業匯款與資金往來建立關係網絡,讓銀行不只看單一客戶,而能看見供應鏈、資金流與企業關係中的潛在機會與風險。

04 · AI 人才評估

HR Tech · Evaluation Design

將 AI 應用在人才評估時,重點不只是自動化,而是定義評估指標、降低流程摩擦、維持一致性,並保留必要的人為判斷與治理邊界。

05 · 運輸需求預測

Transportation · Time-series

以高鐵運量預測為例,時間序列與需求預測的價值不只是預測數字,而是協助班次安排、人力配置、尖離峰管理與服務規劃。

06 · MarTech 投放成效分析

MarTech · Campaign Intelligence

協助廣告代理商分析投放成效、素材表現與受眾反應,讓行銷判斷不只停留在點擊率或轉換率,而能看見渠道、訊息、版位與素材組合背後的差異。

Next

資料科學的下一步,是讓模型成為可信任的營運能力。

成熟的資料科學不只問模型準不準,而是問資料是否可信、問題是否清楚、決策是否能執行、結果是否能追蹤。

前往 AI 趨勢