資料科學 · William Ngo

My Difference

我關注的不是模型本身，而是模型背後的決策邏輯。

我的資料科學訓練，不是從「可以用什麼技術」開始，而是從「這個問題如何影響決策」開始。

我會追問資料如何被流程、制度與人為行為產生，哪些行為沒有被記錄，哪些指標受到定義或流程改版影響。

因此，我理解的資料科學，不只是建模型，而是辨識資料限制、挑戰表面相關，並把分析結果轉成可執行、可追蹤、可修正的決策能力。

01 · 問題定義

我不先問要用什麼模型，而是先問這是不是值得解的問題、決策點在哪裡、結果會影響誰。

02 · 資料理解

我不只看欄位能不能用，也會追問資料如何被流程、制度與人為行為產生。

03 · 分析邏輯

我重視的不只是相關性、準確率與特徵重要性，也包括因果邏輯、反事實、選擇偏誤與誘因結構。

04 · 模型落地

我關注模型會如何改變流程、行為、風險與責任，而不只是準不準、能不能部署。

Core View

data-driven 的三個基礎。

01 · 數據治理

資料要可信、可追溯、定義一致。沒有共同口徑，數字不會帶來共識，反而會放大部門之間的誤解。

02 · 數據民主化

資料不應只停留在少數技術團隊手上。真正的數據民主化，是在清楚權限與資料素養的基礎上，讓業務端能理解資料、提出好問題，並參與決策。

03 · 決策流程

分析結果必須能進入流程，轉成行動、指標、責任分工與追蹤機制。沒有人使用的 dashboard，不會讓企業更 data-driven；無法被監控與修正的模型，也不會成為真正的營運能力。

Decision Lens

資料科學的核心判斷。

01 · 數據視覺化

好的圖表不是把數字變漂亮，而是降低判斷成本。KPI、趨勢、分布、漏斗與流向，都應該服務同一個決策問題：現在發生了什麼、為什麼發生、接下來該採取什麼行動。

02 · 資料生成過程

我不只看資料表裡有什麼，也會追問資料表外發生了什麼。哪些行為沒有被記錄、哪些欄位來自人工判斷、哪些樣本一開始就沒有進入系統，都會影響後續判斷。

03 · 分析陷阱

Accuracy Trap、Data Leakage、樣本偏誤、倖存者偏差、相關不等於因果，都會讓漂亮數字變成錯誤決策。資料科學的專業，也包括知道哪些結論不能輕易相信。

04 · 因果邏輯

資料科學不只是在資料中尋找規律，也要判斷這些規律是否能支持決策。相關性可能來自共同因素、選擇偏誤、流程設計或資料紀錄方式，而不一定代表真正的因果關係。

05 · 模型落地

ML/DL、AutoML、可解釋 AI、MLOps 與 AI 中台，都必須建立在清楚場景、資料品質、治理機制與監控流程上。模型真正的價值，不在於一次性的準確率，而在於能否穩定支援業務決策，並在環境變化時持續被管理。

Industry Cases

不同場景，同一套資料邏輯。

01 · 銀行防詐預警

Fraud · Risk Cost

從警示帳戶、詐騙風險與異常交易出發，重點不是追求單一準確率，而是在誤報、漏報、人工覆核、客戶體驗與風險成本之間，找到可執行的平衡。

02 · 銀行客戶分群

Segmentation · Customer Strategy

用交易行為、產品持有、數位互動與價值貢獻理解客戶差異，讓行銷、服務與產品推薦不只依賴直覺，而能依據客群特徵設計策略。

03 · 企業現金流網路

Corporate Banking · Network

從企業匯款與資金往來建立關係網絡，讓銀行不只看單一客戶，而能看見供應鏈、資金流與企業關係中的潛在機會與風險。

04 · AI 人才評估

HR Tech · Evaluation Design

將 AI 應用在人才評估時，重點不只是自動化，而是定義評估指標、降低流程摩擦、維持一致性，並保留必要的人為判斷與治理邊界。

05 · 運輸需求預測

Transportation · Time-series

以高鐵運量預測為例，時間序列與需求預測的價值不只是預測數字，而是協助班次安排、人力配置、尖離峰管理與服務規劃。

06 · MarTech 投放成效分析

MarTech · Campaign Intelligence

協助廣告代理商分析投放成效、素材表現與受眾反應，讓行銷判斷不只停留在點擊率或轉換率，而能看見渠道、訊息、版位與素材組合背後的差異。

資料科學不是把資料丟進模型，
而是理解它如何進入決策。

我關注的不是模型本身，而是模型背後的決策邏輯。

01 · 問題定義

02 · 資料理解

03 · 分析邏輯

04 · 模型落地

data-driven 的三個基礎。

01 · 數據治理

02 · 數據民主化

03 · 決策流程

資料科學的核心判斷。

01 · 數據視覺化

02 · 資料生成過程

03 · 分析陷阱

04 · 因果邏輯

05 · 模型落地

不同場景，同一套資料邏輯。

01 · 銀行防詐預警

02 · 銀行客戶分群

03 · 企業現金流網路

04 · AI 人才評估

05 · 運輸需求預測

06 · MarTech 投放成效分析

資料科學的下一步，是讓模型成為可信任的營運能力。

資料科學不是把資料丟進模型，而是理解它如何進入決策。

我關注的不是模型本身，而是模型背後的決策邏輯。

01 · 問題定義

02 · 資料理解

03 · 分析邏輯

04 · 模型落地

data-driven 的三個基礎。

01 · 數據治理

02 · 數據民主化

03 · 決策流程

資料科學的核心判斷。

01 · 數據視覺化

02 · 資料生成過程

03 · 分析陷阱

04 · 因果邏輯

05 · 模型落地

不同場景，同一套資料邏輯。

01 · 銀行防詐預警

02 · 銀行客戶分群

03 · 企業現金流網路

04 · AI 人才評估

05 · 運輸需求預測

06 · MarTech 投放成效分析

資料科學的下一步，是讓模型成為可信任的營運能力。

資料科學不是把資料丟進模型，
而是理解它如何進入決策。