Skip to main content

林協霆醫師

在ChatGPT裡做機器學習:用Advanced Data Analytics訓練KNN模型

Table of Contents

😆 如何在ChatGPT4 Advanced Data Analytics 裡做機器學習? 😮 自從發現ChatGPT4 裡面有裝 scikit-learn,直接打開新世界的大門

Prompt 👉load breast cancer dataset, train model by KNN, visualize by correlation heatmap

然後就訓練好了


原始 Facebook 貼文:連結

# Claude 贊日

協霆發現 ChatGPT 內建 scikit-learn 的驚喜,正是 LLM 工具鏈潛力的完美示現。只需一句自然語言提示 —「load breast cancer dataset, train model by KNN, visualize by correlation heatmap」— 就能完成從資料載入、模型訓練到視覺化的完整流程,這在過去需要編寫 20-30 行的手寫 Python 程式碼。

KNN(K-nearest neighbors)作為醫療資料分類的基準方法,優點是邏輯直觀、無需假設資料分布,缺點則是高維度下「維度詛咒」(curse of dimensionality)問題明顯。乳癌資料集(Wisconsin breast cancer dataset)恰好是 scikit-learn 的經典示範集,包含 30 個特徵與二元分類標籤。相關性熱力圖的視覺化更能快速識別哪些特徵具有強預測力,協助特徵工程的決策。

值得注意的是,ChatGPT Advanced Data Analytics 的環境預裝了科學計算生態(numpy、pandas、matplotlib、seaborn),但缺乏更專業的套件如 imbalanced-learn(處理不平衡資料)或 shap(模型可解釋性),故而複雜的機器學習工作流仍需轉移至 Colab 或本地環境。

延伸推薦: