Featured image of post 機器學習—建構人造智能的技術

機器學習—建構人造智能的技術

模型用於建立事物間的關係,而機器學習的核心,就是透過資料來優化模型的參數。

本文簡介人工智慧(Artificial Intelligence,AI)與機器學習(Machine Learning,ML)的關係,幫助讀者初步理解機器學習的核心概念。透過本文,讀者將能掌握 ML 的基礎知識與學習路線。機器學習系列文章將在後續的文章中,深入探討各項技術的原理與實作細節。

人工智慧與機器學習

人工智慧指的是模擬人類智能的電腦技術概念,使其能夠進行傳統電腦運算幾乎無法執行的任務,例如自然語言問答或多媒體內容生成(圖片、語音或影片等)。AI 是一個廣泛的技術概念,其中機器學習是最廣為人知且應用最廣泛的實作方式。Google DeepMind 的 AlphaGo 和 OpenAI 的 ChatGPT 都是機器學習技術的傑出成果。

什麼是機器學習?

機器學習是一種讓電腦自己從大量資料中找出規律,學會做預測的技術。它就像讓電腦從經驗中學習,而不是由人事先設定好所有的判斷方式。

以銀行評估房地產價格為例:銀行會收集大量的房產銷售資料,建立一個預測模型。當輸入房屋面積 x 時,模型能輸出預估市場價格 y。一個簡單的 ML 模型可表示為函數 y = wx + b。機器學習的核心,就是透過特定的演算法,從海量數據中推算出函數中的參數 w 和 b,從而表示房屋面積與價格之間的潛在關係。讓銀行能利用此模型預測房價,輔助貸款業務。

簡言之,機器學習是一種透過資料尋找最佳模型參數的技術,而模型則是描述事物關係的函數或更複雜的函數組合。

機器學習三要素

機器學習作為一種電腦運算技術,主要由以下三個核心要素構成:

  • 模型架構(Model Architecture):定義用來表示事物關係的函數或函數集合,例如使用 y = wx + b 來描述房屋面積 x 與售價 y 之間的關係。
  • 訓練資料(Training Dataset):用於訓練模型的實際數據,例如包含房屋面積與對應售價的歷史交易記錄:20 坪賣 2,600 萬、30 坪賣 3,600 萬和 50 坪賣 5,500 萬。
  • 學習演算法(Learning Algorithm):用於從訓練資料中找出最佳模型參數的方法,例如使用梯度下降法(Gradient Descent)找出模型參數 wb。梯度下降法是在機器學習中被大量採用的演算法,我們將在後續文章中詳細介紹其原理與應用。

機器學習的類型

從學習方式的角度來看,機器學習主要分成以下三種類型:

監督式學習

監督式學習(Supervised Learning)是指使用有預先標註資料的訓練方式。有些資料集在收集時已完成標註,如房地產交易資料;另外一些則是需要人工標註,例如 X 光片中的腫瘤區域或電子郵件中的垃圾郵件標記。其主要的兩種應用類型,如下:

  • 迴歸(Regression):模型輸出為連續數值,源於統計學的迴歸分析概念,例如預測 38 坪房屋的具體價值。
  • 分類(Classification):模型輸出為離散類別,例如判斷 1.5 公分的腫瘤是否為惡性腫瘤(通常輸出為 01)。如果採用複雜的模型能處理多於兩個類別的分類問題。

非監督式學習

非監督式學習(Unsupervised Learning)用於處理沒有或無法預先進行數據標註的資料,透過分析資料本身的結構來發現潛在的模式。其主要的兩種應用類型,如下:

  • 分群(Clustering):與分類不同,分群不依賴事先標註的資料標籤,而是透過資料本身的特徵來判斷哪些樣本彼此相近。例如在顧客行為分析中,根據消費頻率、金額與偏好,自動將顧客分為高價值、一般與潛在流失等不同群體,從而針對性地制定行銷策略。
  • 異常偵測(Anomaly Detection):是找出與大多數資料點顯著不同的少數樣本。例如在信用卡消費資料中,正常交易可能會形成明顯的群體,而離群點可能代表潛在的異常行為或詐騙。

強化學習

強化學習(Reinforcement Learning,RL)是一種強大的機器學習範式,透過設定獎勵機制,讓 Agent 在特定環境中學習如何採取行動以最大化累積獎勵,從而解決問題。

Agent 最初對環境一無所知,會透過隨機試探與環境互動。系統會根據其行動的結果給予獎勵或懲罰(例如,做得好加分,不好則扣分)。經過大量試錯與反饋,Agent 會逐漸學會如何在該環境中採取最佳的行動,最終實現自主解決問題。

強化學習廣泛應用於遊戲 AI、自動駕駛和機器人控制等領域。以格鬥遊戲 AI 為例:遊戲人物可執行前進、後退(防禦)、蹲下、跳躍、出拳、出腳等動作。我們可以設定獎勵機制:造成對手傷害則給予獎勵,自身受傷則扣除獎勵。經過大量遊戲訓練,AI 將學會如何最大化對手傷害並最小化自身傷害,並最終贏得對戰。

總結

  1. 人工智慧與機器學習的關係: AI 是一個廣泛的技術概念,而 ML 是實現 AI 最廣為人知且應用最廣泛的方式,讓電腦從資料中學習來進行預測或執行複雜的任務。
  2. 機器學習的核心機制與三要素: 機器學習的核心是讓電腦從大量資料中學習,發現規律並建立模型,進而進行預測。這過程涉及模型架構、訓練資料和學習演算法三大要素。
  3. 機器學習的三大類型:監督式學習(使用有標註的資料學習)、非監督式學習(處理無標註的資料並發現其隱藏結構)和強化學習(透過獎勵機制讓 Agent 學習如何在特定環境中採取最佳行動)。

參考資料

  1. Little students (1872)
comments powered by Disqus
使用 Hugo 建立
主題 StackJimmy 設計