幾個 AI 相關名詞解釋


名詞解釋

model

model 是指一個模型,它是一個函數,輸入是數據(如文本、圖像等),輸出是結果(如預測、生成的文本等)。模型的參數(weights)是模型內部的,在訓練時調整,不是輸入。

model 可以是 LLM、Embedding 等。

LLM model

LLM (Large Language Model) 是一種人工智能模型,它使用深度學習技術來理解和生成自然語言。

現在的 LLM 模型通常是基於 Transformer 架構,這種架構允許模型同時處理長序列文本,並且能夠捕捉上下文關係。

也就是說特別擅長文字接龍,可以生成文本、翻譯、摘要、問答等。

Embedding model

Embedding model(嵌入模型)是一種將文本、圖像等數據轉換為向量(vector)表示的模型。

它的作用是將離散的數據(如文字)轉換成連續的數值向量,這些向量能夠捕捉數據的語義特徵。語義相似的文本會被轉換成在向量空間中距離較近的向量。

常見的應用場景包括:

  • 文本相似度搜尋(如 RAG 中的檢索步驟)
  • 推薦系統
  • 分類任務

RAG

RAG (Retrieval-Augmented Generation) 是一種架構或方法。

RAG 結合了檢索(Retrieval)和生成(Generation)兩個步驟:

  1. 首先從知識庫中檢索相關資訊(通常使用 Embedding model 來進行相似度搜尋)
  2. 然後將檢索到的資訊作為上下文,輸入給 LLM model 來生成回答

這種方法可以讓 LLM 基於最新的、特定的知識來回答問題,而不需要重新訓練模型。

Training

Training(訓練)是指讓模型從數據中學習的過程,通過調整模型的參數(weights),使模型能夠更好地完成特定任務。

訓練的基本流程:

  1. 準備訓練數據(通常是大量的輸入-輸出對)
  2. 模型根據當前參數做出預測
  3. 計算預測結果與正確答案之間的誤差(loss)
  4. 根據誤差調整模型參數,讓下次預測更準確
  5. 重複步驟 2-4,直到模型達到預期的表現

常見的訓練類型:

  • Pre-training(預訓練):在大規模數據上進行初始訓練,讓模型學習通用的語言模式
  • Fine-tuning(微調):在預訓練的基礎上,使用特定領域的數據進一步訓練,讓模型適應特定任務

Inference(推理) 的區別:訓練是學習的過程,推理是使用已訓練好的模型來進行預測或生成。

Prompt

Prompt(提示詞)是輸入給 LLM 的指令、問題或上下文,用來引導模型產生期望的輸出。

可以把它想像成給 AI 的「指令」或「問題」,模型會根據這個 prompt 來生成回應。

Prompt 的設計技巧:

  • 明確具體:清楚說明你想要的輸出格式和內容
  • 提供範例:使用 few-shot learning,給出幾個範例讓模型理解任務
  • 角色設定:可以讓模型扮演特定角色(如「你是一個專業的程式設計師」)
  • 結構化:使用清晰的結構和分隔符號,幫助模型理解不同部分的意圖

好的 prompt 設計可以大幅提升模型的輸出品質。

常見誤區

模型就是一個函式,調整模型參數(weights)的行為是訓練(Training),而在預訓練模型基礎上針對特定任務進一步調整參數的行為是微調(Fine-tuning)。輸入數值到函數的行為是推理(Inference),當我們調整輸入的數值(prompt)的時候,我們是透過修改輸入數值期望它產生我們想要的結果,但這過程並不會影響模型本身的參數,因此不能稱為訓練。

Agent

Agent(代理)是一個能夠自主感知環境、做出決策並執行行動的 AI 系統

與單純的 LLM 不同,Agent 通常具備:

  • 工具使用能力:可以調用外部工具(如搜尋引擎、API、資料庫等)
  • 記憶能力:能夠記住之前的對話和執行結果
  • 規劃能力:可以將複雜任務分解成多個步驟並按順序執行
  • 反思能力:能夠評估自己的執行結果並調整策略

常見的應用場景:

  • 自動化任務執行(如資料分析、報告生成)
  • 智能助手(能夠執行實際操作,而不只是回答問題)
  • 複雜問題解決(需要多步驟推理和工具使用)

常見誤區

同上所述,Agent 的核心特徵是能夠自主決策,因此如果一個流程我們有用到 AI 進行輸入輸出,但沒有賦予其決策權(即所有步驟都是預先定義好的),那頂多是 pipeline 而不是 agent。

MCP

MCP (Model Context Protocol) 是由 Anthropic 開發的一個開放協議,用於讓 AI 應用程式與外部工具和數據源安全地連接。

MCP 的主要特點:

  • 標準化介面:提供統一的協議來連接各種工具和數據源
  • 安全性:通過協議控制,確保 AI 只能訪問被授權的資源
  • 可擴展性:可以輕鬆添加新的工具和數據源

常見的 MCP 伺服器包括:

  • 資料庫連接(如 PostgreSQL、MySQL)
  • API 整合(如 GitHub、Slack)
  • 文件系統訪問
  • 搜尋引擎整合

MCP 讓 AI 應用能夠更安全、更靈活地與外部系統互動,是構建強大 AI Agent 的重要基礎設施。

後話

最近的工作是在開發 AI 應用,但經常聽到有人誤用跟濫用 AI 相關名詞,希望能幫助跟我一樣的 AI 小白理解這些名詞的差異。