Dec 16, 2025

幾個 AI 相關名詞解釋

名詞解釋

model

model 是指一個模型，它是一個函數，輸入是數據（如文本、圖像等），輸出是結果（如預測、生成的文本等）。模型的參數（weights）是模型內部的，在訓練時調整，不是輸入。

model 可以是 LLM、Embedding 等。

LLM model

LLM (Large Language Model) 是一種人工智能模型，它使用深度學習技術來理解和生成自然語言。

現在的 LLM 模型通常是基於 Transformer 架構，這種架構允許模型同時處理長序列文本，並且能夠捕捉上下文關係。

也就是說特別擅長文字接龍，可以生成文本、翻譯、摘要、問答等。

Embedding model

Embedding model（嵌入模型）是一種將文本、圖像等數據轉換為向量（vector）表示的模型。

它的作用是將離散的數據（如文字）轉換成連續的數值向量，這些向量能夠捕捉數據的語義特徵。語義相似的文本會被轉換成在向量空間中距離較近的向量。

常見的應用場景包括：

文本相似度搜尋（如 RAG 中的檢索步驟）
推薦系統
分類任務

RAG

RAG (Retrieval-Augmented Generation) 是一種架構或方法。

RAG 結合了檢索（Retrieval）和生成（Generation）兩個步驟：

首先從知識庫中檢索相關資訊（通常使用 Embedding model 來進行相似度搜尋）
然後將檢索到的資訊作為上下文，輸入給 LLM model 來生成回答

這種方法可以讓 LLM 基於最新的、特定的知識來回答問題，而不需要重新訓練模型。

Training

Training（訓練）是指讓模型從數據中學習的過程，通過調整模型的參數（weights），使模型能夠更好地完成特定任務。

訓練的基本流程：

準備訓練數據（通常是大量的輸入-輸出對）
模型根據當前參數做出預測
計算預測結果與正確答案之間的誤差（loss）
根據誤差調整模型參數，讓下次預測更準確
重複步驟 2-4，直到模型達到預期的表現

常見的訓練類型：

Pre-training（預訓練）：在大規模數據上進行初始訓練，讓模型學習通用的語言模式
Fine-tuning（微調）：在預訓練的基礎上，使用特定領域的數據進一步訓練，讓模型適應特定任務

與 Inference（推理） 的區別：訓練是學習的過程，推理是使用已訓練好的模型來進行預測或生成。

Prompt

Prompt（提示詞）是輸入給 LLM 的指令、問題或上下文，用來引導模型產生期望的輸出。

可以把它想像成給 AI 的「指令」或「問題」，模型會根據這個 prompt 來生成回應。

Prompt 的設計技巧：

明確具體：清楚說明你想要的輸出格式和內容
提供範例：使用 few-shot learning，給出幾個範例讓模型理解任務
角色設定：可以讓模型扮演特定角色（如「你是一個專業的程式設計師」）
結構化：使用清晰的結構和分隔符號，幫助模型理解不同部分的意圖

好的 prompt 設計可以大幅提升模型的輸出品質。

常見誤區

模型就是一個函式，調整模型參數（weights）的行為是訓練（Training），而在預訓練模型基礎上針對特定任務進一步調整參數的行為是微調（Fine-tuning）。輸入數值到函數的行為是推理（Inference），當我們調整輸入的數值（prompt）的時候，我們是透過修改輸入數值期望它產生我們想要的結果，但這過程並不會影響模型本身的參數，因此不能稱為訓練。

Agent

Agent（代理）是一個能夠自主感知環境、做出決策並執行行動的 AI 系統。

與單純的 LLM 不同，Agent 通常具備：

工具使用能力：可以調用外部工具（如搜尋引擎、API、資料庫等）
記憶能力：能夠記住之前的對話和執行結果
規劃能力：可以將複雜任務分解成多個步驟並按順序執行
反思能力：能夠評估自己的執行結果並調整策略

常見的應用場景：

自動化任務執行（如資料分析、報告生成）
智能助手（能夠執行實際操作，而不只是回答問題）
複雜問題解決（需要多步驟推理和工具使用）

常見誤區

同上所述，Agent 的核心特徵是能夠自主決策，因此如果一個流程我們有用到 AI 進行輸入輸出，但沒有賦予其決策權（即所有步驟都是預先定義好的），那頂多是 pipeline 而不是 agent。

MCP

MCP (Model Context Protocol) 是由 Anthropic 開發的一個開放協議，用於讓 AI 應用程式與外部工具和數據源安全地連接。

MCP 的主要特點：

標準化介面：提供統一的協議來連接各種工具和數據源
安全性：通過協議控制，確保 AI 只能訪問被授權的資源
可擴展性：可以輕鬆添加新的工具和數據源

常見的 MCP 伺服器包括：

資料庫連接（如 PostgreSQL、MySQL）
API 整合（如 GitHub、Slack）
文件系統訪問
搜尋引擎整合

MCP 讓 AI 應用能夠更安全、更靈活地與外部系統互動，是構建強大 AI Agent 的重要基礎設施。

後話

最近的工作是在開發 AI 應用，但經常聽到有人誤用跟濫用 AI 相關名詞，希望能幫助跟我一樣的 AI 小白理解這些名詞的差異。