Google Gemini API教學

2025-05-06 3932

Google Gemini API 是 Google 推出的先進多模態生成式人工智慧接口，允許開發者利用 Gemini 強大的語言及多媒體處理能力，打造創新且智能的應用程式。本文將從申請 API、環境設定、基本調用到進階功能，全面介紹 Google Gemini API 的使用教學，幫助開發者快速上手並靈活運用。

一、什麼是 Google Gemini API？

Google Gemini API 是基於 Google DeepMind Gemini 模型的 RESTful 服務，支援文字、圖片、程式碼等多模態輸入，並能生成自然語言回應、圖片說明、程式碼執行結果等多樣化輸出。開發者可以透過 API 呼叫，將 Gemini 的生成式 AI 能力整合至網站、App、客服系統、內容創作等多種場景。

二、申請與設定 API 金鑰

準備 Google 帳戶
需擁有 Google 帳戶並登入 Google AI Studio（https://makersuite.google.com/app）。
申請 API 金鑰
在 Google AI Studio 中，點選「Get API key」，建立新專案並生成 API 金鑰。
設置開發環境
- 建議使用 Python、Go、或直接呼叫 REST API。
- 安裝 Python requests 套件或 Google 提供的 google-generativeai SDK。
- 將 API 金鑰妥善保存，呼叫時用於身份驗證。

三、基本 API 呼叫示範

1. 使用 Python requests 呼叫 Gemini 文字生成

import requests
import json

API_KEY = 'YOUR_API_KEY'
url = f"https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key={API_KEY}"

headers = {'Content-Type': 'application/json'}
data = {
"contents": [
{
"parts": [{"text": "請幫我寫一段關於人工智慧的介紹文章。"}]
}
]
}

response = requests.post(url, headers=headers, data=json.dumps(data))
print(response.json())

此範例將文字提示送至 Gemini Pro 模型，並獲得生成的文字回應。

2. 使用官方 Python SDK

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-pro')

response = model.generate_content("請介紹太陽系最大的行星木星。")
print(response.text)

四、多模態輸入與進階功能

1. 圖片分析與生成

Gemini Pro Vision 模型支援圖片輸入，可分析圖片內容並生成描述或回答問題。

response = model.generate_content(
prompt="請描述這張圖片的內容。",
image="base64_encoded_image_string"
)
print(response.text)

2. 多輪對話（聊天模式）

Gemini API 支援多輪對話，保持對話歷史上下文，適合客服或聊天機器人應用。

chat = model.start_chat(history=[])
response1 = chat.send_message("你好，請問你是什麼？")
print(response1.text)

response2 = chat.send_message("你能幫我寫一封感謝信嗎？")
print(response2.text)

3. 程式碼生成與執行

Gemini API 具備程式碼生成與執行功能，適合教學、數據分析、程式輔助等場景。

response = model.generate_content(
prompt="請寫一段 Python 程式碼，計算前 50 個質數的和。",
tools=[{"code_execution": {}}]
)
print(response.text)
print(response.executable_code)
print(response.code_execution_result)

五、API 參數說明與調整

temperature（溫度）：控制生成內容的創意程度，數值越高越自由，越低則更保守。
top_k 與 top_p：決定輸出 token 的採樣範圍，影響回應多樣性。
safety settings：調整模型對敏感或不當內容的過濾強度。
streaming（流式輸出）：支援逐步獲取生成結果，提升用戶體驗。

六、開發者資源與社群支持

官方文檔與範例：Google Generative AI 文檔庫提供詳細 API 說明、範例程式碼與最佳實踐。
GitHub 範例集：包含多種語言的範例與應用示範，方便快速複製使用。
論壇與社群：Google AI 開發者論壇與 GitHub issue 供開發者交流與求助。

七、常見問題與建議

API 金鑰安全：切勿公開分享 API 金鑰，避免濫用。
地區限制：部分地區可能需使用 VPN 才能正常申請與呼叫 API。
費用控制：免費額度有限，注意使用頻率與請求大小，避免產生額外費用。
提示設計：撰寫清晰且具體的提示語，有助於獲得更精準的回應。

八、總結

Google Gemini API 以其多模態能力和高度靈活性，為開發者提供了強大的生成式 AI 工具。從文字生成、圖片分析到程式碼執行，Gemini API 支援多種應用場景，適合打造智能客服、內容創作、教育輔助等多元化產品。掌握申請流程與基本調用技巧後，開發者即可迅速整合 Gemini API，開啟 AI 創新的新篇章。

聯絡我們學習更多AI工具技能