Google Gemini API 是 Google 推出的先進多模態生成式人工智慧接口,允許開發者利用 Gemini 強大的語言及多媒體處理能力,打造創新且智能的應用程式。本文將從申請 API、環境設定、基本調用到進階功能,全面介紹 Google Gemini API 的使用教學,幫助開發者快速上手並靈活運用。
一、什麼是 Google Gemini API?
Google Gemini API 是基於 Google DeepMind Gemini 模型的 RESTful 服務,支援文字、圖片、程式碼等多模態輸入,並能生成自然語言回應、圖片說明、程式碼執行結果等多樣化輸出。開發者可以透過 API 呼叫,將 Gemini 的生成式 AI 能力整合至網站、App、客服系統、內容創作等多種場景。
二、申請與設定 API 金鑰
-
準備 Google 帳戶
需擁有 Google 帳戶並登入 Google AI Studio(https://makersuite.google.com/app)。 -
申請 API 金鑰
在 Google AI Studio 中,點選「Get API key」,建立新專案並生成 API 金鑰。 -
設置開發環境
-
建議使用 Python、Go、或直接呼叫 REST API。
-
安裝 Python requests 套件或 Google 提供的
google-generativeaiSDK。 -
將 API 金鑰妥善保存,呼叫時用於身份驗證。
-
三、基本 API 呼叫示範
1. 使用 Python requests 呼叫 Gemini 文字生成
import requests
import json
API_KEY = 'YOUR_API_KEY'
url = f"https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key={API_KEY}"
headers = {'Content-Type': 'application/json'}
data = {
"contents": [
{
"parts": [{"text": "請幫我寫一段關於人工智慧的介紹文章。"}]
}
]
}
response = requests.post(url, headers=headers, data=json.dumps(data))
print(response.json())
此範例將文字提示送至 Gemini Pro 模型,並獲得生成的文字回應。
2. 使用官方 Python SDK
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("請介紹太陽系最大的行星木星。")
print(response.text)
四、多模態輸入與進階功能
1. 圖片分析與生成
Gemini Pro Vision 模型支援圖片輸入,可分析圖片內容並生成描述或回答問題。
response = model.generate_content(
prompt="請描述這張圖片的內容。",
image="base64_encoded_image_string"
)
print(response.text)
2. 多輪對話(聊天模式)
Gemini API 支援多輪對話,保持對話歷史上下文,適合客服或聊天機器人應用。
chat = model.start_chat(history=[])
response1 = chat.send_message("你好,請問你是什麼?")
print(response1.text)
response2 = chat.send_message("你能幫我寫一封感謝信嗎?")
print(response2.text)
3. 程式碼生成與執行
Gemini API 具備程式碼生成與執行功能,適合教學、數據分析、程式輔助等場景。
response = model.generate_content(
prompt="請寫一段 Python 程式碼,計算前 50 個質數的和。",
tools=[{"code_execution": {}}]
)
print(response.text)
print(response.executable_code)
print(response.code_execution_result)
五、API 參數說明與調整
-
temperature(溫度):控制生成內容的創意程度,數值越高越自由,越低則更保守。
-
top_k 與 top_p:決定輸出 token 的採樣範圍,影響回應多樣性。
-
safety settings:調整模型對敏感或不當內容的過濾強度。
-
streaming(流式輸出):支援逐步獲取生成結果,提升用戶體驗。
六、開發者資源與社群支持
-
官方文檔與範例:Google Generative AI 文檔庫提供詳細 API 說明、範例程式碼與最佳實踐。
-
GitHub 範例集:包含多種語言的範例與應用示範,方便快速複製使用。
-
論壇與社群:Google AI 開發者論壇與 GitHub issue 供開發者交流與求助。
七、常見問題與建議
-
API 金鑰安全:切勿公開分享 API 金鑰,避免濫用。
-
地區限制:部分地區可能需使用 VPN 才能正常申請與呼叫 API。
-
費用控制:免費額度有限,注意使用頻率與請求大小,避免產生額外費用。
-
提示設計:撰寫清晰且具體的提示語,有助於獲得更精準的回應。
八、總結
Google Gemini API 以其多模態能力和高度靈活性,為開發者提供了強大的生成式 AI 工具。從文字生成、圖片分析到程式碼執行,Gemini API 支援多種應用場景,適合打造智能客服、內容創作、教育輔助等多元化產品。掌握申請流程與基本調用技巧後,開發者即可迅速整合 Gemini API,開啟 AI 創新的新篇章。