Google Gemini API教學

1
Google Gemini API教學:Google Gemini API 是 Google 推出的先進多模態生成式人工智慧接口,允許開發者利用 Gemini 強大的語言及多媒體處理能力,打造創新且智能的應用程式。本文將從申請 API、環境設定、基本調用到進階功能,全面介紹 Google Gemini API 的使用教學,幫助開發者快速上手並靈活運用。

Google Gemini API教學

Google Gemini API 是 Google 推出的先進多模態生成式人工智慧接口,允許開發者利用 Gemini 強大的語言及多媒體處理能力,打造創新且智能的應用程式。本文將從申請 API、環境設定、基本調用到進階功能,全面介紹 Google Gemini API 的使用教學,幫助開發者快速上手並靈活運用。

 

一、什麼是 Google Gemini API?

Google Gemini API 是基於 Google DeepMind Gemini 模型的 RESTful 服務,支援文字、圖片、程式碼等多模態輸入,並能生成自然語言回應、圖片說明、程式碼執行結果等多樣化輸出。開發者可以透過 API 呼叫,將 Gemini 的生成式 AI 能力整合至網站、App、客服系統、內容創作等多種場景。

 

 

二、申請與設定 API 金鑰

  1. 準備 Google 帳戶
    需擁有 Google 帳戶並登入 Google AI Studio(https://makersuite.google.com/app)。

  2. 申請 API 金鑰
    在 Google AI Studio 中,點選「Get API key」,建立新專案並生成 API 金鑰。

  3. 設置開發環境

    • 建議使用 Python、Go、或直接呼叫 REST API。

    • 安裝 Python requests 套件或 Google 提供的 google-generativeai SDK。

    • 將 API 金鑰妥善保存,呼叫時用於身份驗證。

 

三、基本 API 呼叫示範

1. 使用 Python requests 呼叫 Gemini 文字生成

import requests
import json

API_KEY = 'YOUR_API_KEY'
url = f"https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key={API_KEY}"

headers = {'Content-Type': 'application/json'}
data = {
    "contents": [
        {
            "parts": [{"text": "請幫我寫一段關於人工智慧的介紹文章。"}]
        }
    ]
}

response = requests.post(url, headers=headers, data=json.dumps(data))
print(response.json())
 

此範例將文字提示送至 Gemini Pro 模型,並獲得生成的文字回應。

 

2. 使用官方 Python SDK

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-pro')

response = model.generate_content("請介紹太陽系最大的行星木星。")
print(response.text)
 

四、多模態輸入與進階功能

1. 圖片分析與生成

Gemini Pro Vision 模型支援圖片輸入,可分析圖片內容並生成描述或回答問題。

response = model.generate_content(
    prompt="請描述這張圖片的內容。",
    image="base64_encoded_image_string"
)
print(response.text)
 

2. 多輪對話(聊天模式)

Gemini API 支援多輪對話,保持對話歷史上下文,適合客服或聊天機器人應用。

chat = model.start_chat(history=[])
response1 = chat.send_message("你好,請問你是什麼?")
print(response1.text)

response2 = chat.send_message("你能幫我寫一封感謝信嗎?")
print(response2.text)
 

3. 程式碼生成與執行

Gemini API 具備程式碼生成與執行功能,適合教學、數據分析、程式輔助等場景。

response = model.generate_content(
    prompt="請寫一段 Python 程式碼,計算前 50 個質數的和。",
    tools=[{"code_execution": {}}]
)
print(response.text)
print(response.executable_code)
print(response.code_execution_result)
 

五、API 參數說明與調整

  • temperature(溫度):控制生成內容的創意程度,數值越高越自由,越低則更保守。

  • top_k 與 top_p:決定輸出 token 的採樣範圍,影響回應多樣性。

  • safety settings:調整模型對敏感或不當內容的過濾強度。

  • streaming(流式輸出):支援逐步獲取生成結果,提升用戶體驗。

 

六、開發者資源與社群支持

  • 官方文檔與範例:Google Generative AI 文檔庫提供詳細 API 說明、範例程式碼與最佳實踐。

  • GitHub 範例集:包含多種語言的範例與應用示範,方便快速複製使用。

  • 論壇與社群:Google AI 開發者論壇與 GitHub issue 供開發者交流與求助。

 

七、常見問題與建議

  • API 金鑰安全:切勿公開分享 API 金鑰,避免濫用。

  • 地區限制:部分地區可能需使用 VPN 才能正常申請與呼叫 API。

  • 費用控制:免費額度有限,注意使用頻率與請求大小,避免產生額外費用。

  • 提示設計:撰寫清晰且具體的提示語,有助於獲得更精準的回應。

 

八、總結

Google Gemini API 以其多模態能力和高度靈活性,為開發者提供了強大的生成式 AI 工具。從文字生成、圖片分析到程式碼執行,Gemini API 支援多種應用場景,適合打造智能客服、內容創作、教育輔助等多元化產品。掌握申請流程與基本調用技巧後,開發者即可迅速整合 Gemini API,開啟 AI 創新的新篇章。