English summary
Google's `google-genai` Python SDK v1.75.0 adds Multimodal File Search, enabling semantic search over file collections that include images and audio in addition to text. The release also fixes a bug in the async mTLS path that caused stale tokens to be reused. Together, these complete a primary path for building Gemini-powered multimodal RAG via the SDK.
Google google-genai Python SDK v1.75.0 は Multimodal File Search を新規追加した機能リリース。テキストだけでなく画像や音声を含むファイル群を対象に意味検索が行える。あわせて async mTLS パスでトークンが古いまま使われる不具合の修正も入っている。Gemini の RAG / マルチモーダル検索を SDK 経由で組み立てる主要パスが揃った形。
ポイント
- Multimodal File Search を新規追加(画像・音声を含むファイル群の意味検索)
- async mTLS パスで古いトークンが使われる不具合を修正
- Gemini の RAG / マルチモーダル検索の SDK パスが揃った
ソース
Google GenAI Python SDK Releases