如何使用 Python 构建并使用 Google Gemini Pro?
Google的Gemini Pro API搭配Python语言,为我们提供了一种全新的人工智能(LLM)功能构建方式。接下来,我们将详细介绍如何获取API密钥、如何在Python中使用Gemini LLM,以及如何利用这些技术开展一系列有趣的项目。
获得API密钥
首要步骤是获得访问Gemini Pro API的钥匙。这可以通过免费的网络工具Google AI Studio轻松完成。使用Google账户登录后,您便可以得到专属的API密钥,记得妥善保管,避免在公共平台如GitHub泄露。
尽管Google Gemini Pro的覆盖区域还在逐步扩大,对于某些地区尚未开放的用户,或许需要更换节点进行访问。
激活Gemini Pro API
要开始使用 Gemini Pro API,我们需要从 PyPI 或 GitHub安装google-generativeai包
pip install -q -U google-generativeai
安装所需的Python包后,您将需要一个YAML文件来安全地加载和存储API密钥,从而避免在代码中直接暴露密钥信息。接下来,通过简单的Python脚本,您可以轻松地创建与Gemini Pro模型的连接,并开始您的AI编程之旅。
import yaml
import google.generativeai as genai
# 加载API密钥
with open('gemini_key.yml', 'r') as file:
api_creds = yaml.safe_load(file)
GOOGLE_API_KEY = api_creds['gemini_key']
# 配置并加载模型
genai.configure(api_key=GOOGLE_API_KEY)
model = genai.GenerativeModel('gemini-pro')
使用to_markdown (…)函数使文本输出看起来更漂亮。
response = model.generate_content("Explain Generative AI with 3 bullet points")
to_markdown(response.text)
运用Gemini Pro进行智能创作
Gemini Pro不仅能够处理文本输入,还能够通过Vision API结合图像与文本,开启多模态的交互体验。例如,您可以上传一张图片,并让AI基于图像内容编写故事,这对于内容创作者来说是一项非常有趣的功能。
import PIL.Image
img = PIL.Image.open('cat_pc.jpg')
img
此外,Gemini Pro的能力还包括提供多轮对话支持,使其在构建交云体验方面具有巨大的潜力。
最后
Gemini Pro和Python的结合为AI项目开发提供了一条既简单又强大的路径。它为初学者和经验丰富的开发者都打开了一个探索AI的全新大门,而且目前这一切还是免费提供。尽管未来可能会引入收费机制,但能够在没有初始投资的情况下开始探索和构建,无疑是一个难得的机会。