# PoloAPI 接口文档 ## Docs - 模型接口 > 调用基础 [常见问题及解决办法](https://apidoc.poloapi.com/7354870m0.md): - 模型接口 > 调用基础 [批量请求示例](https://apidoc.poloapi.com/7354883m0.md): ## API Docs - 模型接口 > Openai [文本生成](https://apidoc.poloapi.com/319292009e0.md): - 模型接口 > Openai [文本生成---上下文阅读](https://apidoc.poloapi.com/333034600e0.md): - 模型接口 > Openai [图片理解](https://apidoc.poloapi.com/319292010e0.md): - 模型接口 > Openai [图片生成(gpt-image-1)](https://apidoc.poloapi.com/319292011e0.md): 根据提示词以及其他参数创建图片 - 模型接口 > Openai [图片编辑/edits](https://apidoc.poloapi.com/319292012e0.md): 根据一个或多个原始图片和提示创建编辑或扩展的图片。此端点支持 dall-e-2 和 gpt-image-1 模型。 - 模型接口 > Openai [图片编辑 / 网页版](https://apidoc.poloapi.com/319292013e0.md): 为满足用户的强烈需求,我们特别推出了两个逆向接口:gpt-4o-image 与 gpt-4o-image-vip。其中,VIP 模型在性能和稳定性方面表现更为出色。 - 模型接口 > Openai [函数调用 tools](https://apidoc.poloapi.com/319292014e0.md): 官方结构化输出 - 模型接口 > Openai [v1/Responses / 通用](https://apidoc.poloapi.com/324058773e0.md): - 模型接口 > Openai [创建文本嵌入](https://apidoc.poloapi.com/324061953e0.md): 获取给定输入的矢量表示,机器学习模型和算法可以轻松使用该表示。 - 模型接口 > Openai [批量创建嵌入](https://apidoc.poloapi.com/324062018e0.md): 获取给定输入的矢量表示,机器学习模型和算法可以轻松使用该表示。 - 模型接口 > Openai [文本转语音 / TTS](https://apidoc.poloapi.com/324062437e0.md): 文本转语音(TTS)API 基于先进的生成 AI 模型,可以将输入的文本转换为逼真的语音音频。支持多种用途: - 模型接口 > Openai [语音转文本 / whisper-1](https://apidoc.poloapi.com/324063691e0.md): - 模型接口 > Openai [语音转文本 / gpt-4o-transcribe](https://apidoc.poloapi.com/324063913e0.md): - 模型接口 > Openai [音频翻译](https://apidoc.poloapi.com/324064681e0.md): 将音频翻译成英文。 - 模型接口 > Openai [Audio接口 / 输出](https://apidoc.poloapi.com/324127768e0.md): - 模型接口 > Openai [Audio接口 / 输入](https://apidoc.poloapi.com/324128199e0.md): - 模型接口 > Openai [内容补全接口](https://apidoc.poloapi.com/324130045e0.md): 给定一个提示,该模型将返回一个或多个预测的完成,并且还可以返回每个位置的替代标记的概率。 - 模型接口 > Openai [创建内容审核](https://apidoc.poloapi.com/324131215e0.md): 对文本是否违反 OpenAI 的内容政策进行分类 - 模型接口 > Openai [PDF文件分析](https://apidoc.poloapi.com/324132275e0.md): PDF转成base64替换到${base64String} - 模型接口 > Openai [deep-research / 深度研究](https://apidoc.poloapi.com/324133120e0.md): 要进行深度研究,请使用Responses API,并将模型设置为o3-deep-research或o4-mini-deep-research。 - 模型接口 > Openai [Web search / 联网搜索](https://apidoc.poloapi.com/324136256e0.md): 本中转所有模型均已适配v1/chat/completions - 模型接口 > Openai [response_format](https://apidoc.poloapi.com/324137123e0.md): 官方结构化输出 - 模型接口 > Anthropic Claude > 原生接口 [文本生成](https://apidoc.poloapi.com/319314320e0.md): Claude原生格式请求 - 模型接口 > Anthropic Claude > 原生接口 [图片理解](https://apidoc.poloapi.com/319315781e0.md): Claude原生格式请求 - 模型接口 > Anthropic Claude > 原生接口 [文本生成 / 强制返回思考](https://apidoc.poloapi.com/319588522e0.md): Claude原生格式请求,强制思考请使用模型后缀-thinking,如claude-sonnet-4-20250514-thinking - 模型接口 > Anthropic Claude > 原生接口 [函数调用](https://apidoc.poloapi.com/319588701e0.md): Claude原生格式请求 - 模型接口 > Anthropic Claude > 原生接口 [Web search / 联网搜索](https://apidoc.poloapi.com/319589236e0.md): Claude原生格式请求 - 模型接口 > Anthropic Claude > 原生接口 [文本生成 (思考配置)](https://apidoc.poloapi.com/346199983e0.md): Claude原生格式请求 - 模型接口 > Anthropic Claude > OpenAI兼容接口 [文本生成](https://apidoc.poloapi.com/319317051e0.md): 模型名称:claude-opus-4-20250514、claude-sonnet-4-20250514、claude-3-7-sonnet-20250219、claude-3-5-sonnet-20241022、claude-3-5-sonnet-20240620、claude-3-5-haiku-20241022 - 模型接口 > Anthropic Claude > OpenAI兼容接口 [图片理解](https://apidoc.poloapi.com/319320968e0.md): - 模型接口 > Anthropic Claude > OpenAI兼容接口 [文本生成 / 强制返回思考](https://apidoc.poloapi.com/319590928e0.md): Claude原生格式请求,强制思考请使用模型后缀-thinking,如claude-sonnet-4-20250514-thinking - 模型接口 > Anthropic Claude > OpenAI兼容接口 [函数调用](https://apidoc.poloapi.com/319590929e0.md): Claude原生格式请求 - 模型接口 > Anthropic Claude > OpenAI兼容接口 [Web search / 联网搜索](https://apidoc.poloapi.com/319590931e0.md): Claude原生格式请求 - 模型接口 > Google Gemini > OpenAI兼容接口(推荐) [文本生成](https://apidoc.poloapi.com/319573644e0.md): - 模型接口 > Google Gemini > OpenAI兼容接口(推荐) [文本生成 / 强制返回思考](https://apidoc.poloapi.com/319580762e0.md): 和Claude不同,默认情况下Gemini的思考模型会自动决定要不要思考 - 模型接口 > Google Gemini > OpenAI兼容接口(推荐) [图片理解](https://apidoc.poloapi.com/319581364e0.md): - 模型接口 > Google Gemini > OpenAI兼容接口(推荐) [图片生成](https://apidoc.poloapi.com/319585167e0.md): Gemini 也提供了图像生成能力,作为一种替代方案。与 Imagen 3.0 相比,Gemini 的图像生成更适合于需要上下文理解和推理的场景,而非追求极致的艺术表现和视觉质量。 - 模型接口 > Google Gemini > OpenAI兼容接口(推荐) [图片修改](https://apidoc.poloapi.com/319587877e0.md): - 模型接口 > Google Gemini > OpenAI兼容接口(推荐) [图片生成 / Imagen 4](https://apidoc.poloapi.com/319592052e0.md): Gemini 绘图和视频生成指引 - 模型接口 > Google Gemini > OpenAI兼容接口(推荐) [音频理解](https://apidoc.poloapi.com/319587335e0.md): - 模型接口 > Google Gemini > OpenAI兼容接口(推荐) [视频理解](https://apidoc.poloapi.com/319587668e0.md): - 模型接口 > Google Gemini > OpenAI兼容接口(推荐) [文本转语音 / TTS](https://apidoc.poloapi.com/319592939e0.md): - 模型接口 > Google Gemini > OpenAI兼容接口(推荐) [图片编辑(Nano-banana)](https://apidoc.poloapi.com/342937649e0.md): Gemini 也提供了图像生成能力,作为一种替代方案。与 Imagen 3.0 相比,Gemini 的图像生成更适合于需要上下文理解和推理的场景,而非追求极致的艺术表现和视觉质量。 - 模型接口 > Google Gemini > OpenAI兼容接口(推荐) [图片编辑(Nano-banana) base64格式](https://apidoc.poloapi.com/343665751e0.md): - 模型接口 > Google Gemini > Google Gemini接口 [文本生成](https://apidoc.poloapi.com/319568140e0.md): 需单独切换Google Gemini格式分组调用 - 模型接口 > Google Gemini > Google Gemini接口 [文字转语音](https://apidoc.poloapi.com/324204678e0.md): 仅限gemini-2.5-pro-preview-tts和gemini-2.5-flash-preview-tts模型 - 模型接口 > Google Gemini > Google Gemini接口 [音频转文](https://apidoc.poloapi.com/324703456e0.md): - 模型接口 > Google Gemini > Google Gemini接口 [视频转文](https://apidoc.poloapi.com/324713258e0.md): - 模型接口 > Google Gemini > Google Gemini接口 [图片理解](https://apidoc.poloapi.com/328579501e0.md): 需单独切换Google Gemini格式分组调用 - 模型接口 > Google Gemini > Google Gemini接口 [图片编辑(gemini-2.5-flash-image-preview)](https://apidoc.poloapi.com/342125236e0.md): 官方文档:https://ai.google.dev/gemini-api/docs/image-generation?hl=zh-cn#gemini-image-editing - 模型接口 > Midjourney > Openai兼容/chat格式 [MJ视频 (chat格式)](https://apidoc.poloapi.com/329853058e0.md): - 模型接口 > Midjourney > 原生接口 [文生图(Imagine)](https://apidoc.poloapi.com/319292001e0.md): prompt预设值参数解释: - 模型接口 > Midjourney > 原生接口 [图片融合(Blend)](https://apidoc.poloapi.com/319292003e0.md): 执行Blend操作,提交融图任务。 - 模型接口 > Midjourney > 原生接口 [按钮点击(Action)](https://apidoc.poloapi.com/319292002e0.md): 该接口是用于点击图片下方的按钮,customId通过任务查询接口可以获取到。 - 模型接口 > Midjourney > 原生接口 [窗口执行(Modal)](https://apidoc.poloapi.com/319292004e0.md): 当执行其他任务,code返回21时,需要执行modal接口,传入新的提示词用来修改细节。 - 模型接口 > Midjourney > 原生接口 [生成视频(Video)](https://apidoc.poloapi.com/319595894e0.md): 执行video操作,提交绘图任务。提交任务后,获取到任务id,使用查询接口查询任务状态。(视频的按钮可以使用action进行点击) - 模型接口 > Midjourney > 原生接口 [图生文(Describe)](https://apidoc.poloapi.com/319292005e0.md): 执行Describe操作,提交图生文任务。 - 模型接口 > Midjourney > 原生接口 [编辑图片(Edit)](https://apidoc.poloapi.com/319595757e0.md): 执行edit接口,可以编辑外部传入的图片,可以进行局部重绘,也可以直接改图 - 模型接口 > Midjourney > 原生接口 [上传(upload)](https://apidoc.poloapi.com/319292008e0.md): 提交FaceSwap任务,进行换脸操作。 - 模型接口 > Midjourney > 原生接口 [换脸(FaceSwap)](https://apidoc.poloapi.com/319292007e0.md): 提交FaceSwap任务,进行换脸操作。 - 模型接口 > Midjourney > 原生接口 [缩短提示词(Shorten)](https://apidoc.poloapi.com/319292006e0.md): 执行shorten操作,识别在关键词中有哪些单词在生成图像时发挥关键因素,哪些单词则不太重要。 - 模型接口 > Midjourney > 原生接口 [查询](https://apidoc.poloapi.com/319593153e0.md): - 模型接口 > Midjourney > 原生接口 [获取种子(Seed)接口](https://apidoc.poloapi.com/319593820e0.md): - 模型接口 > Midjourney > 原生接口 [批量查询](https://apidoc.poloapi.com/319593600e0.md): - 模型接口 > Midjourney > 原生接口 [文生图 / OpenAI兼容](https://apidoc.poloapi.com/319596238e0.md): - 模型接口 > 文生图接口 [flux / OpenAI兼容接口](https://apidoc.poloapi.com/324138067e0.md): image_size Available options: 1024x1024, 512x1024, 768x512, 768x1024, 1024x576, 576x1024 - 模型接口 > 文生图接口 [flux-kontext-pro / OpenAI兼容接口](https://apidoc.poloapi.com/324138097e0.md): - 模型接口 > 文生图接口 [stable-diffusion / OpenAI兼容接口](https://apidoc.poloapi.com/324138270e0.md): image_size Available options: 1024x1024, 512x1024, 768x512, 768x1024, 1024x576, 576x1024 - 模型接口 > 文生图接口 [ideogram / OpenAI兼容接口](https://apidoc.poloapi.com/324138329e0.md): 模型名称:ideogram-v3-turbo、ideogram-v3-balanced、ideogram-v3-quality - 模型接口 > 文生图接口 [recraftv3 / OpenAI兼容接口](https://apidoc.poloapi.com/324138439e0.md): model 支持 - 模型接口 > 文生图接口 [flux携带参考图 / OpenAI兼容接口](https://apidoc.poloapi.com/324138506e0.md): 仅部分模型支持 图片 参考 - 模型接口 > Suno [生成歌曲](https://apidoc.poloapi.com/325066373e0.md): 根据提示生成歌曲 - 模型接口 > Suno [生成歌词](https://apidoc.poloapi.com/325079022e0.md): - 模型接口 > Suno [查询任务状态(批量)](https://apidoc.poloapi.com/325138342e0.md): - 模型接口 > Suno [查询任务状态(单个)](https://apidoc.poloapi.com/325148284e0.md): - 模型接口 > 3D模型 [Hunyuan3D-2](https://apidoc.poloapi.com/332779701e0.md): - 模型接口 > veo [图生视频](https://apidoc.poloapi.com/339951770e0.md): 支持多张参考图片,以数组形式提供图片URL - 模型接口 > veo [文生视频](https://apidoc.poloapi.com/339951824e0.md): - 模型接口 > veo [查询视频生成状态](https://apidoc.poloapi.com/339953308e0.md): - 模型接口 > veo [图生视频(chat格式)](https://apidoc.poloapi.com/340080677e0.md): veo3-fast 文字快速生成视频 - 模型接口 > FLUX [/fal-ai/nano-banana 文生图](https://apidoc.poloapi.com/342126248e0.md): 官方文档: https://fal.ai/models/fal-ai/nano-banana - 模型接口 > FLUX [/fal-ai/nano-banana/edit 图片编辑](https://apidoc.poloapi.com/342127229e0.md): 官方文档: https://fal.ai/models/fal-ai/nano-banana/edit - 模型接口 > 豆包 [doubao-seedream-4-0-250828-文生图](https://apidoc.poloapi.com/352113227e0.md): 给定提示和/或输入图像,模型将生成新图像。 - 模型接口 > 豆包 [doubao-seedream-4-0-250828-图生图](https://apidoc.poloapi.com/352113512e0.md): 给定提示和/或输入图像,模型将生成新图像。 - 模型接口 > 豆包 [doubao-seedream-4-0-250828-多图生图](https://apidoc.poloapi.com/352114017e0.md): 给定提示和/或输入图像,模型将生成新图像。