# PoloAPI 接口文档

## Docs
- 模型接口 > 调用基础 [常见问题及解决办法](https://apidoc.poloapi.com/7354870m0.md): 
- 模型接口 > 调用基础 [批量请求示例](https://apidoc.poloapi.com/7354883m0.md): 

## API Docs
- 模型接口 > Openai [文本生成](https://apidoc.poloapi.com/319292009e0.md): 
- 模型接口 > Openai [文本生成---上下文阅读](https://apidoc.poloapi.com/333034600e0.md): 
- 模型接口 > Openai [图片理解](https://apidoc.poloapi.com/319292010e0.md): 
- 模型接口 > Openai [图片生成（gpt-image-1）](https://apidoc.poloapi.com/319292011e0.md): 根据提示词以及其他参数创建图片
- 模型接口 > Openai [图片编辑/edits](https://apidoc.poloapi.com/319292012e0.md): 根据一个或多个原始图片和提示创建编辑或扩展的图片。此端点支持 dall-e-2 和 gpt-image-1 模型。
- 模型接口 > Openai [图片编辑 / 网页版](https://apidoc.poloapi.com/319292013e0.md): 为满足用户的强烈需求，我们特别推出了两个逆向接口：gpt-4o-image 与 gpt-4o-image-vip。其中，VIP 模型在性能和稳定性方面表现更为出色。
- 模型接口 > Openai [函数调用 tools](https://apidoc.poloapi.com/319292014e0.md): 官方结构化输出
- 模型接口 > Openai [v1/Responses / 通用](https://apidoc.poloapi.com/324058773e0.md): 
- 模型接口 > Openai [创建文本嵌入](https://apidoc.poloapi.com/324061953e0.md): 获取给定输入的矢量表示，机器学习模型和算法可以轻松使用该表示。
- 模型接口 > Openai [批量创建嵌入](https://apidoc.poloapi.com/324062018e0.md): 获取给定输入的矢量表示，机器学习模型和算法可以轻松使用该表示。
- 模型接口 > Openai [文本转语音 / TTS](https://apidoc.poloapi.com/324062437e0.md): 文本转语音（TTS）API 基于先进的生成 AI 模型，可以将输入的文本转换为逼真的语音音频。支持多种用途：
- 模型接口 > Openai [语音转文本 / whisper-1](https://apidoc.poloapi.com/324063691e0.md): 
- 模型接口 > Openai [语音转文本 / gpt-4o-transcribe](https://apidoc.poloapi.com/324063913e0.md): 
- 模型接口 > Openai [音频翻译](https://apidoc.poloapi.com/324064681e0.md): 将音频翻译成英文。
- 模型接口 > Openai [Audio接口 / 输出](https://apidoc.poloapi.com/324127768e0.md): 
- 模型接口 > Openai [Audio接口 / 输入](https://apidoc.poloapi.com/324128199e0.md): 
- 模型接口 > Openai [内容补全接口](https://apidoc.poloapi.com/324130045e0.md): 给定一个提示，该模型将返回一个或多个预测的完成，并且还可以返回每个位置的替代标记的概率。
- 模型接口 > Openai [创建内容审核](https://apidoc.poloapi.com/324131215e0.md): 对文本是否违反 OpenAI 的内容政策进行分类
- 模型接口 > Openai [PDF文件分析](https://apidoc.poloapi.com/324132275e0.md): PDF转成base64替换到${base64String}
- 模型接口 > Openai [deep-research / 深度研究](https://apidoc.poloapi.com/324133120e0.md): 要进行深度研究，请使用Responses API，并将模型设置为o3-deep-research或o4-mini-deep-research。
- 模型接口 > Openai [Web search / 联网搜索](https://apidoc.poloapi.com/324136256e0.md): 本中转所有模型均已适配v1/chat/completions
- 模型接口 > Openai [response_format](https://apidoc.poloapi.com/324137123e0.md): 官方结构化输出
- 模型接口 > Anthropic Claude > 原生接口 [文本生成](https://apidoc.poloapi.com/319314320e0.md): Claude原生格式请求
- 模型接口 > Anthropic Claude > 原生接口 [图片理解](https://apidoc.poloapi.com/319315781e0.md): Claude原生格式请求
- 模型接口 > Anthropic Claude > 原生接口 [文本生成 / 强制返回思考](https://apidoc.poloapi.com/319588522e0.md): Claude原生格式请求，强制思考请使用模型后缀-thinking，如claude-sonnet-4-20250514-thinking
- 模型接口 > Anthropic Claude > 原生接口 [函数调用](https://apidoc.poloapi.com/319588701e0.md): Claude原生格式请求
- 模型接口 > Anthropic Claude > 原生接口 [Web search / 联网搜索](https://apidoc.poloapi.com/319589236e0.md): Claude原生格式请求
- 模型接口 > Anthropic Claude > 原生接口 [文本生成 (思考配置)](https://apidoc.poloapi.com/346199983e0.md): Claude原生格式请求
- 模型接口 > Anthropic Claude > OpenAI兼容接口 [文本生成](https://apidoc.poloapi.com/319317051e0.md): 模型名称：claude-opus-4-20250514、claude-sonnet-4-20250514、claude-3-7-sonnet-20250219、claude-3-5-sonnet-20241022、claude-3-5-sonnet-20240620、claude-3-5-haiku-20241022
- 模型接口 > Anthropic Claude > OpenAI兼容接口 [图片理解](https://apidoc.poloapi.com/319320968e0.md): 
- 模型接口 > Anthropic Claude > OpenAI兼容接口 [文本生成 / 强制返回思考](https://apidoc.poloapi.com/319590928e0.md): Claude原生格式请求，强制思考请使用模型后缀-thinking，如claude-sonnet-4-20250514-thinking
- 模型接口 > Anthropic Claude > OpenAI兼容接口 [函数调用](https://apidoc.poloapi.com/319590929e0.md): Claude原生格式请求
- 模型接口 > Anthropic Claude > OpenAI兼容接口 [Web search / 联网搜索](https://apidoc.poloapi.com/319590931e0.md): Claude原生格式请求
- 模型接口 > Google Gemini > OpenAI兼容接口（推荐） [文本生成](https://apidoc.poloapi.com/319573644e0.md): 
- 模型接口 > Google Gemini > OpenAI兼容接口（推荐） [文本生成 / 强制返回思考](https://apidoc.poloapi.com/319580762e0.md): 和Claude不同，默认情况下Gemini的思考模型会自动决定要不要思考
- 模型接口 > Google Gemini > OpenAI兼容接口（推荐） [图片理解](https://apidoc.poloapi.com/319581364e0.md): 
- 模型接口 > Google Gemini > OpenAI兼容接口（推荐） [图片生成](https://apidoc.poloapi.com/319585167e0.md): Gemini 也提供了图像生成能力，作为一种替代方案。与 Imagen 3.0 相比，Gemini 的图像生成更适合于需要上下文理解和推理的场景，而非追求极致的艺术表现和视觉质量。
- 模型接口 > Google Gemini > OpenAI兼容接口（推荐） [图片修改](https://apidoc.poloapi.com/319587877e0.md): 
- 模型接口 > Google Gemini > OpenAI兼容接口（推荐） [图片生成 / Imagen 4](https://apidoc.poloapi.com/319592052e0.md): Gemini 绘图和视频生成指引
- 模型接口 > Google Gemini > OpenAI兼容接口（推荐） [音频理解](https://apidoc.poloapi.com/319587335e0.md): 
- 模型接口 > Google Gemini > OpenAI兼容接口（推荐） [视频理解](https://apidoc.poloapi.com/319587668e0.md): 
- 模型接口 > Google Gemini > OpenAI兼容接口（推荐） [文本转语音 / TTS](https://apidoc.poloapi.com/319592939e0.md): 
- 模型接口 > Google Gemini > OpenAI兼容接口（推荐） [图片编辑（Nano-banana）](https://apidoc.poloapi.com/342937649e0.md): Gemini 也提供了图像生成能力，作为一种替代方案。与 Imagen 3.0 相比，Gemini 的图像生成更适合于需要上下文理解和推理的场景，而非追求极致的艺术表现和视觉质量。
- 模型接口 > Google Gemini > OpenAI兼容接口（推荐） [图片编辑（Nano-banana） base64格式](https://apidoc.poloapi.com/343665751e0.md): 
- 模型接口 > Google Gemini > Google Gemini接口 [文本生成](https://apidoc.poloapi.com/319568140e0.md): 需单独切换Google Gemini格式分组调用
- 模型接口 > Google Gemini > Google Gemini接口 [文字转语音](https://apidoc.poloapi.com/324204678e0.md): 仅限gemini-2.5-pro-preview-tts和gemini-2.5-flash-preview-tts模型
- 模型接口 > Google Gemini > Google Gemini接口 [音频转文](https://apidoc.poloapi.com/324703456e0.md): 
- 模型接口 > Google Gemini > Google Gemini接口 [视频转文](https://apidoc.poloapi.com/324713258e0.md): 
- 模型接口 > Google Gemini > Google Gemini接口 [图片理解](https://apidoc.poloapi.com/328579501e0.md): 需单独切换Google Gemini格式分组调用
- 模型接口 > Google Gemini > Google Gemini接口 [图片编辑（gemini-2.5-flash-image-preview）](https://apidoc.poloapi.com/342125236e0.md): 官方文档：https://ai.google.dev/gemini-api/docs/image-generation?hl=zh-cn#gemini-image-editing
- 模型接口 > Midjourney > Openai兼容/chat格式 [MJ视频 （chat格式）](https://apidoc.poloapi.com/329853058e0.md): 
- 模型接口 > Midjourney > 原生接口 [文生图（Imagine）](https://apidoc.poloapi.com/319292001e0.md): prompt预设值参数解释：
- 模型接口 > Midjourney > 原生接口 [图片融合（Blend）](https://apidoc.poloapi.com/319292003e0.md): 执行Blend操作，提交融图任务。
- 模型接口 > Midjourney > 原生接口 [按钮点击（Action）](https://apidoc.poloapi.com/319292002e0.md): 该接口是用于点击图片下方的按钮，customId通过任务查询接口可以获取到。
- 模型接口 > Midjourney > 原生接口 [窗口执行（Modal）](https://apidoc.poloapi.com/319292004e0.md): 当执行其他任务，code返回21时，需要执行modal接口，传入新的提示词用来修改细节。
- 模型接口 > Midjourney > 原生接口 [生成视频（Video）](https://apidoc.poloapi.com/319595894e0.md): 执行video操作，提交绘图任务。提交任务后，获取到任务id，使用查询接口查询任务状态。（视频的按钮可以使用action进行点击）
- 模型接口 > Midjourney > 原生接口 [图生文（Describe）](https://apidoc.poloapi.com/319292005e0.md): 执行Describe操作，提交图生文任务。
- 模型接口 > Midjourney > 原生接口 [编辑图片（Edit）](https://apidoc.poloapi.com/319595757e0.md): 执行edit接口，可以编辑外部传入的图片，可以进行局部重绘，也可以直接改图
- 模型接口 > Midjourney > 原生接口 [上传（upload）](https://apidoc.poloapi.com/319292008e0.md): 提交FaceSwap任务，进行换脸操作。
- 模型接口 > Midjourney > 原生接口 [换脸（FaceSwap）](https://apidoc.poloapi.com/319292007e0.md): 提交FaceSwap任务，进行换脸操作。
- 模型接口 > Midjourney > 原生接口 [缩短提示词（Shorten）](https://apidoc.poloapi.com/319292006e0.md): 执行shorten操作，识别在关键词中有哪些单词在生成图像时发挥关键因素，哪些单词则不太重要。
- 模型接口 > Midjourney > 原生接口 [查询](https://apidoc.poloapi.com/319593153e0.md): 
- 模型接口 > Midjourney > 原生接口 [获取种子（Seed）接口](https://apidoc.poloapi.com/319593820e0.md): 
- 模型接口 > Midjourney > 原生接口 [批量查询](https://apidoc.poloapi.com/319593600e0.md): 
- 模型接口 > Midjourney > 原生接口 [文生图 / OpenAI兼容](https://apidoc.poloapi.com/319596238e0.md): 
- 模型接口 > 文生图接口 [flux / OpenAI兼容接口](https://apidoc.poloapi.com/324138067e0.md): image_size Available options: 1024x1024, 512x1024, 768x512, 768x1024, 1024x576, 576x1024
- 模型接口 > 文生图接口 [flux-kontext-pro / OpenAI兼容接口](https://apidoc.poloapi.com/324138097e0.md): 
- 模型接口 > 文生图接口 [stable-diffusion / OpenAI兼容接口](https://apidoc.poloapi.com/324138270e0.md): image_size Available options: 1024x1024, 512x1024, 768x512, 768x1024, 1024x576, 576x1024
- 模型接口 > 文生图接口 [ideogram / OpenAI兼容接口](https://apidoc.poloapi.com/324138329e0.md): 模型名称：ideogram-v3-turbo、ideogram-v3-balanced、ideogram-v3-quality
- 模型接口 > 文生图接口 [recraftv3 / OpenAI兼容接口](https://apidoc.poloapi.com/324138439e0.md): model 支持
- 模型接口 > 文生图接口 [flux携带参考图 / OpenAI兼容接口](https://apidoc.poloapi.com/324138506e0.md): 仅部分模型支持 图片 参考
- 模型接口 > Suno [生成歌曲](https://apidoc.poloapi.com/325066373e0.md): 根据提示生成歌曲
- 模型接口 > Suno [生成歌词](https://apidoc.poloapi.com/325079022e0.md): 
- 模型接口 > Suno [查询任务状态（批量）](https://apidoc.poloapi.com/325138342e0.md): 
- 模型接口 > Suno [查询任务状态（单个）](https://apidoc.poloapi.com/325148284e0.md): 
- 模型接口 > 3D模型 [Hunyuan3D-2](https://apidoc.poloapi.com/332779701e0.md): 
- 模型接口 > veo [图生视频](https://apidoc.poloapi.com/339951770e0.md): 支持多张参考图片，以数组形式提供图片URL
- 模型接口 > veo [文生视频](https://apidoc.poloapi.com/339951824e0.md): 
- 模型接口 > veo [查询视频生成状态](https://apidoc.poloapi.com/339953308e0.md): 
- 模型接口 > veo [图生视频（chat格式）](https://apidoc.poloapi.com/340080677e0.md): veo3-fast 文字快速生成视频
- 模型接口 > FLUX [/fal-ai/nano-banana 文生图](https://apidoc.poloapi.com/342126248e0.md): 官方文档: https://fal.ai/models/fal-ai/nano-banana
- 模型接口 > FLUX [/fal-ai/nano-banana/edit 图片编辑](https://apidoc.poloapi.com/342127229e0.md): 官方文档: https://fal.ai/models/fal-ai/nano-banana/edit
- 模型接口 > 豆包 [doubao-seedream-4-0-250828-文生图](https://apidoc.poloapi.com/352113227e0.md): 给定提示和/或输入图像，模型将生成新图像。
- 模型接口 > 豆包 [doubao-seedream-4-0-250828-图生图](https://apidoc.poloapi.com/352113512e0.md): 给定提示和/或输入图像，模型将生成新图像。
- 模型接口 > 豆包 [doubao-seedream-4-0-250828-多图生图](https://apidoc.poloapi.com/352114017e0.md): 给定提示和/或输入图像，模型将生成新图像。