好评赠送10元额度 ~🧧点击参与

Probe API 帮助文档
系统首页
系统首页
  1. 常见问题
  • 【必读】一键获取APIKEY
  • 计费规则
  • 好评返现
  • 常见软件配置
    • 常见软件配置目录
    • OpenClaw
    • ChatBox
    • VS Code-Cline & Roo Code
    • Claude Code
    • Trae
    • OpenCode
    • CherryStudio
    • Tavo
    • 酒馆
    • 沉浸式翻译
    • 欧路词典
    • Zotero
    • RAG Flow
    • Dify
    • n8n
    • 命令行测试(CURL)
  • 接口文档
    • 模型接口
      • 阿里百炼(Qwen)特殊格式接口文档
        • 文生图
        • 图像编辑
        • 文生视频
        • 图生视频
        • 语音识别
        • 语音合成
        • 视频换人
      • 基础聊天
      • 图像识别
      • 图像生成
      • 图像修改
      • 生成视频
      • 获取视频(异步)
      • TTS
      • 语音转文字
      • 嵌入模型
      • 重排序
      • TTS(通义千问)
    • 系统管理接口
      • Token管理接口
  • 示例代码
    • 基础对话
    • 基础对话(并发调用)
    • 识图模型
    • 图片生成
    • 图片生成(通义千问)
  • 常见问题
    • 常见问题指引
    • 首次使用如何操作?
    • 额度用完后如何继续充值?
    • 忘记密码了、APIKEY怎么办?
    • 可以上传图片进行提问吗?
    • 如何查看Token消耗量及调用次数?
    • 如何开启余额不足通知?
    • 不知道该选择那个模型?
    • 可以用那些模型?
    • 如何联系客服?
  1. 常见问题

可以上传图片进行提问吗?

不同的 AI 模型对多模态(图片输入)的支持情况不同。请根据您选择的模型来判断是否支持上传图片。

1. 举例#

❌ DeepSeek 系列#

仅支持文本输入。
DeepSeek 模型专注于文本处理和代码生成,暂不支持直接读取或分析图片内容。

✅ 通义千问 VL (Qwen-VL)#

支持图片输入。
VL (Vision Language) 系列模型具备视觉理解能力,可以上传图片进行问答。

✅ GLM V 系列 (如 GLM-4V)#

支持图片输入。
带 "V" (Vision) 后缀的 GLM 模型支持多模态交互,能够识别和分析图片。

image.png#

2. 开发者接入指南 👨‍💻#

如果您是通过 API 接入使用,请参考以下文档以正确调用视觉模型接口:
📄 接口格式说明:
点击查看 API 文档
💻 示例代码:
点击查看调用示例
修改于 2026-01-07 07:53:46
上一页
忘记密码了、APIKEY怎么办?
下一页
如何查看Token消耗量及调用次数?
Built with