Tools
تولید تصویر
ابزار image_generate به عامل امکان میدهد با استفاده از ارائهدهندگان پیکربندیشدهی شما تصویر ایجاد و ویرایش کند. در نشستهای چت، تولید تصویر بهصورت ناهمگام اجرا میشود:
OpenClaw یک وظیفهی پسزمینه ثبت میکند، شناسهی وظیفه را بلافاصله برمیگرداند، و وقتی ارائهدهنده کار را تمام کند عامل را بیدار میکند. عامل تکمیل، حالت عادی نشست برای پاسخ قابلمشاهده را دنبال میکند: تحویل خودکار پاسخ نهایی وقتی پیکربندی شده باشد، یا message(action="send") وقتی نشست به ابزار پیام نیاز داشته باشد. اگر نشست درخواستکننده غیرفعال باشد یا بیدارسازی فعال آن شکست بخورد، و بعضی از تصاویر تولیدشده هنوز در پاسخ تکمیل وجود نداشته باشند، OpenClaw یک جایگزین مستقیم ایدمپوتنت ارسال میکند که فقط شامل تصاویر جاافتاده است.
شروع سریع
پیکربندی احراز هویت
برای دستکم یک ارائهدهنده یک کلید API تنظیم کنید (برای مثال OPENAI_API_KEY،
GEMINI_API_KEY، OPENROUTER_API_KEY) یا با OpenAI Codex OAuth وارد شوید.
انتخاب یک مدل پیشفرض (اختیاری)
{ agents: { defaults: { imageGenerationModel: { primary: "openai/gpt-image-2", timeoutMs: 180_000, }, }, },}ChatGPT/Codex OAuth از همان مرجع مدل openai/gpt-image-2 استفاده میکند. وقتی یک
پروفایل OAuth برای openai پیکربندی شده باشد، OpenClaw درخواستهای تصویر را
بهجای اینکه ابتدا OPENAI_API_KEY را امتحان کند، از طریق همان پروفایل OAuth
مسیریابی میکند. پیکربندی صریح models.providers.openai (کلید API،
نشانی پایهی سفارشی/Azure) دوباره مسیر مستقیم OpenAI Images API را
فعال میکند.
از عامل درخواست کنید
"تصویری از یک ربات نمادین دوستانه تولید کن."
عامل بهصورت خودکار image_generate را فراخوانی میکند. نیازی به فهرست مجاز ابزارها
نیست - وقتی ارائهدهندهای در دسترس باشد، بهطور پیشفرض فعال است. ابزار
یک شناسهی وظیفهی پسزمینه برمیگرداند، سپس عامل تکمیل وقتی آماده شد پیوست تولیدشده
را از طریق ابزار message ارسال میکند.
مسیرهای رایج
| هدف | مرجع مدل | احراز هویت |
|---|---|---|
| تولید تصویر OpenAI با صورتحساب API | openai/gpt-image-2 |
OPENAI_API_KEY |
| تولید تصویر OpenAI با احراز هویت اشتراک Codex | openai/gpt-image-2 |
OpenAI ChatGPT/Codex OAuth |
| PNG/WebP با پسزمینه شفاف OpenAI | openai/gpt-image-1.5 |
OPENAI_API_KEY یا OpenAI Codex OAuth |
| تولید تصویر DeepInfra | deepinfra/black-forest-labs/FLUX-1-schnell |
DEEPINFRA_API_KEY |
| تولید بیانگر/سبکمحور fal Krea 2 | fal/krea/v2/medium/text-to-image |
FAL_KEY |
| تولید تصویر OpenRouter | openrouter/google/gemini-3.1-flash-image-preview |
OPENROUTER_API_KEY |
| تولید تصویر LiteLLM | litellm/gpt-image-2 |
LITELLM_API_KEY |
| تولید تصویر Microsoft Foundry MAI | microsoft-foundry/<deployment-name> |
AZURE_OPENAI_API_KEY یا Entra ID |
| تولید تصویر Google Gemini | google/gemini-3.1-flash-image-preview |
GEMINI_API_KEY یا GOOGLE_API_KEY |
همان ابزار image_generate تولید متنبهتصویر و ویرایش تصویر مرجع را مدیریت میکند.
برای یک مرجع از image و برای چند مرجع از images استفاده کنید.
برای مدلهای Krea 2 روی fal، آن مراجع بهجای ورودیهای ویرایش، بهعنوان مراجع سبک
ارسال میشوند.
راهنماهای خروجی پشتیبانیشده توسط ارائهدهنده مانند quality، outputFormat، و
background در صورت دسترسبودن ارسال میشوند و وقتی ارائهدهندهای از آنها
پشتیبانی نکند بهعنوان نادیدهگرفتهشده گزارش میشوند. پشتیبانی بستهبندیشده از پسزمینهی شفاف
مختص OpenAI است؛ ارائهدهندگان دیگر ممکن است همچنان آلفای PNG را حفظ کنند اگر
بکاند آنها آن را تولید کند.
ارائهدهندگان پشتیبانیشده
| ارائهدهنده | مدل پیشفرض | پشتیبانی از ویرایش | احراز هویت |
|---|---|---|---|
| ComfyUI | workflow |
بله (۱ تصویر، پیکربندیشده با گردشکار) | COMFY_API_KEY یا COMFY_CLOUD_API_KEY برای ابر |
| DeepInfra | black-forest-labs/FLUX-1-schnell |
بله (۱ تصویر) | DEEPINFRA_API_KEY |
| fal | fal-ai/flux/dev |
بله (محدودیتهای وابسته به مدل) | FAL_KEY |
gemini-3.1-flash-image-preview |
بله | GEMINI_API_KEY یا GOOGLE_API_KEY |
|
| LiteLLM | gpt-image-2 |
بله (تا ۵ تصویر ورودی) | LITELLM_API_KEY |
| Microsoft Foundry | <deployment-name> |
بله (فقط مدلهای MAI-Image-2.5) | AZURE_OPENAI_API_KEY یا Entra ID (az login) |
| MiniMax | image-01 |
بله (مرجع سوژه) | MINIMAX_API_KEY یا MiniMax OAuth (minimax-portal) |
| OpenAI | gpt-image-2 |
بله (تا ۴ تصویر) | OPENAI_API_KEY یا OpenAI ChatGPT/Codex OAuth |
| OpenRouter | google/gemini-3.1-flash-image-preview |
بله (تا ۵ تصویر ورودی) | OPENROUTER_API_KEY |
| Vydra | grok-imagine |
خیر | VYDRA_API_KEY |
| xAI | grok-imagine-image |
بله (تا ۵ تصویر) | XAI_API_KEY |
برای بررسی ارائهدهندگان و مدلهای در دسترس در زمان اجرا از action: "list" استفاده کنید:
/tool image_generate action=listبرای بررسی وظیفهی فعال تولید تصویر برای نشست فعلی از action: "status" استفاده کنید:
/tool image_generate action=statusقابلیتهای ارائهدهنده
| قابلیت | ComfyUI | DeepInfra | fal | Microsoft Foundry | MiniMax | OpenAI | Vydra | xAI | |
|---|---|---|---|---|---|---|---|---|---|
| تولید (حداکثر تعداد) | تعریفشده توسط گردشکار | ۴ | ۴ | ۴ | ۱ | ۹ | ۴ | ۱ | ۴ |
| ویرایش / مرجع | ۱ تصویر (گردشکار) | ۱ تصویر | Flux: 1; GPT: 10; Krea style refs: 10; NB2: 14 | تا ۵ تصویر | ۱ تصویر | ۱ تصویر (مرجع سوژه) | تا ۵ تصویر | - | تا ۵ تصویر |
| کنترل اندازه | - | ✓ | ✓ | ✓ | ✓ | - | تا 4K | - | - |
| نسبت تصویر | - | - | ✓ | ✓ | - | ✓ | - | - | ✓ |
| وضوح (1K/2K/4K) | - | - | ✓ | ✓ | - | - | - | - | 1K, 2K |
پارامترهای ابزار
promptstringrequiredدرخواست تولید تصویر. برای action: "generate" الزامی است.
action"generate" | "status" | "list"default: generateبرای بررسی وظیفهی فعال نشست از "status" یا برای بررسی
ارائهدهندگان و مدلهای در دسترس در زمان اجرا از "list" استفاده کنید.
modelstringبازنویسی ارائهدهنده/مدل (مثلاً openai/gpt-image-2). برای پسزمینههای شفاف OpenAI از
openai/gpt-image-1.5 استفاده کنید.
imagestringمسیر یا URL یک تصویر مرجع برای حالت ویرایش.
imagesstring[]چند تصویر مرجع برای حالت ویرایش یا مدلهای مرجع سبک (تا ۱۰ از طریق ابزار مشترک؛ محدودیتهای ویژهی ارائهدهنده همچنان اعمال میشوند).
sizestringراهنمای اندازه: 1024x1024، 1536x1024، 1024x1536، 2048x2048، 3840x2160.
aspectRatiostringنسبت تصویر: 1:1، 2:3، 3:2، 2.35:1، 3:4، 4:3، 4:5،
5:4، 9:16، 16:9، 21:9، 4:1، 1:4، 8:1، 1:8. ارائهدهندگان
زیرمجموعهی ویژهی مدل خود را اعتبارسنجی میکنند.
resolution"1K" | "2K" | "4K"quality"low" | "medium" | "high" | "auto"راهنمای کیفیت وقتی ارائهدهنده از آن پشتیبانی کند.
outputFormat"png" | "jpeg" | "webp"راهنمای قالب خروجی وقتی ارائهدهنده از آن پشتیبانی کند.
background"transparent" | "opaque" | "auto"راهنمای پسزمینه وقتی ارائهدهنده از آن پشتیبانی کند. برای ارائهدهندگان دارای قابلیت شفافیت، از transparent همراه با
outputFormat: "png" یا "webp" استفاده کنید.
countnumbertimeoutMsnumberمهلت اختیاری درخواست ارائهدهنده بر حسب میلیثانیه. وقتی Codex از طریق ابزارهای پویا
image_generate را فراخوانی میکند، این مقدار در هر فراخوانی همچنان پیشفرض پیکربندیشده را بازنویسی میکند
و سقف آن 600000 ms است.
filenamestringopenaiobjectراهنماهای فقط مخصوص OpenAI: background، moderation، outputCompression، و user.
fal.creativity"raw" | "low" | "medium" | "high"کنترل خلاقیت fal Krea 2. مقدار پیشفرض medium است.
پیکربندی
انتخاب مدل
{ agents: { defaults: { imageGenerationModel: { primary: "openai/gpt-image-2", timeoutMs: 180_000, fallbacks: [ "openrouter/google/gemini-3.1-flash-image-preview", "google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev", ], }, }, },}ترتیب انتخاب ارائهدهنده
OpenClaw ارائهدهندگان را به این ترتیب امتحان میکند:
- پارامتر
modelاز فراخوانی ابزار (اگر عامل یکی را مشخص کند). imageGenerationModel.primaryاز پیکربندی.imageGenerationModel.fallbacksبهترتیب.- تشخیص خودکار - فقط پیشفرضهای ارائهدهندهای که پشتوانه احراز هویت دارند:
- ابتدا ارائهدهنده پیشفرض فعلی؛
- سپس بقیه ارائهدهندگان ثبتشده تولید تصویر، بهترتیب شناسه ارائهدهنده.
اگر یک ارائهدهنده شکست بخورد (خطای احراز هویت، محدودیت نرخ، و غیره)، نامزد پیکربندیشده بعدی بهطور خودکار امتحان میشود. اگر همه شکست بخورند، خطا شامل جزئیات هر تلاش خواهد بود.
بازنویسیهای مدل در هر فراخوانی دقیق هستند
بازنویسی model در هر فراخوانی فقط همان ارائهدهنده/مدل را امتحان میکند و
به primary/fallback پیکربندیشده یا ارائهدهندگان شناساییشده خودکار ادامه
نمیدهد.
تشخیص خودکار از احراز هویت آگاه است
پیشفرض یک ارائهدهنده فقط وقتی وارد فهرست نامزدها میشود که OpenClaw بتواند
واقعاً آن ارائهدهنده را احراز هویت کند. برای استفاده فقط از ورودیهای صریح
model، primary و fallbacks مقدار
agents.defaults.mediaGenerationAutoProviderFallback: false را تنظیم کنید.
مهلتهای زمانی
برای backendهای کند تصویر، agents.defaults.imageGenerationModel.timeoutMs را
تنظیم کنید. پارامتر ابزار timeoutMs در هر فراخوانی، پیشفرض پیکربندیشده را
بازنویسی میکند، و پیشفرضهای پیکربندیشده پیشفرضهای ارائهدهندهای را که
نویسنده Plugin تنظیم کرده بازنویسی میکنند. ارائهدهندگان تصویر میزبانیشده
Google و OpenRouter از پیشفرضهای 180 ثانیهای استفاده میکنند؛ تولید تصویر
Microsoft Foundry MAI، xAI و Azure OpenAI از 600 ثانیه استفاده میکند.
فراخوانیهای ابزار پویای Codex از پیشفرض 120 ثانیهای پل image_generate
استفاده میکنند و هنگام پیکربندی همان بودجه مهلت زمانی را رعایت میکنند، با
سقف بیشینه 600000 میلیثانیهای پل ابزار پویای OpenClaw.
بازبینی در زمان اجرا
برای بازبینی ارائهدهندگان ثبتشده فعلی، مدلهای پیشفرض آنها، و راهنمای
متغیرهای محیطی احراز هویت، از action: "list" استفاده کنید.
ویرایش تصویر
OpenAI، OpenRouter، Google، DeepInfra، fal، Microsoft Foundry، MiniMax،
ComfyUI و xAI از ویرایش تصاویر مرجع پشتیبانی میکنند. مدلهای Krea 2 روی fal از
همان فیلدهای image / images بهعنوان مرجع سبک استفاده میکنند، نه ورودی
ویرایش. یک مسیر یا URL تصویر مرجع بدهید:
"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"OpenAI، OpenRouter، Google و xAI از حداکثر 5 تصویر مرجع از طریق پارامتر
images پشتیبانی میکنند. fal برای Flux image-to-image از 1 تصویر مرجع، برای
ویرایشهای GPT Image 2 تا 10 تصویر، برای مرجعهای سبک Krea 2 تا 10 تصویر، و
برای ویرایشهای Nano Banana 2 تا 14 تصویر پشتیبانی میکند. Microsoft Foundry،
MiniMax و ComfyUI از 1 تصویر پشتیبانی میکنند.
بررسیهای عمیق ارائهدهنده
OpenAI gpt-image-2 (و gpt-image-1.5)
تولید تصویر OpenAI بهطور پیشفرض از openai/gpt-image-2 استفاده میکند. اگر
یک پروفایل OAuth برای openai پیکربندی شده باشد، OpenClaw همان پروفایل
OAuth استفادهشده توسط مدلهای گفتوگوی اشتراکی Codex را دوباره استفاده میکند
و درخواست تصویر را از طریق backend پاسخهای Codex میفرستد. URLهای پایه
قدیمی Codex مانند https://chatgpt.com/backend-api برای درخواستهای تصویر به
https://chatgpt.com/backend-api/codex استانداردسازی میشوند. OpenClaw برای
آن درخواست بیصدا به OPENAI_API_KEY fallback نمیکند - برای اجبار مسیریابی
مستقیم OpenAI Images API، models.providers.openai را صراحتاً با یک کلید API،
URL پایه سفارشی، یا endpoint مربوط به Azure پیکربندی کنید.
مدلهای openai/gpt-image-1.5، openai/gpt-image-1 و
openai/gpt-image-1-mini همچنان میتوانند صراحتاً انتخاب شوند. برای خروجی
PNG/WebP با پسزمینه شفاف از gpt-image-1.5 استفاده کنید؛ API فعلی
gpt-image-2 مقدار background: "transparent" را رد میکند.
gpt-image-2 هم از تولید متنبهتصویر و هم از ویرایش تصویر مرجع از طریق
همان ابزار image_generate پشتیبانی میکند. OpenClaw مقادیر prompt،
count، size، quality، outputFormat و تصاویر مرجع را به OpenAI ارسال
میکند. OpenAI مقدار aspectRatio یا resolution را مستقیماً دریافت
نمیکند؛ وقتی ممکن باشد OpenClaw آنها را به یک size پشتیبانیشده نگاشت
میکند، وگرنه ابزار آنها را بهعنوان بازنویسیهای نادیدهگرفتهشده گزارش
میکند.
گزینههای اختصاصی OpenAI زیر شیء openai قرار میگیرند:
{ "quality": "low", "outputFormat": "jpeg", "openai": { "background": "opaque", "moderation": "low", "outputCompression": 60, "user": "end-user-42" }}openai.background مقادیر transparent، opaque یا auto را میپذیرد؛
خروجیهای شفاف به outputFormat با مقدار png یا webp و یک مدل تصویر
OpenAI با قابلیت شفافیت نیاز دارند. OpenClaw درخواستهای پیشفرض
gpt-image-2 با پسزمینه شفاف را به gpt-image-1.5 مسیریابی میکند.
openai.outputCompression روی خروجیهای JPEG/WebP اعمال میشود و برای خروجیهای
PNG نادیده گرفته میشود.
راهنمای سطح بالای background نسبت به ارائهدهنده خنثی است و در حال حاضر
وقتی ارائهدهنده OpenAI انتخاب شود به همان فیلد درخواست background در
OpenAI نگاشت میشود. ارائهدهندگانی که پشتیبانی از پسزمینه را اعلام نمیکنند،
بهجای دریافت پارامتر پشتیبانینشده، آن را در ignoredOverrides برمیگردانند.
برای مسیریابی تولید تصویر OpenAI از طریق یک deployment در Azure OpenAI بهجای
api.openai.com، به
endpointهای Azure OpenAI مراجعه کنید.
مدلهای تصویر Microsoft Foundry MAI
تولید تصویر Microsoft Foundry از نامهای deployment تصویر MAI مستقرشده زیر
پیشوند ارائهدهنده microsoft-foundry/ استفاده میکند. مدل پیشفرض در سطح
ارائهدهنده وجود ندارد، چون MAI API نام deployment شما را در فیلد model
انتظار دارد:
{ agents: { defaults: { imageGenerationModel: { primary: "microsoft-foundry/<deployment-name>", timeoutMs: 600_000, }, }, },}این ارائهدهنده از MAI API مربوط به Microsoft Foundry استفاده میکند، نه OpenAI Images API:
- endpoint تولید:
/mai/v1/images/generations - endpoint ویرایش:
/mai/v1/images/edits - احراز هویت:
AZURE_OPENAI_API_KEY/ کلید API ارائهدهنده، یا Entra ID از طریقaz login - خروجی: یک تصویر PNG
- اندازه: پیشفرض
1024x1024؛ عرض و ارتفاع هرکدام باید دستکم 768 px باشند، و کل پیکسلها باید حداکثر 1,048,576 باشد - ویرایشها: یک تصویر مرجع PNG یا JPEG، که فقط توسط deploymentهای
MAI-Image-2.5-FlashوMAI-Image-2.5پشتیبانی میشود
تولید فقط با prompt میتواند با یک نام deployment سفارشی و فقط با endpoint
پیکربندیشده Foundry استفاده شود. ویرایش با نامهای deployment سفارشی به
metadata راهاندازی/مدل نیاز دارد تا OpenClaw بتواند تأیید کند deployment
توسط MAI-Image-2.5-Flash یا MAI-Image-2.5 پشتیبانی میشود.
مدلهای تصویر فعلی MAI عبارتاند از MAI-Image-2.5-Flash،
MAI-Image-2.5، MAI-Image-2e و MAI-Image-2. برای راهاندازی و رفتار
مدل گفتوگو، Plugin مربوط به Microsoft Foundry
را ببینید.
مدلهای تصویر OpenRouter
تولید تصویر OpenRouter از همان OPENROUTER_API_KEY استفاده میکند و از طریق
API تصویر chat completions مربوط به OpenRouter مسیریابی میشود. مدلهای تصویر
OpenRouter را با پیشوند openrouter/ انتخاب کنید:
{ agents: { defaults: { imageGenerationModel: { primary: "openrouter/google/gemini-3.1-flash-image-preview", }, }, },}OpenClaw مقادیر prompt، count، تصاویر مرجع، و راهنماهای سازگار با Gemini
برای aspectRatio / resolution را به OpenRouter ارسال میکند. میانبرهای
داخلی فعلی مدل تصویر OpenRouter شامل
google/gemini-3.1-flash-image-preview،
google/gemini-3-pro-image-preview و openai/gpt-5.4-image-2 هستند. برای
دیدن آنچه Plugin پیکربندیشده شما در معرض استفاده قرار میدهد، از
action: "list" استفاده کنید.
fal Krea 2
مدلهای Krea 2 روی fal بهجای schema عمومی image_size که Flux استفاده
میکند، از schema بومی Krea در fal استفاده میکنند. OpenClaw موارد زیر را
ارسال میکند:
aspect_ratioبرای راهنماهای نسبت تصویرcreativity، با مقدار پیشفرضmediumimage_style_referencesوقتیimageیاimagesارائه شده باشد
Krea 2 Medium را برای تصویرسازی بیانگر سریعتر و Krea 2 Large را برای ظاهرهای فوتورئال و بافتدار کندتر اما پرجزئیاتتر انتخاب کنید:
{ agents: { defaults: { imageGenerationModel: { primary: "fal/krea/v2/medium/text-to-image", }, }, },}Krea 2 در حال حاضر در هر درخواست یک تصویر برمیگرداند. برای Krea بهتر است از
aspectRatio استفاده کنید؛ OpenClaw مقدار size را به نزدیکترین نسبت تصویر
پشتیبانیشده Krea نگاشت میکند و برای Krea بهجای حذف کردن resolution، آن
را رد میکند. وقتی سطح خلاقیت بومی Krea را میخواهید، از fal.creativity
استفاده کنید:
{ "model": "fal/krea/v2/medium/text-to-image", "prompt": "A cyber zine portrait with risograph texture", "aspectRatio": "9:16", "fal": { "creativity": "high" }}احراز هویت دوگانه MiniMax
تولید تصویر MiniMax از طریق هر دو مسیر احراز هویت MiniMax بستهبندیشده در دسترس است:
minimax/image-01برای راهاندازیهای مبتنی بر کلید APIminimax-portal/image-01برای راهاندازیهای مبتنی بر OAuth
xAI grok-imagine-image
ارائهدهنده xAI بستهبندیشده برای درخواستهای فقط prompt از
/v1/images/generations و وقتی image یا images وجود داشته باشد از
/v1/images/edits استفاده میکند.
- مدلها:
xai/grok-imagine-image،xai/grok-imagine-image-quality - تعداد: تا 4
- مرجعها: یک
imageیا تا پنجimages - نسبتهای تصویر:
1:1،16:9،9:16،4:3،3:4،2:3،3:2 - وضوحها:
1K،2K - خروجیها: بهعنوان پیوستهای تصویر مدیریتشده توسط OpenClaw برگردانده میشوند
OpenClaw عمداً quality، mask، user بومی xAI یا نسبتهای تصویر اضافی
فقطبومی را تا زمانی که این کنترلها در قرارداد مشترک و چندارائهدهندهای
image_generate وجود نداشته باشند، در معرض استفاده قرار نمیدهد.
نمونهها
تولید (منظره 4K)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="A clean editorial poster for OpenClaw image generation" size=3840x2160 count=1تولید (PNG شفاف)
/tool image_generate action=generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparentCLI معادل:
openclaw infer image generate \--model openai/gpt-image-1.5 \--output-format png \--background transparent \--prompt "A simple red circle sticker on a transparent background" \--jsonتولید (کیفیت پایین OpenAI)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Low-cost draft poster for a quiet productivity app" quality=low openai='{"moderation":"low"}'CLI معادل:
openclaw infer image generate \--model openai/gpt-image-2 \--quality low \--openai-moderation low \--prompt "Low-cost draft poster for a quiet productivity app" \--jsonGenerate (two square)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Two visual directions for a calm productivity app icon" size=1024x1024 count=2Edit (one reference)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Keep the subject, replace the background with a bright studio setup" image=/path/to/reference.png size=1024x1536Edit (multiple references)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Combine the character identity from the first image with the color palette from the second" images='["/path/to/character.png","/path/to/palette.jpg"]' size=1536x1024Krea style references
/tool image_generate action=generate model=fal/krea/v2/medium/text-to-image prompt="An expressive editorial portrait using this color palette and print texture" images='["/path/to/palette.png","/path/to/texture.jpg"]' aspectRatio=9:16 fal='{"creativity":"high"}'همان پرچمهای --output-format، --background، --quality و
--openai-moderation در openclaw infer image edit نیز در دسترس هستند؛
--openai-background همچنان بهعنوان نام مستعار اختصاصی OpenAI باقی میماند. ارائهدهندگان همراه
بهجز OpenAI امروز کنترل صریح پسزمینه را اعلام نمیکنند، بنابراین
background: "transparent" برای آنها نادیدهگرفتهشده گزارش میشود.
مرتبط
- نمای کلی ابزارها - همه ابزارهای عامل موجود
- ComfyUI - راهاندازی گردشکار محلی ComfyUI و Comfy Cloud
- fal - راهاندازی ارائهدهنده تصویر و ویدیوی fal
- Google (Gemini) - راهاندازی ارائهدهنده تصویر Gemini
- Plugin Microsoft Foundry - راهاندازی چت Microsoft Foundry و تصویر MAI
- MiniMax - راهاندازی ارائهدهنده تصویر MiniMax
- OpenAI - راهاندازی ارائهدهنده OpenAI Images
- Vydra - راهاندازی تصویر، ویدیو و گفتار Vydra
- xAI - راهاندازی تصویر، ویدیو، جستوجو، اجرای کد و TTS در Grok
- مرجع پیکربندی - پیکربندی
imageGenerationModel - مدلها - پیکربندی مدل و failover