Text-To-Pokemon
主要功能与特点: 基于Stable Diffusion在BLIP标注的宝可梦图像数据集上微调而成,能够根据文本描述生成宝可梦风格的图像。无需复杂的提示词工程即可生成角色。
使用说明与输入参数:
prompt(字符串): 输入提示词,例如“Yoda”。num_outputs(整数): 输出图像的数量,可选1至4张,默认为1。num_inference_steps(整数): 去噪步数,范围1到50,默认为25。guidance_scale(数值): 无分类器指导的缩放比例,范围1到20,默认为7.5。seed(整数): 随机种子,留空则随机生成。
调用方式:
- Node.js / Python API: 安装Replicate客户端库,设置
REPLICATE_API_TOKEN环境变量,调用lambdal/text-to-pokemon:ff6cc781634191dd3c49097a615d2fc01b0a8aae31c448e55039a04dcbf36bba运行模型并获取图像URL或写入磁盘。 - HTTP API: 使用curl向
https://api.replicate.com/v1/predictions发送POST请求。 - Cog: 安装Cog后,使用
cog predict r8.im/lambdal/text-to-pokemon@sha256:...在本地环境下载并运行模型。 - Docker: 使用
docker run命令在本地GPU环境运行模型并调用API。
目标用户与核心优势: 面向AI艺术爱好者、游戏开发者和宝可梦粉丝。核心优势在于专门的宝可梦风格微调,生成效果高度契合主题,且支持开源本地部署。
收费模式与价格: 在Replicate平台上运行,每次运行成本约为0.047美元(约21次运行/1美元)。使用Nvidia T4 GPU硬件,预测通常在4分钟内完成。模型开源,可自行在本地硬件上免费运行。
典型用例: 输入“Yoda”生成宝可梦风格的尤达大师图像;输入“Girl with a pearl earring”、“Donald Trump”等生成趣味宝可梦化角色。
模型背景: 由Justin Pinkney在Lambda Labs使用2xA6000 GPU在Lambda GPU Cloud上训练约15,000步(约6小时,成本约10美元)。数据集与权重开源在Hugging Face。
访问量:
9.9M
国家:
India
计价模式:
Free
评论