Text-To-Pokemon

主要功能与特点: 基于Stable Diffusion在BLIP标注的宝可梦图像数据集上微调而成,能够根据文本描述生成宝可梦风格的图像。无需复杂的提示词工程即可生成角色。

使用说明与输入参数

  • prompt (字符串): 输入提示词,例如“Yoda”。
  • num_outputs (整数): 输出图像的数量,可选1至4张,默认为1。
  • num_inference_steps (整数): 去噪步数,范围1到50,默认为25。
  • guidance_scale (数值): 无分类器指导的缩放比例,范围1到20,默认为7.5。
  • seed (整数): 随机种子,留空则随机生成。

调用方式

  1. Node.js / Python API: 安装Replicate客户端库,设置REPLICATE_API_TOKEN环境变量,调用lambdal/text-to-pokemon:ff6cc781634191dd3c49097a615d2fc01b0a8aae31c448e55039a04dcbf36bba运行模型并获取图像URL或写入磁盘。
  2. HTTP API: 使用curl向https://api.replicate.com/v1/predictions发送POST请求。
  3. Cog: 安装Cog后,使用cog predict r8.im/lambdal/text-to-pokemon@sha256:...在本地环境下载并运行模型。
  4. Docker: 使用docker run命令在本地GPU环境运行模型并调用API。

目标用户与核心优势: 面向AI艺术爱好者、游戏开发者和宝可梦粉丝。核心优势在于专门的宝可梦风格微调,生成效果高度契合主题,且支持开源本地部署。

收费模式与价格: 在Replicate平台上运行,每次运行成本约为0.047美元(约21次运行/1美元)。使用Nvidia T4 GPU硬件,预测通常在4分钟内完成。模型开源,可自行在本地硬件上免费运行。

典型用例: 输入“Yoda”生成宝可梦风格的尤达大师图像;输入“Girl with a pearl earring”、“Donald Trump”等生成趣味宝可梦化角色。

模型背景: 由Justin Pinkney在Lambda Labs使用2xA6000 GPU在Lambda GPU Cloud上训练约15,000步(约6小时,成本约10美元)。数据集与权重开源在Hugging Face。

访问量: 9.9M
国家: India
计价模式: Free

评论

登录 After Sign In, you can make comments