Text-To-Pokemon

打开网站

Official Website

主要功能与特点：基于Stable Diffusion在BLIP标注的宝可梦图像数据集上微调而成，能够根据文本描述生成宝可梦风格的图像。无需复杂的提示词工程即可生成角色。

使用说明与输入参数：

prompt (字符串): 输入提示词，例如“Yoda”。
num_outputs (整数): 输出图像的数量，可选1至4张，默认为1。
num_inference_steps (整数): 去噪步数，范围1到50，默认为25。
guidance_scale (数值): 无分类器指导的缩放比例，范围1到20，默认为7.5。
seed (整数): 随机种子，留空则随机生成。

调用方式：

Node.js / Python API: 安装Replicate客户端库，设置REPLICATE_API_TOKEN环境变量，调用lambdal/text-to-pokemon:ff6cc781634191dd3c49097a615d2fc01b0a8aae31c448e55039a04dcbf36bba运行模型并获取图像URL或写入磁盘。
HTTP API: 使用curl向https://api.replicate.com/v1/predictions发送POST请求。
Cog: 安装Cog后，使用cog predict r8.im/lambdal/text-to-pokemon@sha256:...在本地环境下载并运行模型。
Docker: 使用docker run命令在本地GPU环境运行模型并调用API。

目标用户与核心优势：面向AI艺术爱好者、游戏开发者和宝可梦粉丝。核心优势在于专门的宝可梦风格微调，生成效果高度契合主题，且支持开源本地部署。

收费模式与价格：在Replicate平台上运行，每次运行成本约为0.047美元（约21次运行/1美元）。使用Nvidia T4 GPU硬件，预测通常在4分钟内完成。模型开源，可自行在本地硬件上免费运行。

典型用例：输入“Yoda”生成宝可梦风格的尤达大师图像；输入“Girl with a pearl earring”、“Donald Trump”等生成趣味宝可梦化角色。

模型背景：由Justin Pinkney在Lambda Labs使用2xA6000 GPU在Lambda GPU Cloud上训练约15,000步（约6小时，成本约10美元）。数据集与权重开源在Hugging Face。

访问量: 9.9M

国家: India

计价模式: Free

AI休闲娱乐 Free

评论

相似AI工具推荐

Chatmate AI

访问量 15.92K 计价模式

AyeAyeCaption

访问量 0 计价模式

ChatMe - AI Virtual Friends

访问量 0 计价模式