Cómo escribir prompts de imagen con IA que funcionan a la primera (sin ser diseñador)
En esta newsletter ya hemos publicado varios artículos sobre como crear buenas imágenes con IA, pero vamos hoy con otro artículo práctico, que os suelen gustar mucho. De hecho, te comparto dos de los más leídos:
Cómo crear imágenes con IA: 8 componentes de un prompt visual.
De la servilleta a la pantalla: cómo crear storyboards animados con Nano Banana y Midjourney.
Imagina que llevas diez minutos intentando que la IA te genere una imagen para tu próxima campaña. Has escrito un párrafo entero describiendo lo que quieres. El resultado: algo que no se parece ni remotamente a lo que tenías en la cabeza. Añades más palabras. Peor aún. Suena familiar, ¿verdad?
La generación de imágenes con IA (Midjourney, DALL-E, Ideogram, Flux, o el propio generador de ChatGPT) se ha convertido en una herramienta cotidiana para los profesiones, especialmente para los equipos de marketing y comunicación. Pero hay una brecha enorme entre saber que existe y saber utilizarla con criterio profesional. Y esa brecha, en la mayoría de los casos, no es tecnológica: es de lenguaje.
Escribir buenos prompts de imagen es una habilidad estratégica, y se basa en tres principios que cualquier profesional puede dominar.
Principio 1. Menos es más (de verdad)
El error más común que veo profesionales y equipos de Marketing, Diseño, Comunicación, etc., es pensar que cuantas más palabras metas en el prompt, más control tendrás sobre el resultado. Es exactamente al revés.
Los modelos de generación de imágenes no funcionan como un briefing creativo para una agencia. No necesitan contexto narrativo, conectores ni adjetivos redundantes. Necesitan instrucciones visuales concretas.
Ejemplo real. Un prompt como este:
“Crea una imagen realista de alta resolución 8K UHD de una serpiente de color claro enrollada sobre su cuerpo, grande, gorda y larga, sobre un árbol, con hojas alrededor, la serpiente tiene la cabeza hacia abajo, imagen de día”
Produce prácticamente el mismo resultado que este:
“Foto, serpiente de color claro enrollada sobre su cuerpo, larga, sobre un árbol, hojas alrededor, cabeza hacia abajo”
¿La diferencia? La mitad de palabras. El mismo resultado. Y menos ruido para que el modelo interprete lo que realmente importa.
La regla es simple: si una palabra no cambia lo que verías en la imagen, sobra.
Principio 2. No le digas lo que ya sabe
Hay términos que los profesionales de marketing tienden a incluir por inercia y que, en el contexto de la generación de imágenes, son redundantes.
No necesitas escribir “realista” ni “profesional”. Cuando describes una foto, el modelo ya entiende que buscas fotorrealismo. Solo especifica estos términos si apuntas a un estilo muy concreto: fotografía de moda, fotografía de naturaleza, retrato editorial.
No necesitas mencionar la resolución. Términos como “8K”, “UHD”, “high-resolution” o “render” no mejoran la calidad del resultado. El modelo genera a su máxima capacidad por defecto.
No uses “en el estilo de”. En lugar de escribir “en el estilo de una acuarela”, simplemente di “acuarela”. En lugar de “en el estilo de un cómic”, di “cómic”. Directo, limpio, eficaz.
Ejemplo real. Este prompt:
“Renderiza una imagen de alta resolución de un saltamontes en una pose natural, enfatizando su coloración vibrante y detalles intrincados, sin texto ni logos, adecuado para integración en fondo blanco”
Funciona igual de bien así:
“Un saltamontes en pose natural, coloración vibrante y detalles intrincados, sobre fondo blanco”.
Tres líneas en lugar de tres párrafos. Mismo nivel de detalle en el resultado.
Principio 3. Evita las instrucciones contradictorias
Este es el error más sutil y el que más frustra, porque no siempre es evidente. Ocurre cuando mezclas direcciones visuales que se anulan entre sí.
Algunas combinaciones que generan conflicto:
“Colores brillantes” + “tonos pastel” (son opuestos)
“Vista aérea” + “primer plano” (perspectivas incompatibles)
“Hiperdetallado” + “minimalista” (intenciones contradictorias)
También conviene evitar términos de tendencia demasiado nicho: cottagecore, trashcore, darkacademia y similares. Los modelos están limitados a lo que existe en sus datos de entrenamiento, y estas estéticas hiperespecíficas rara vez se traducen como esperas. Mejor describe los elementos visuales concretos que asocias a ese estilo: colores cálidos, texturas de madera, luz natural suave. Eso sí lo entienden.
La anatomía de un buen prompt visual
Después de trabajar con decenas de proyectos, he llegado a una estructura que funciona de forma consistente. No es una fórmula rígida, pero sí un mapa mental útil:
1. Tipo de imagen: foto, ilustración, acuarela, cartel, diseño editorial...
2. Sujeto principal: qué aparece en la imagen y en qué posición o actitud.
3. Contexto visual: dónde ocurre, qué hay alrededor, qué atmósfera tiene.
4. Estilo o referencias: si necesitas un tratamiento visual específico (surrealismo, editorial de moda, flat design...)
5. Parámetros técnicos: relación de aspecto, nivel de estilización (si la herramienta lo permite)
Y nada más. Si tu prompt no cabe en un tuit, probablemente sobran palabras.
Un ejemplo que lo resume todo
Imagina que necesitas una imagen para una campaña con estética surrealista. El prompt original podría ser algo así:
“Escena épica, el arte presenta a una mujer de moda sentada en una silla de madera, flotando en el cielo unida a varios globos cromados de colores. Los globos incluyen diferentes colores como rojo, azul, verde, blanco, y un notable globo amarillo con una cara sonriente. La persona se ve desde atrás, llevando sombrero y traje, y la escena está ambientada contra un cielo azul claro con unas pocas nubes, el arte encaja en el género del surrealismo, caracterizado por su escenario onírico donde una persona flota en el cielo con globos. El uso de objetos cotidianos en contextos extraordinarios es un sello del surrealismo, cartel de película, extremadamente detallado, hiper resolución, iluminación cinematográfica volumétrica”.
¿La versión que funciona igual de bien?
“Escena épica, mujer elegante sentada en silla de madera, flotando en el cielo con globos de colores, vista desde atrás, sombrero y traje, cielo azul con nubes, surrealismo, atmósfera onírica, cartel de película”.
Menos de la mitad de palabras. El mismo impacto visual. Y una fracción del tiempo invertido.
Lo que la IA de imagen todavía no hace bien
Para que no pierdas tiempo intentando lo imposible, estas son las áreas donde la generación de imágenes con IA aún tiene limitaciones reales:
Paneles dentro de una página de cómic (con narrativa secuencial coherente)
Páginas completas de novela gráfica
Grupos grandes de personas con disposiciones muy precisas
Múltiples poses distintas de un mismo personaje en una sola imagen
Texto legible y preciso dentro de las imágenes (ha mejorado mucho, pero sigue siendo inconsistente)
Saber dónde están los límites es tan importante como saber escribir el prompt. Te ahorra tiempo y expectativas mal calibradas.
Acción: tu próximo prompt en 30 segundos
La próxima vez que necesites generar una imagen con IA, antes de escribir, hazte estas tres preguntas:
¿Qué veo? Describe solo lo que aparecería visualmente. Sin contexto narrativo, sin explicaciones de por qué.
¿Sobra algo? Lee tu prompt y elimina toda palabra que no cambie lo que verías en la imagen final.
¿Hay contradicciones? Revisa que no estés pidiendo dos cosas visuales opuestas al mismo tiempo.
Con esas tres preguntas y los principios de este artículo, notarás una diferencia inmediata en tus resultados. Y lo más importante: dejarás de perder tiempo iterando sobre prompts que nunca iban a funcionar.
Menos palabras. Más claridad. Mejores imágenes. Así funciona.









