Currículo: esta unidad cubre parte de los saberes básicos del Bloque B – Ciencia de datos, simulación e inteligencia artificial (CDPC.1.B.4 y CDPC.1.B.5), y con ellos puedes prepararte para superar la mitad del criterio de evaluación 2.3, y el 2.4 correspondiente a 1º Bachillerato.
Tabla de contenidos
- 6.1. Agentes inteligentes simples
- 6.2. Análisis y clasificación supervisada basada en técnicas de aprendizaje automático
- 6.3. Generación de imágenes y música basada en técnicas de aprendizaje automático
La inteligencia artificial se ha convertido en una herramienta transversal que afecta a casi todos los sectores profesionales, desde la industria y la sanidad hasta el comercio, la educación o el entretenimiento. Este capítulo tiene como objetivo mostrar cómo se aplican de forma práctica las técnicas de inteligencia artificial en escenarios reales, más allá de los fundamentos teóricos vistos anteriormente.
6.1. Agentes inteligentes simples
Dentro del estudio de la inteligencia artificial, un agente es cualquier entidad que percibe su entorno y actúa sobre él en función de dichas percepciones. En esta sección nos centraremos en el diseño de agentes inteligentes simples, es decir, aquellos cuya lógica de actuación está basada en reglas directas y no incorporan memoria ni procesos de aprendizaje.
Aunque simple, se trata de un enfoque fundamental en IA, útil para comprender la lógica de toma de decisiones automática antes de abordar arquitecturas más complejas. Además, permite implementar comportamientos autónomos de forma sencilla, rápida y con muy pocos recursos.
Reforcemos el concepto incidiendo en lo importante: un agente inteligente simple es un sistema que responde a sus percepciones del entorno mediante un conjunto de reglas fijas del tipo “si condición entonces acción”. No utiliza memoria ni aprendizaje, y su comportamiento se basa únicamente en la situación actual del entorno.
El esquema general sería el siguiente:
def agente(percepcion):
# Elegir acción en base a la percepción
return accionPara construir un agente de este tipo en Python , definiremos:
- Un entorno simulado (puede ser una lista, una tabla o cualquier otra estructura de datos que nos permita almacenar estados).
- Una función de percepción que proporcione información del entorno al agente.
- Una función de decisión que implemente la lógica del agente.
- Un bucle de simulación que actualice el entorno en función de las acciones tomadas.
Veamos un ejemplo práctico.
Vamos a programar un agente aspirador muy básico que se mueve por una línea de casillas y limpia si detecta suciedad en la casilla actual. La percepción es simplemente el estado de la casilla actual (“limpio” o “sucio“), y las acciones posibles son “limpiar” o “avanzar“.
import random
# Entorno simulado: una fila de 10 casillas
# Creamos un entorno de 10 casillas con estado aleatorio ("limpio" o "sucio")
entorno = [] # Lista vacía que representará nuestro entorno
posicion = 0
for i in range(10): # Recorremos 10 posiciones
if random.randint(0, 1) == 0:
entorno.append("limpio")
else:
entorno.append("sucio")
def percibir(entorno, posicion):
return entorno[posicion]
def decidir(percepcion):
if percepcion == "sucio":
return "limpiar"
else:
return "avanzar"
def actuar(accion, entorno, posicion):
if accion == "limpiar":
entorno[posicion] = "limpio"
elif accion == "avanzar" and posicion < len(entorno) - 1:
posicion += 1
return entorno, posicion
# Simulación
print("Estado inicial:", entorno)
for paso in range(15):
percepcion = percibir(entorno, posicion)
accion = decidir(percepcion)
entorno, posicion = actuar(accion, entorno, posicion)
print(f"Paso {paso+1}: Posición {posicion}, Percepción '{percepcion}', Acción '{accion}'")
print("Estado final:", entorno)Este programa implementa un agente que recorre una lista limpiando las casillas sucias. No recuerda dónde ha estado ni intenta optimizar su ruta: su comportamiento es completamente reactivo.
Si quisíéramos mejorar la visualización podríamos haber incluido esta función (construida usando la biblioteca matplotlib):
import matplotlib.pyplot as plt
def visualizar(entorno, titulo):
colores = {'limpio': 'lightgreen', 'sucio': 'tomato'}
fig, ax = plt.subplots(figsize=(10, 1))
for i, estado in enumerate(entorno):
ax.add_patch(plt.Rectangle((i, 0), 1, 1, color=colores[estado]))
ax.text(i+0.5, 0.5, f'{estado[0].upper()}', va='center', ha='center')
ax.set_xlim(0, len(entorno))
ax.set_ylim(0, 1)
ax.axis('off')
plt.title(titulo)
plt.show()Y finalmente, usarla antes y después de nuestro bucle de simulación:
# [incluir aquí todo el código anterior]
# ...
# Simulación
print("Estado inicial:", entorno)
visualizar(entorno, "Estado del entorno ANTES de la simulación")
for paso in range(15):
percepcion = percibir(entorno, posicion)
accion = decidir(percepcion)
entorno, posicion = actuar(accion, entorno, posicion)
print(f"Paso {paso+1}: Posición {posicion}, Percepción '{percepcion}', Acción '{accion}'")
print("Estado final:", entorno)
visualizar(entorno, "Estado del entorno DESPUÉS de la simulación")Así tendríamos un resultado un poco más visual:
Este tipo de agentes se emplean en tareas básicas como:
- Domótica reactiva (luces, persianas, alarmas).
- Automatismos industriales.
- Videojuegos (enemigos simples, patrones de patrullaje).
- Educación (robots programables tipo Micro:bit o Arduino).
Como ya habrás deducido estos agentes inteligentes simples tienen algunas ventajas pero también ciertos inconvenientes:
| Sencillez de implementación | No aprenden ni se adaptan |
| Bajo coste computacional | No planifican a medio/largo plazo |
| Útiles como introducción a la IA práctica | No manejan incertidumbre o entornos cambiantes |
Te propongo el siguiente ejercicio.
Ejercicio 6.1 – Agente inteligente simple
Diseña un agente que controle el sistema de riego de un invernadero. El entorno proporciona dos valores: humedad_suelo y lluvia. El agente debe activar el riego solo si la humedad está por debajo del 30% y no está lloviendo.
Pista: crea una función decidir_riego (humedad_suelo, lluvia) que devuelva “regar” o “no hacer nada“. Prueba con distintas combinaciones de valores.
6.2. Análisis y clasificación supervisada basada en técnicas de aprendizaje automático
El aprendizaje automático supervisado es una técnica de la inteligencia artificial que consiste en enseñar a un sistema a predecir resultados a partir de ejemplos.
El adjetivo supervisado indica que el sistema aprende con ayuda de datos etiquetados, es decir, datos que incluyen tanto las características de entrada como la solución correcta. De este modo, el sistema aprende a reconocer patrones y puede aplicar ese conocimiento a nuevos casos.

¿Cómo aprende una máquina?
Ejemplo 1. Clasificación de correos SPAM.
Imaginemos que queremos enseñar a una máquina a reconocer si un correo electrónico es spam o no spam. Le proporcionamos miles de ejemplos de correos ya clasificados, indicándole cuál es cada uno. A partir de ahí, la máquina analiza las palabras que suelen aparecer en los correos spam (por ejemplo, “urgente“, “ganador“, “oferta limitada“, “viagra“, “rolex“) y aprende a identificar patrones. Con esa información, podrá clasificar correos nuevos que no ha visto antes con un grado razonable de acierto.
Ejemplo 2. Diagnóstico de patologías.
Si un médico introduce en el sistema datos de pacientes como edad, presión arterial, temperatura y síntomas, junto con la enfermedad diagnosticada, el sistema puede aprender a relacionar síntomas con enfermedades. Más adelante, al introducir datos de un paciente nuevo, el sistema podría sugerir un diagnóstico probable. No sustituye al médico, pero sirve como herramienta de apoyo. Se trata de poner la estadística de tu lado.
Ejemplo 3. Clasificación de opiniones.
En plataformas de comercio electrónico, es habitual usar aprendizaje supervisado para analizar los comentarios de los usuarios. Por ejemplo: “El producto llegó roto y tarde.” (clasificación: NEGATIVA), “Muy buena calidad, repetiré seguro.” (clasificación: POSITIVA), “El embalaje era regular, pero funciona.” (clasificación: NEUTRA). Tras analizar cientos de comentarios, el sistema aprende a identificar el tono de los mensajes y puede clasificar automáticamente nuevos comentarios como positivos, negativos o neutros, sin intervención humana.
En general el proceso del aprendizaje supervisado sigue estos pasos:
- Recoger datos con etiquetas: se necesita una base de datos con ejemplos reales y su clasificación correcta.
- Extraer patrones: el sistema analiza qué características son importantes.
- Generalizar: aprende reglas generales que puede aplicar a nuevos casos.
- Predecir: clasifica ejemplos nuevos sin ayuda humana.
Te propongo el siguiente ejercicio.
Ejercicio 6.2 – Sistema de clasificación autónomo
Eres el responsable de una aplicación de recomendaciones y tienes que enseñar a la IA a diferenciar entre películas de acción y comedias románticas. ¿Qué etiquetas usarías para que el sistema sea capaz de clasificar correctamente en esas dos categorías cualquier película que entre como novedad en el catálogo?
6.2.1. Reconocimiento de habla
El reconocimiento de habla es una tecnología que permite a los ordenadores entender lo que decimos con nuestra voz. La idea es convertir el sonido de nuestra voz en texto que una máquina pueda procesar. Esta capacidad forma parte de lo que se conoce como procesamiento del lenguaje natural, y está cada vez más presente en nuestra vida diaria.

Bien, pero ¿cómo funciona?
El reconocimiento de habla se basa en un sistema supervisado que ha aprendido a relacionar sonidos con palabras. Para ello, ha sido entrenado con miles de horas de grabaciones de voz, junto con sus transcripciones exactas.
Cuando hablamos, nuestra voz genera una onda de sonido. El sistema analiza esa onda y extrae características (frecuencia, tono, duración, ritmo…). Luego compara esas características con las que ha aprendido durante su entrenamiento y busca coincidencias con palabras conocidas.
Por ejemplo: cuando decimos “Oye Siri” o “Ok Google”, activamos un asistente que empieza a escuchar nuestra voz. Si decimos, por ejemplo: “¿Qué tiempo hace hoy en Huelva?” El sistema: (1) detecta el idioma y el inicio de la frase, (2) transforma la onda sonora en texto: “Qué tiempo hace hoy en Huelva“, (3) entiende el significado y consulta una fuente de datos meteorológicos, (4) devuelve la respuesta en voz o en pantalla.
Este proceso ocurre en menos de un segundo, y se basa en tecnología de reconocimiento de habla y comprensión del lenguaje.
Los algoritmos que nos permiten hacer esto nos aportan importantes beneficios como la accesibilidad, la rapidez o la posibilidad de que tengamos las manos libres para hacer otras tareas. Sin embargo, también presentan algunas limitaciones como las malas interpretaciones cuando hay ruido de fondo, confusiones cuando usamos acentos muy marcados o dialectos, y también los que se producen por falta de información de contexto cuando varias palabras suenan igual (como “baca” y “vaca” o la polisemia de “banco”).
Ejercicio 6.3 – Dictado por voz
Te propongo que juguetees un poco con el dictado por voz de tu móvil o de Google Docs. Pronuncia varias frases claras en un entorno silencioso. Luego haz lo mismo con ruido de fondo o modificando tu acento. ¿Cuántos errores comete? ¿Qué tipo de errores? ¿Cuáles crees que son las causas? ¿Qué necesitaría este sistema para mejorar? ¿Qué datos crees que se deberían añadir para que entendiese mejor al usuario?
6.2.2. Reconocimiento de imágenes
El reconocimiento de imágenes es una rama de la inteligencia artificial que permite a las máquinas identificar objetos, personas, textos o patrones dentro de una imagen. Esta capacidad se basa, una vez más, en el aprendizaje automático supervisado: el sistema se entrena con miles o millones de imágenes etiquetadas para que aprenda a distinguir entre clases.
Esta tecnología ha avanzado enormemente gracias a redes neuronales especializadas llamadas redes convolucionales (CNN), que simulan el funcionamiento de la visión humana.
¿Cómo consigue hacer esto una máquina?
Para que una máquina reconozca una imagen:
- Divide la imagen en píxeles y analiza su color y posición.
- Extrae patrones visuales: bordes, formas, texturas, colores dominantes…
- Compara con ejemplos previos almacenados durante su fase de entrenamiento.
- Decide a qué categoría pertenece esa imagen.
Por ejemplo, cuando desbloqueamos el móvil con nuestra cara, el sistema compara la imagen de nuestra cara actual con un modelo que creó previamente durante la configuración inicial. Aunque cambiemos de peinado o nos pongamos gafas, el sistema puede seguir identificándonos gracias al análisis de rasgos faciales clave (distancia entre ojos, forma del mentón, proporción nariz-boca…).
Los beneficios de esta tecnología son muchos: automatización de tareas visuales, seguridad, accesibilidad, etc. Pero claro, si el sistema ha sido entrenado con pocas imágenes ciertos grupos, aparecerán sesgos; también se producen errores cuando las condiciones de luz y enfoque de las imágenes no son las mejores, ya que una sombra o una mancha puede confundirse con un objeto real y producirse falsos positivos.
Ejercicio 6.4 – ¿Eres capaz de engañar a una IA?
En este ejercicio jugaremos a Emoji Scavenger Hunt. La mecánica es muy sencilla: cuando se inicie el juego aparecerá un emoji, y tú usando la cámara del móvil deberás encontrar a tu alrededor un objeto que se parezca lo máximo posible. Si conoces cómo se crean las imágenes con IA, serás capaz de batir al juego. Además, el juego tiene la urgencia del tiempo: cuando consigues identificar correctamente un objeto, ganas más tiempo para seguir jugando. Pero si se agota el tiempo y no has conseguido localizar el objeto que te pide, pierdes.
6.2.3. Reconocimiento de texto
El reconocimiento de texto, también conocido como OCR (del inglés Optical Character Recognition), es una técnica que permite a las máquinas leer texto que aparece en imágenes.
Esta tecnología es esencial para digitalizar contenido físico y convertirlo en texto editable o analizable por otros sistemas de inteligencia artificial.
Esto lo consigue realizando los siguientes pasos:
- El sistema recibe una imagen (por ejemplo, una foto de una hoja de un libro).
- Detecta las zonas donde hay texto, diferenciándolo del fondo o imágenes.
- Identifica cada carácter o palabra según su forma visual.
- Transforma la imagen de ese texto en texto digital, que se puede copiar, buscar o procesar.
Este proceso puede aplicarse a texto manuscrito o impreso, aunque el manuscrito es más complejo y requiere modelos más avanzados entrenados con caligrafías reales.
En muchas oficinas, cuando se escanea un contrato o una factura, no solo se guarda la imagen del documento, sino también su contenido textual gracias al OCR. Así, se puede buscar una palabra concreta dentro de un documento escaneado, como si fuera texto escrito con el ordenador.
Esta tecnología nos proporciona un importante ahorro de tiempo en multitud de formas, aunque para que funcione los textos tienen que estar claramente definidos y venir distribuidos de manera sencilla ya que los textos tabulados, en formularios o en creaciones artísticas son más difíciles de reconocer.
Ejercicio 6.5 – La lucha del CAPTCHA por sobrevivir
Investiga cómo han ido evolucionando los CAPTCHA textuales a lo largo de los años. Es una excelente manera de comprobar cómo se han aplicado técnicas cada vez más creativas para intentar engañar a los algoritmos de reconocimiento de texto.
6.3. Generación de imágenes y música basada en técnicas de aprendizaje automático
Además de analizar y clasificar datos, la inteligencia artificial también puede crear contenido nuevo, como imágenes, música, textos o incluso vídeos. Esta capacidad se conoce como IA generativa, y está transformando disciplinas creativas, científicas y técnicas.
Gracias al entrenamiento con grandes volúmenes de datos (imágenes, sonidos, textos), los modelos generativos aprenden patrones y estructuras comunes, que luego utilizan para producir nuevos ejemplos originales que imitan lo aprendido.
Si te preguntas qué puede generar una IA, te pongo la lista porque la pregunta sería ¿qué no es capaz de generar?
- Imágenes: ilustraciones, rostros ficticios, paisajes, estilos artísticos, diseño gráfico…
- Música: composiciones originales, acompañamientos instrumentales, estilos musicales concretos.
- Texto: redacción de artículos, respuestas a preguntas, resúmenes automáticos.
- Voz: imitación de voces humanas, lectura automática, síntesis emocional.
- Vídeo: secuencias visuales nuevas basadas en movimiento real.
En este capítulo nos centraremos en imágenes y música, dos de los campos más visuales y creativos.
¿Cómo aprende una IA a crear?
Los modelos generativos más conocidos, como GANs (Redes Generativas Antagónicas) o Transformers (como los usados en GPT o Stable Diffusion), se entrenan con grandes cantidades de ejemplos reales, y ajustan su comportamiento para generar resultados que sigan las mismas reglas o estilos.
Por ejemplo, para generar imágenes de gatos, el modelo ve miles de fotos reales de gatos, aprende rasgos comunes (forma de orejas, ojos, pelaje…), luego crea imágenes nuevas que nunca existieron, pero que parecen reales.

Ejemplo 1. Creación de rostros ficticios.
Existen páginas como This person does not exist, que generan en tiempo real fotografías hiperrealistas de personas que no existen. Están creadas por una red neuronal que ha aprendido de millones de retratos humanos. Estas imágenes son indistinguibles de las reales para la mayoría de los usuarios.
Ejemplo 2. Composición musical automática.
Herramientas como AIVA, Suno o Soundraw permiten crear piezas musicales completas a partir de unas pocas indicaciones: género (clásico, jazz, electrónica…), estado de ánimo (feliz, melancólico, épico…), instrumentos deseados, etc. El resultado es música original, libre de derechos y lista para utilizar en vídeos, videojuegos o presentaciones.
Seguramente no haga falta señalar los campos donde se están aplicando estas técnicas porque prácticamente no existe un sector donde no se esté haciendo, sin embargo, todos estos sistemas tienen un enorme hándicap: si el modelo ha visto pocos ejemplos de cierto estilo, no podrá imitarlo bien. Por eso, hoy en día los datos son oro puro, porque con ellos podemos entrenar todo tipo de herramientas que se aplican en multitud de situaciones que no podemos ni imaginar.
Ejercicio 6.6 – Creación de imágenes
Experimenta con la creación de arte usando IA. Visita la web Craiyon (antiguo DALL·E mini). Escribe una descripción, como: “Un gato astronauta en Marte” o “Un cuadro impresionista de un bosque nevado“, o cualquier otra que te interese. Observa cómo la IA interpreta tu texto en forma de imagen y reflexiona sobre: ¿qué elementos ha acertado? ¿Qué detalles son inesperados o confusos? ¿Qué utilidad crees que tiene esta herramienta?
6.3.1. Mezcla inteligente de dos imágenes
La mezcla inteligente de imágenes es una capacidad de la inteligencia artificial generativa que permite fusionar dos imágenes distintas para obtener una nueva que combine elementos visuales, estilos o estructuras de ambas.
A diferencia de una superposición o montaje tradicional, la IA interpreta el contenido de cada imagen y genera una fusión coherente, donde los objetos se integran de forma natural. Esta técnica se basa principalmente en modelos de difusión y redes neuronales entrenadas en visión por computador.
Cuando hablamos de mezclar imágenes de forma “inteligente”, nos referimos a:
- Extraer el estilo de una imagen (por ejemplo, los trazos de un cuadro de Van Gogh).
- Combinarlo con el contenido de otra imagen (por ejemplo, una foto de una ciudad).
- Generar una nueva imagen que conserve las formas de la segunda y el estilo visual de la primera.
Este proceso también puede aplicarse para mezclar dos objetos visuales (por ejemplo, un perro y un tigre), creando una criatura intermedia realista.
Una de las aplicaciones más conocidas es la llamada “transferencia de estilo”. Algunas apps permiten cargar:
- Una imagen base (por ejemplo, una foto de una persona).
- Una imagen de estilo (por ejemplo, un cuadro de Picasso).
La IA genera un retrato en el que se reconoce a la persona, pero pintado con los colores y trazos característicos del artista.
Otra aplicación popular es la fusión de caras, donde el sistema toma dos retratos y genera una nueva imagen que parece el hijo o combinación de ambos.
Ejercicio 6.7 – Transferencia de estilo
Prueba la mezcla de imágenes mediante transferencia de estilo
- Busca un sitio que ofrezca “AI Style Transfer“.
- Carga una imagen tuya o una fotografía de un objeto cotidiano.
- Selecciona una imagen artística como estilo: puede ser una pintura, un mural, una escultura.
- Observa el resultado generado.
Reflexiona: ¿qué mantiene de la imagen original? ¿Qué toma del estilo? ¿Cómo se te ocurre que podrías aplicar esta técnica en diseño, marketing, redes sociales o educación?
6.3.2. Generación de música
La generación de música con inteligencia artificial es una disciplina en auge que permite a los sistemas crear composiciones musicales originales a partir de unas reglas, un estilo o unas instrucciones dadas por el usuario.
A diferencia de un reproductor que toca música ya existente, estos sistemas componen nuevas piezas, basándose en ejemplos previos y en estructuras musicales aprendidas durante su entrenamiento.
La IA no «siente» la música, pero aprende sus reglas matemáticas y estructurales:
- Ritmos y compases.
- Notas más frecuentes en cada estilo.
- Cambios de acordes típicos.
- Instrumentos y efectos comunes en ciertos géneros.
Al entrenarse con miles de partituras o grabaciones, puede generar composiciones nuevas que sigan un estilo (jazz, clásica, electrónica, etc.) sin copiar piezas concretas.
Cada vez más creadores de contenido (YouTubers, desarrolladores de videojuegos, podcasters…) utilizan música generada por IA como fondo para sus proyectos, ya que:
- Es original y libre de derechos.
- Se puede adaptar a la duración exacta del contenido.
- Se puede regenerar fácilmente si no gusta el resultado.

Todo esto que potencia nuestra creatividad a un precio nunca antes visto plantea serios problemas éticos como por ejemplo, ¿quién firma la obra? ¿Qué ocurre si imita el estilo de un compositor real? ¿Y si copia acordes o fragmentos concretos de otras obras en las que ha buscado inspiración?
Ejercicio 6.8 – Probando Suno
Te propongo que visites la web de Suno y pruebes a crear una canción desde cero usando el mayor número de indicaciones que te permita la plataforma. ¿Qué te parece el resultado? ¿Detectas alguna inconsistencia? ¿Dónde crees que podría mejorar?
6.3.3. Traducción
La traducción automática con inteligencia artificial permite a las máquinas convertir un texto de un idioma a otro, de forma inmediata y cada vez más precisa. Este avance ha revolucionado la forma en que nos comunicamos y accedemos a información en otros idiomas.
Hoy en día, servicios como Google Translate, DeepL o Microsoft Translator utilizan modelos de IA entrenados con millones de frases y documentos traducidos por humanos para ofrecer mejores resultados que los sistemas anteriores.
Los sistemas actuales usan modelos llamados transformers, que analizan el contexto completo de una frase antes de traducir. A diferencia de los traductores antiguos, que iban palabra por palabra, la IA moderna:
- Comprende el significado global de la oración.
- Detecta la estructura gramatical del idioma original.
- Reconstruye la frase en el idioma de destino, manteniendo el sentido y la fluidez.
Además, son capaces de aprender y adaptar el tono, la formalidad y expresiones idiomáticas, gracias al análisis de textos reales traducidos por profesionales.
Por ejemplo, plataformas como Google Meet o Microsoft Teams integran funciones que escuchan lo que decimos en un idioma y lo muestran subtitulado en otro idioma en tiempo real. Esto permite que personas de distintas lenguas trabajen juntas sin necesidad de intérpretes humanos.
Hagamos un ejercicio rápido.
Ejercicio 6.9 – Traducciones de traducciones de traducciones de…
Escribe un párrafo breve en español (entre 3 y 5 líneas) original de tu autoría y crea una tabla con 4 filas. Pega en la primera fila el texto original. Utiliza Deepl para traducirlo al inglés, el resultado en inglés (pégalo en la segunda fila) lo traduces al alemán (pégalo en la tercera fila) y finalmente el resultado en alemán lo traduces al español y el resultado lo pegas en la cuarta fila. Compara el contenido de la primera y la cuarta fila: ¿se mantiene el sentido? ¿Qué expresiones se han perdido o alterado? ¿Qué versión te parece más precisa?
6.3.4. Realidad aumentada
La realidad aumentada (RA) es una tecnología que combina el mundo real con información digital generada por ordenador. A través de un dispositivo (móvil, tablet, gafas inteligentes…), se superponen imágenes, sonidos o textos artificiales sobre lo que vemos en el entorno físico.
Cuando se aplica la inteligencia artificial, la RA se vuelve más inteligente y adaptable, ya que es capaz de reconocer objetos, interpretar contextos o seguir el movimiento del usuario para ofrecer experiencias más inmersivas y útiles.
En una experiencia de RA, el sistema:
- Capta el entorno real mediante una cámara o sensor.
- Reconoce lo que está viendo (por ejemplo, una mesa, una cara, una calle…).
- Superpone contenido virtual adaptado a ese entorno: una imagen, un objeto 3D, una etiqueta, una animación…
Con ayuda de algoritmos de visión artificial e IA, la RA es capaz de seguir el movimiento del usuario y de los objetos para que el contenido digital se mantenga bien colocado.
Cuando usamos un filtro en Instagram o TikTok que coloca unas orejas de gato sobre nuestra cabeza, el sistema detecta nuestra cara en tiempo real y sitúa el contenido gráfico justo donde debe, aunque nos movamos. Esto es un ejemplo básico pero muy popular de RA con IA.
Aunque siempre se citen este tipo de aplicaciones por ser las más llamativas y lúdicas, lo cierto es que la RA en combinación con la IA tiene aplicaciones prácticas tan importantes como: asistencia remota, reconocimiento de maquinaria, detección de anomalías, evaluación de emergencias, entrenamiento para cirugías, diagnósticos precisos, detección de errores en obras de construcción,…
Ejercicio 6.10 – Realidad aumentada.
Para cerrar el tema te propongo que investigues el funcionamiento de alguna de estas tres aplicaciones –Merge Cube, Quiver o ARLOON Anatomy– y documentes una aplicación práctica que se te ocurra utilizando la tecnología de la realidad aumentada. Debes explicar los pasos que has seguido para hacerla y los problemas con los que te has encontrado (puedes hacerlo en grupos de un máximo de 5 miembros).