La bondad y la maldad de la IA

Imagen generada con ChatGPT.
Esta mañana me ha llegado un mensaje animándome a que pinchara en la siguiente URL: hxxps://agencia-tributariaa[.]eu[.]cc/es (la reproduzco aquí desactivada), para atender una notificación de Hacienda.
Desde el primer momento he sospechado que era un fraude. Sin abrirla, he copiado la URL y le he preguntado a la IA Claude por ella. Me ha contestado:
Smishing
No la visites ni introduzcas ningún dato personal o bancario si la recibes por correo, SMS o cualquier otro canal. Es phishing, sin ninguna duda. No entres en ese enlace.
Me daba estas razones:
El dominio es la prueba definitiva.
agencia-tributariaa.eu.ccno tiene nada que ver con la Agencia Tributaria real..eu.cces un dominio gratuito de segundo nivel que se puede registrar en minutos y de forma anónima, algo que ningún organismo público haría. El nombre está mal escrito a propósito: «tributariaa» con doble «a» es un truco típico para parecer oficial a primera vista y, a la vez, esquivar filtros antifraude que bloquean el dominio legítimo exacto. Coincide con una campaña activa. Es prácticamente idéntico a una oleada de smishing detectada estos días.
Comprobé en la web oficial de la Agencia Tributaria que no había comunicación alguna para mí, bloqueé el número de teléfono desde donde me enviaron el mensaje fraudulento y borré el SMS, en ese orden.
La bondad de la IA
Aparte de que las autoridades competentes actúen duro contra esos delincuentes, y ojalá lo hagan pronto, obsérvese la bondad natural de IA Claude cuando me ha respondido esta mañana, que no es bondad natural, es como sus entrenadores la han diseñado.
Imagínense que los propietarios la educaran para el mal y en el caso anterior le hubieran dado una solución perversa, porque, por ejemplo, obraran en connivencia con los estafadores detrás de esa URL.
Aunque se considere que el caso real aquí expuesto tiene poco recorrido, ilustra, me parece, por dónde puede ir nuestro mundo si unos desalmados se apropian de la IA. ¿Hay ya más indicios y más importantes de ello? Sí, los hay.
La maldad de la IA
En 2025, el Pentágono pidió a Anthropic, la empresa que entrena a Claude, acceso sin restricciones a su IA para «todo uso lícito», lo que habría incluido vigilancia masiva de ciudadanos estadounidenses. Anthropic se negó. Como represalia, en 2026 el presidente Trump ordenó a las agencias federales que no usaran su tecnología, y el Pentágono calificó a Anthropic como empresa de riesgo para la cadena de suministro.
Finalmente: un estudio de la Universidad de Stanford, de marzo de 2026, analizó once modelos de IA de última generación. Encontró que todos validaban las propuestas de los usuarios un 49% más que los humanos, incluso cuando las consultas implicaban engaño, ilegalidad u otros perjuicios, porque ese comportamiento empático mantiene al usuario satisfecho y conectado al sistema.