viernes, 17 de enero de 2025

Inteligencia artificial, educación y trabajo: ¿cómo prepararnos?

Por Fernando Schapachnik, investigador, profesor asociado de la UBA y director ejecutivo de la Fundación Dr. Manuel Sadosky. (Tomado de Enfoque educación) 

¿Cuáles son los desafíos, los riesgos y oportunidades que trae la inteligencia artificial al mundo de la educación y el trabajo y qué tanto deben preocuparnos? Para ser honesto, no me preocupa que “nos reemplacen las máquinas”, dicho de manera tan tajante, pero sí que el creciente avance de la inteligencia artificial (IA) genere mayor desigualdad en el mundo del trabajo, y más concretamente, que estemos errando en lo que creemos que son las respuestas de política pública necesarias para enfrentar este nuevo desafío.

¿Qué va a pasar en el mundo del trabajo con la IA?

Hay predicciones de todo tipo sobre qué va a pasar en el mundo del trabajo con el impacto de la inteligencia artificial, y por esto es difícil tener una predicción única y certera. Sin embargo, creo que podemos hacernos alguna idea de lo que va a pasar en América Latina y el Caribe.

Lo primero que hay que entender es que aunque el despliegue de soluciones de inteligencia artificial parece estar avanzando mucho más lentamente que lo que se pensó cuando irrumpió ChatGPT en escena, en noviembre de 2022, sí va a haber un impacto en el mundo del empleo.

Un estudio de la Organización Internacional del Trabajo de 2023 tomó bases de datos estandarizadas que descomponen cada empleo en tareas, y analizó cuáles de estas podrían ser llevadas a cabo por la inteligencia artificial generativa. En base a eso, identificó 3 grupos de puestos de trabajo que podrían verse afectados.

  1. Por un lado, los empleos donde la mayor parte de las tareas eran automatizables y que considera en alto riesgo de automatización total. Se trata de “solo” un 2,3% de los empleos mundiales, pero que significan cerca de 75 millones de puestos de trabajo.
  2. El segundo grupo son los empleos catalogados como complementables, en los que se espera un aumento de la productividad de quienes los desempeñen dado que la IA generativa podrá automatizar algunas de sus tareas, pero no la mayoría. Estos son un 13% de los empleos, que equivalen a unos 427 millones de empleos.
  3. Finalmente, están los empleos a los que el reporte llamó la gran incógnita, pues podrían caer en cualquiera de los otros dos grupos, dependiendo de características que es difícil analizar en general, y de las decisiones de política pública. Estos son un 9% y equivalen a unos 281 millones de empleos.

Esto nos da una base de 356 millones de empleos en riesgo por la automatización y el uso de la IA, a nivel global. Y a la hora de analizar la particularidad de algunas regiones como América Latina y el Caribe, me parece importante poner la lupa también sobre otro punto: la complementación.

En economías débiles, con muchas dificultades como las de nuestra región, cuesta pensar que el incremento de la productividad de la IA no se traduzca en algún nivel de redundancia de puestos de trabajo. Dicho en términos simples, si mis compañeros y yo nos volvemos el doble de productivos gracias a que una serie de herramientas nos ayudan a hacer nuestro trabajo más rápido, ¿cuánto tienen que aumentar las ventas de nuestra empresa para que no se considere que alguno de nosotros ya no es necesario?

El análisis económico clásico suele complementar este panorama de destrucción de puestos de trabajo con la creación de otros nuevos. Ahora bien, la pregunta es ¿qué puestos se crearán, y dónde?

Si el aumento de la productividad y la innovación tecnológica llevasen a la creación de puestos de trabajo nuevos, estos necesariamente deberían caer entre los no automatizables. Por ende, podrían requerir mayor complejidad intelectual o tratarse más bien de empleos manuales, por fuera del alcance de la automatización, al menos ahora. Y es aquí donde se presentan importantes desafíos para la región.

Por un lado, porque el trabajo manual tiende a ser de baja calificación y de baja remuneración, y por otro, porque para que un ciudadano latinoamericano pueda acceder a un empleo de alta complejidad deben darse, al menos, dos condiciones

  1. La primera es que su firma empleadora radique ese puesto de trabajo en la región, y no en sus casas matrices en los países centrales. Es todavía una cuenta pendiente para nuestro continente que los centros de diseño, las oficinas centrales, los puestos directivos, se radiquen en el mismo territorio que las fábricas. Es muy común todavía la firma transnacional con laboratorio de innovación en Europa y oficinas en Miami desde las que planifica y opera toda sus operaciones en la región.
  1. La segunda condición es la necesidad de que ese ciudadano tenga las cualidades y calificaciones necesarias para ese puesto de trabajo de alta complejidad. Esto último no podemos darlo por sentado: en la región, tres de cada cuatro estudiantes no alcanzan las competencias mínimas en matemáticas (en comparación con un 31% de la OCDE), 55% no cuenta con habilidades básicas de lectura y 57%, de ciencias y hay una alta deserción escolar, como lo muestra el más reciente informe del BID sobre el estado de la educación. En la población de 19 a 23 años, sólo el 32% asiste a la educación superior, según un estudio reciente de la OEI.

Incluso en las economías desarrolladas hay motivos para preocuparse: la evidencia histórica, si bien no da cuenta de desempleo por automatización, sí refiere un aumento de la desigualdad:

Un estudio del Premio Nóbel de economía Daron Acemoglu y Pascual Restrepo documenta que entre el 50 y el 70% del cambio de la estructura salarial norteamericana de las últimas cuatro décadas se explica por la automatización, y que este cambio ha llevado, desde la década de 1990 hasta la actualidad, a una separación entre el nivel de ingresos de la población con secundario completo vs la que obtuvo mayor nivel educativo:

“En particular, la automatización redujo los salarios relativos, y en algunos casos reales, de los trabajadores que se especializan en tareas rutinarias en industrias que experimentan una rápida automatización (como aquellos que trabajan en trabajos de “cuello azul” en industrias manufactureras que introdujeron maquinaria de control numérico y robots industriales), o aquellos en tareas administrativas en industrias que introdujeron la automatización basada en software). En contraste, los grupos de trabajadores que no fueron desplazados de sus tareas, como aquellos con un título de posgrado o mujeres con un título universitario, disfrutaron de ganancias salariales.”

Resumiendo, si bien sería exagerado decir que los humanos seremos reemplazados por robots en nuestro empleo, sí hay motivos para preocuparse por el aumento de la desigualdad particularmente en nuestra región.

La solución está en la capacitación, ¿verdad?

La respuesta de política pública más frecuentemente citada en todo ámbito donde se plantea la desaparición de ciertos puestos de trabajo como consecuencia del avance de la IA, puede resumirse en dos palabras: upskilling y reskilling. Mejorar la capacitación, cambiarla por otra. En castellano lo diríamos de manera menos pomposa: capacitación laboral para adultos.

Expresarlo de esa forma nos permite preguntarnos si sabemos algo sobre cuán efectivas pueden ser esas políticas. Y la respuesta es que sí, sí sabemos. Existe una extensa bibliografía sobre el análisis de políticas activas para el mercado de trabajo (ALMP, por sus siglas en inglés), que busca analizar este tipo de intervenciones de manera rigurosa. La pregunta de investigación es cuántas personas de las que tomaron el curso encuentran luego trabajo, comparado contra otras de características similares, que no participaron de esa formación. Esto permite analizar los efectos del curso propiamente dicho, y separar la influencia de otros factores como la demanda general de empleo de la economía en esa región y en ese momento. Este tipo de estudios se denomina randomized controlled trials (prueba controlada aleatorizada, RCT por sus siglás en inglés) y son la herramienta más fiable para entender el nivel de impacto de estas intervenciones en el mundo del trabajo. Se obtiene un porcentaje, que representa cuántas personas, de cada 100, conseguirán empleo por haber participado de la formación, y no lo hubiesen conseguido sin esa misma formación.

Los resultados son desalentadores. Un estudio de 2017 de David McKenzie sobre países en vías de desarrollo encontró que de 9 políticas de capacitación analizadas, sólo 3 pudieron demostrar mejoras en la empleabilidad de sus beneficiarios, que en promedio rondaban el 2,3%. Es decir, de cada 100 personas capacitadas, menos de 3 consiguieron empleo.

Estos resultados aparecen consistentemente en la bibliografía especializada. A modo de ejemplo, podemos citar un estudio del año 2016 desarrollado por la OIT y enfocado en América Latina y el Caribe, que analiza 207 RCTs de intervenciones destinadas a la empleabilidad de las cuales 19 se dieron en la región y salvo una, se trataron de capacitación, mayormente sobre jóvenes, y otro estudio, esta vez del año 2019, que analiza 102 RCTs de intervenciones destinadas a la empleabilidad. El primero encuentra que los impactos positivos van entre 5% y 20% (en particular, entre los jóvenes), y el segundo que la capacitación tuvo un impacto medio de 7,7%.

Dicho de otra manera, la evidencia indica que en el mejor de los casos, de cada 100 adultos que reciban capacitación para el empleo, sólo 20 conseguirán trabajo, y probablemente incluso menos.

La capacitación laboral para adultos, el reskilling y el upskilling, no pueden seguir siendo nuestra única respuesta de política pública ante el avance de la inteligencia artificial sobre los puestos de trabajo.

¿Y entonces cuál es la respuesta? ¿Qué es lo que realmente debemos hacer?

Este texto busca abrir el debate que la desmedida esperanza en la capacitación parece haber clausurado. No tengo, lamentablemente, respuestas categóricas para el corto plazo, para la emergencia. Ofrezco en cambio, algunas ideas en las que creo profundamente, pero requieren periodos más prolongados para fructificar.

La primera es que se vuelve más urgente que nunca procurar que todos y todas en América Latina y el Caribe tengan la posibilidad de acceder a educación superior de calidad. Ése será el requisito de muchos, tal vez de la mayoría, de los puestos de trabajo bien remunerados que no se automaticen. Algunos requerirán acreditaciones formales (títulos en ingeniería, medicina, etc.) y otros no, pero tendrán una demanda cognitiva compatible con la educación superior, justamente por haber sido los puestos que escaparon a la automatización por IA.

Hoy más que nunca se vuelve central que la escuela brinde los aprendizajes básicos a toda la población, pero que también desarrolle la capacidad de análisis y de razonamiento crítico (los peldaños superiores de la taxonomía de Bloom). Se trata de poder abordar la complejidad. La honestidad intelectual exige equiparar la demanda con el reconocimiento: no puedo dejar de señalar la contradicción entre demandarle más a la escuela y no aumentar sus recursos, entre demandarle más al cuerpo docente, y no jerarquizar su profesión poniendo como componente central mejores salarios.

El razonamiento crítico tarda en madurar. Desarrollarlo es una tarea continua, que requiere de todo el tiempo escolar que podamos dedicarle. Es un error pensar que educar para el trabajo consiste en utilizar ese valioso y escaso tiempo escolar en enseñar coyunturas que mutarán a toda velocidad, que se basarán en modas, en costumbres temporales, en estadíos tecnológicos lábiles. Si se puede aprender con un tutorial, no es un contenido educativo.

Educar para el trabajo, hoy más que nunca, consiste en generar ciudadanos y ciudadanas con capacidad de adaptarse gracias a una escolaridad que les dé los ladrillos de la cognición, los saberes básicos a partir de los que se estructura el resto del edificio cognitivo. Es garantizar que puedan tomar decisiones complejas, aquellas que las máquinas no pueden lograr. Y eso requiere del pensamiento crítico.

Si tuviera que resumir de qué se trata el pensamiento crítico, le pediría a la escuela que nos forme con una mezcla de escepticismo y disconformidad. Tenemos que ser escépticos para poder analizar lo que se nos propone, para no sumarnos a las modas sólo porque son novedosas, y no ser conformistas, para evitar quedarnos siempre en el mismo lugar, para empujar hacia adelante, para no aceptar las cosas como si fueran, sólo porque están. El avance de la inteligencia artificial sobre el mundo del trabajo hace que la vieja necesidad de una escuela que nos forme para pensar, sea todavía más urgente.

Para conocer qué piensan sobre inteligencia artificial y educación nuestros especialistas del BID, puedes escuchar esta presentación en el último evento organizado por CEIBAL en Uruguay, leer este otro blog o acceder a este video.


Tomado de Enfoque educación, blog del BID

jueves, 16 de enero de 2025

Un nuevo enfoque de la ética de la investigación: utilizar el diálogo guiado para fortalecer las comunidades de investigación

 Por Universo Abierto.


Henriikka Mustajoki y Arto Mustajoki, A New Approach to Research Ethics: Using Guided Dialogue to Strengthen Research Communities (London: Routledge, 2017), https://doi.org/10.4324/9781315545318.

A New Approach to Research Ethics es una guía clara, práctica y útil sobre los problemas éticos a los que se enfrentan los investigadores hoy en día. Examinando las teorías de la toma de decisiones éticas y aplicándolas a diversas situaciones dentro de una carrera e proceso de investigación, este texto ofrece una perspectiva más amplia sobre cómo la ética puede ser una fuerza positiva para fortalecer la comunidad investigadora.

Basado en una sólida selección de estudios de caso desafiantes, este texto ofrece un nuevo enfoque para abordar los problemas éticos y proporciona al lector:

  • Una visión más amplia sobre la ética en la investigación práctica, abarcando tanto las diferentes etapas de las carreras investigadoras como diversas tareas dentro de esa carrera, incluyendo la supervisión y las evaluaciones de investigación.
  • Reflexiones sobre cuestiones como la creciente globalización, la ciencia abierta y la competencia intensificada.
  • Una mayor comprensión de la investigación en un mundo de nuevas tecnologías.
  • Una extensión de la ética en la investigación hacia un enfoque multidisciplinario e interdisciplinario.
  • Una introducción a un método de «diálogo guiado», que ayuda a identificar y abordar los problemas éticos tanto a nivel individual como dentro de la comunidad investigadora.

Un nuevo enfoque de la ética en la investigación permite la autorreflexión y ofrece orientación para el desarrollo profesional en un área cada vez más competitiva. Lleno de valiosas recomendaciones para el investigador y el tomador de decisiones éticas, este texto es esencial para estudiantes de posgrado, académicos senior y desarrolladores de cursos de formación sobre ética para investigadores.

Tomado de Universo Abierto

miércoles, 15 de enero de 2025

Explorar y conocer la IA ayuda a cambiar la perspectiva (conversación con Belén Correa directora de Turnitin LATAM)

 Por Karina Fuentes tomado de EDUNEWS

Contenido patrocinado por Turnitin

Si bien las tecnologías basadas en inteligencia artificial (IA) se han estado utilizando desde hace décadas en distintas industrias, lo cierto es que, desde el 30 de noviembre de 2022, la IA ha estado más en boga que nunca. ¿Por qué esa fecha en particular? Porque fue ese día que la compañía OpenAI lanzó al mundo ChatGPT provocando revuelo a nivel mundial. Fue tal el furor en los primeros meses desde su lanzamiento, que el acceso gratuito a esta herramienta se vio tan suturado que, en ocasiones, había lista de espera para poder utilizarla.

Desde entonces, muchas cosas han cambiado. “¿En qué puedo ayudarte?”, es el mensaje con el que te recibe ChatGPT (ahora en su cuarta versión, ChatGPT-4) ¿Necesitas ideas? ¿Crear una imagen? ¿Resumir un texto? ¿Escribir un texto o un código? ¿Necesitas respuestas para ese examen? La verdad es que utilizar esta herramienta es sumamente sencillo, solo es cuestión de preguntar, pedir o “charlar” con este chatbot para obtener respuestas en cuestión de segundos.

Uno de los sectores que más se ha visto afectado por la irrupción de ChatGPT y otros chatbots impulsados por IA generativa, ha sido el sector académico. Si bien el plagio ha sido desde siempre una de las principales preocupaciones de docentes y directivos académicos, hoy en día podríamos decir que “hacer trampa” es más fácil que nunca, con la ayuda de estas herramientas que hoy en día el estudiantado tiene al alcance de la mano.

En los últimos dos años la conversación alrededor de la integridad académica ha sido una constante en instituciones educativas de todos los niveles. Una preocupación que ha provocado reuniones extraordinarias, revisiones de lineamientos y códigos de ética académica, la creación de comités especializados, e incluso, ha robado el sueño a muchas personas que trabajan en el ámbito académico.

¿Cómo podemos asegurar la integridad académica en la era de la IA?

En el Observatorio también nos hemos hecho esta pregunta y para intentar responderla, recurrimos a una de las compañías expertas por excelencia en soluciones para la integridad académica: Turnitin. Y para ello, conversamos con Belén Correa, directora de Turnitin LATAM y egresada de EGADE Business School del Tecnológico de Monterrey.

Belén Correa, directora de Turnitin LATAM.

Hace más de 25 años, cuando nació Turnitin, la integridad académica se veía muy distinta a como se ve hoy en día. “La preocupación principal era el internet, el copy-paste”, señaló Belén Correa. Aunque el plagio siempre ha sido una preocupación en la comunidad académica, hoy más que nunca este es uno de los principales retos de las instituciones educativas. Si bien hace un par de décadas sitios web como “El rincón de vago” y la propia creación de la Wikipedia hacían más sencillo el famoso copy-paste, hoy las necesidades son otras.

“Estamos respondiendo a cómo evolucionan esas necesidades”, dijo la directora de Turnitin LATAM. Desde el 2020, su equipo de ingeniería dedicado a la IA, han estado trabajando en detectar patrones de escritura y eso les permitió rápidamente responder a lo que se disparó en noviembre de 2022 con el lanzamiento de ChatGPT.

«Es más fácil hoy garantizar la integridad académica que hace 20 años»

Tan solo cuatro meses después, en marzo de 2023, Turnitin lanzó el detector de escritura con IA para textos en inglés inicialmente, ahora disponible también en español, el cual ha venido evolucionando a la par del ritmo de las tecnologías basadas en IA. “Ese detector no es el mismo que lanzamos hace año y medio”, señaló Correa. “Hemos estado evolucionando y respondiendo a las necesidades de los educadores”.

Sin embargo, el ritmo al que avanzan las tecnologías es cada vez más rápido y la comunidad educativa no siempre puede seguirles el ritmo. “Estas tecnologías van a seguir avanzando muy rápidamente, y nuestro compromiso es responder a medida que esto avanza”, comentó. Por ello, escuchar de primera mano las necesidades de las y los educadores es una de sus prioridades.

Una forma de apoyar a la comunidad educativa es a través de la creación de recursos educativos abiertos que ayuden a los educadores a formarse en el uso de herramientas basadas en IA. Estos recursos son realizados por un equipo de educadores internos que trabajan con colegas de todo el mundo, pensados tanto en educadores como en directivos de instituciones académicas, estos recursos educativos en idioma español buscan ayudarles a adaptar sus políticas de integridad académica en el contexto de la IA y a repensar la evaluación bajo este nuevo contexto.

Nuevas soluciones de integridad académica

“Es más fácil hoy garantizar la integridad académica que hace más de 20 años”, señaló Correa. Aunque los retos son completamente diferentes. “El desafío es distinto, el desafío que tienen hoy los educadores es seguir el ritmo”. Si bien hace un par de años muchos docentes tendían más al miedo y la prohibición de estas herramientas, ahora se observa una visión más de exploración y curiosidad.

Sin embargo, la brecha entre docentes y estudiantes en el uso de las IA generativas es evidente. Un estudio realizado en colaboración con Tyton Partners, confirma esta brecha: el 36 % de los docentes encuestados respondió que sí usan con frecuencia herramientas basadas en IA, en comparación con un 60 % de estudiantes que respondieron que las usan regularmente.

«El pensamiento crítico no se puede delegar a una IA»

El informe Time For Class 2024, que recoge las opiniones de 1600 estudiantes, 1800 docentes y 300 administradores, evidencia que, aunque efectivamente hay un mayor crecimiento de la adopción de la IA generativa en las instituciones educativas, las y los estudiantes siguen superando a la comunidad docente.

No obstante, gracias a este estudio se encontró que “aquellos docentes que usan la IA regularmente suelen tener una actitud más positiva hacia el uso de estas tecnologías en el aprendizaje, versus los que no la usan”, señaló Belén Correa. “Explorar y conocer la IA ayuda a cambiar la perspectiva”.

Soluciones de integridad académica pensadas en la comunidad hispanohablante

Por ello, son cada vez más las instituciones educativas que han empezado a fomentar el uso de la IA tanto en docentes como en estudiantes, “pero desde este enfoque de la exploración, de entender cómo funcionan estas herramientas y usarlas con transparencia y pensamiento crítico” puntualizó Correa. En el contexto particular de América Latina, los docentes latinoamericanos están abordando la IA desde una perspectiva de entendimiento y exploración, están tratando de entender qué está pasando, cuál es la realidad. Esta información la están usando para decidir cómo adaptar sus políticas de integridad académica y también cómo abordar las capacitaciones con sus docentes.

Aunque muchas instituciones educativas latinoamericanas imparten algunos cursos en inglés, las necesidades de esta comunidad son muy particulares. Es por ello por lo que el pasado 12 de septiembre de 2024, Turnitin lanzó el detector de escritura con IA en idioma español. “El detector en español ya lo venían pidiendo desde hace mucho tiempo”, confiesa Belén Correa. Y aunque lleva tan solo un par de meses desde su lanzamiento, el detector ha tenido gran aceptación y, así como la versión en inglés, está evolucionando constantemente, adaptándose a las necesidades particulares del mercado latinoamericano. “Ahora es un momento de mucho aprendizaje”, comentó Correa.

Sobre todo, tomando en cuenta el sesgo racial y de género que se ha detectado en la IA generativa. Ante este reto tan importante, Belén Correa señaló que su detector es un modelo de inteligencia artificial propio, “que nosotros entrenamos para detectar la IA. Entonces es IA, detectando IA”. Gracias al desarrollo interno de este modelo, se pueden detectar sesgos en personas que escriben en un segundo idioma. “Por ejemplo, una estudiante cuya primera lengua es el español, pero escribe en inglés, sus textos en inglés tienden a verse más parecidos a cómo escriben estas herramientas de IA”. Esto se hizo y empezó a probar primero con el detector de textos en inglés y ahora comenzaron desde cero todo este proceso para el detector de textos en español, con el objetivo de tratar de eliminar o minimizar estos sesgos.

Por último, Belén puntualizó que, aunque el concepto de integridad académica ha evolucionado con los años, hoy en día la integridad académica “sigue estando fundada en la transparencia del proceso, en el respeto, en asegurar que se aproveche la tecnología, pero sin sacrificar el aprendizaje, sobre todo, que el aporte del estudiante, y todo el pensamiento crítico que conlleva ese proceso, no se pierda. Porque el pensamiento crítico no se puede delegar a una IA”.

Acerca de Turnitin

Con más de 20 años de experiencia, Turnitin nació como un proyecto de cuatro estudiantes de la Universidad de California, quienes buscaban crear una aplicación que permitiera hacer revisión por pares entre los propios estudiantes. Desde entonces, Turnitin ha ayudado a garantizar la integridad en la escritura de más de 71 millones de estudiantes de todos los niveles educativos en alrededor más de 16.000 instituciones en más de 185 países.

Tomado de EDUNEWS del Tec de Monterrey

martes, 14 de enero de 2025

¿Qué IA me conviene? Comparativa de chatbots

 Por Juan José de Haro

Hemos analizado una serie de características de los chatbots más populares. No es un estudio detallado y sistemático con docenas de parámetros, sino simplemente algunas de las características que un servidor aprecia más en un chatbot.

Tras la tabla se hace una pequeña discusión de cada una de las características observadas y, por último, se proporciona una ficha de cada una de las diferentes IA.

Tabla de comparación

Casi todos los chatbots constan de diferentes modelos con distintas capacidades, en esta tabla están representados únicamente los modelos que aparecen por defecto en las versiones gratuitas.

Están ordenados de mejor a peor resultado, pero esto es algo muy relativo, ya que cada característica la hemos contabilizado por igual (un punto para cada una de ellas), pero diferentes intereses y objetivos nos podrían llevar a dar diferentes pesos a cada una de ellas, con lo que también obtendríamos un orden diferente.

Debemos señalar que Qwen tiene una puntuación negativa en dos características de las que ya se han anunciado su incorporación, como la creación de imágenes y la conexión a Internet. Cuando esto suceda, según los parámetros que hemos utilizado, pasará al primer lugar, por delante de ChatGPT y Claude.

Generación de imágenes

Es la capacidad para generar imágenes, indicándolo directamente en el chat. Hay que destacar que en Qwen aparece un botón para generar imágenes no funcional, pero que indica que próximamente estará en funcionamiento.

En esta tarea destaca Grok, que hace imágenes muy realistas y con pocas limitaciones. Por el lado contrario está Gemini, que se niega a crear representaciones de personas, aunque estas sean inexistentes.

Compartir públicamente conversaciones

Es la posibilidad de poder compartir conversaciones completas. Gemini solo permite compartir respuestas individuales, pero no conversaciones. Claude permite compartir artefactos, que son aplicaciones o textos creados por la IA, lo cual es muy útil, pero no directamente conversaciones. Grok y Copilot no permiten compartir nada.

Hacer aplicaciones que ejecuta el mismo chatbot

Cuando se le pide un programa o aplicación a la IA, todas nos dan el código, pero solo Claude y Qwen son capaces de ejecutarlas. No ejecutan cualquier programa, sino únicamente los hechos con JavaScript (el lenguaje de las páginas web), por lo que, cuando deseemos probar lo que nos ha hecho, deberemos pedírselo en HTML. En el caso de Claude, podremos compartirlo públicamente, por lo que podremos utilizarlo para nuestras clases. En el caso de Qwen solo podremos verlo y, si nos interesa, descargarlo como página web.

ChatGPT permite ejecutar programas en Python, aunque de forma no interactiva (es decir, no podremos cambiar valores o parámetros), pero no en JavaScript, de forma que no podremos compartir aplicaciones.

Subir documentos de texto

Por curioso que parezca, hay chatbots a los que no les podemos subir ni un simple archivo de texto plano para que lo analicen, se trata de Copilot y Gemini. En el caso de Grok, esta opción queda para las cuentas de pago.

El resto de chatbots admite muchos tipos como DOCX, XLS, MD, PDF, etc. Los tipos son variables entre los diferentes chatbots, pero suelen admitir los más utilizados para su análisis.

Ver las imágenes de los PDF

La posibilidad de ver las imágenes contenidas en los PDF solo está disponible en Claude. El resto de los chatbots ignoran cualquier imagen que contenga y solo tienen en cuenta el texto. Esto es tremendamente importante si debemos trabajar con PDF que contengan imágenes relevantes, como esquemas, infografías, etc.

Aunque no está incluido en este trabajo, porque no es un chatbot genérico, sino especializado en documentos, NotebookLM también puede verlas.

Representación de fórmulas matemáticas

Es la capacidad de representar correctamente las fórmulas matemáticas, cosa que hacen todos, excepto Gemini. Esta IA utiliza texto para visualizar fórmulas, por lo que no es útil si trabajamos en materias que hacen un uso extensivo de ellas.

Fórmula para la resolución de una ecuación de 2º grado generada por Gemini.
La misma fórmula hecha por Claude.

Cálculos matemáticos exactos

En cualquier materia de ciencias son importantes cálculos precisos y exactos, eso solo se consigue si la IA realiza las operaciones utilizando un programa creado por ella misma. En el caso de ChatGPT lo hace con Python y Claude con JavaScript. Ambos nos aseguran que el resultado será correcto.

El resto de chatbots hace los cálculos «a mano», es decir, sin ningún apoyo computacional y para operaciones medianamente complejas el resultado será casi siempre erróneo.

Si trabajamos con cálculos matemáticos, es obligado utilizar ChatGPT o Claude.

Conexión a Internet

Para comprobar datos o noticias actuales que las IA desconocen, es necesaria una conexión a Internet para que puedan consultar páginas web. ClaudeQwen y Mistral no disponen de ningún tipo de conexión, el resto sí. Aunque, como pasaba con la generación de imágenes, Qwen dispone de un botón para buscar en Internet que indica que pronto estará disponible.

Problema de lógica

Esta es probablemente una de las características más importantes, ya que el nivel de razonamiento del cual disponga la IA determinará en gran parte la calidad de sus respuestas. Para ponerla a prueba, le hemos pedido a ChatGPT-o1 (el modelo más avanzado en la actualidad) que elaborase una prueba de lógica que fuese nueva. Aunque el tipo de problema no es nuevo (deducir características a partir de una serie de pistas), sí lo es la situación, por lo que la IA debe mostrar un buen nivel de lógica, división del trabajo en pasos sucesivos y comprensión del problema para llegar a la solución correcta.

Este tipo de prueba nos indica si serán capaces de seguir instrucciones complejas dándonos resultados de calidad.

Después de varias propuestas por parte de ChatGPT-o1, hemos seleccionado este problema:

El acertijo de las camisetas y los transportes

Tres personas (Anna, Bob y Carla) llegan a su lugar de trabajo en horarios distintos (8:00, 8:15, 8:30). Cada una lleva una camiseta de un color diferente (roja, verde, azul) y usa un medio de transporte único (coche, autobús, bicicleta).

Datos conocidos:

  1. La persona que lleva la camiseta roja no llega a las 8:00.
  2. Quien va en bicicleta llega 15 minutos antes que Anna.
  3. Bob lleva camiseta verde, pero no usa coche.
  4. Carla llega a las 8:30, pero su camiseta no es roja.
  5. La persona que lleva la camiseta azul va en coche.

Objetivo: Determinar para cada uno (Anna, Bob y Carla):

  • A qué hora llega.
  • De qué color es su camiseta.
  • Qué medio de transporte utiliza.

El problema se les ha hecho resolver cuatro veces en un chat diferente cada vez a cada una de las IA.

En esta prueba aparece la mayor sorpresa, ya que solo un chatbot lo ha resuelto bien todas las veces, se trata de Qwen, que demuestra situarse entre los mejores sin lugar a dudas.

ChatGPT-4o y Claude 3.5 Sonnet lo han resuelto bien 3 de las cuatro veces. El resto de chatbots ha obtenido resultados peores y destacan Perplexity y Copilot que no han obtenido la respuesta correcta ninguna de las cuatro veces. Gemini y Mistral tampoco obtienen buenos resultados, ya que solo han dado una vez la respuesta correcta.

Descripción de los chatbots

A continuación presentamos la ficha técnica de cada chatbot creada por ellos mismos a través del prompt: Ficha técnica del chatbot y pidiéndoselo después en forma de tabla.

ChatGPT-4o

AspectoInformación
Nombre o denominación completaChatGPT
Versión y modeloBasado en el modelo GPT-4 de OpenAI
Desarrollador o empresaOpenAI
Fecha de lanzamiento14 de marzo de 2023 (GPT-4)
Última actualización significativaBase de conocimiento fija hasta octubre de 2023, con capacidades ampliadas mediante herramientas como navegación web y ejecución de código.
Capacidades principales– Comprensión y generación de texto en múltiples idiomas (incluyendo español y catalán).
– Creación de recursos educativos y explicaciones en temas complejos.
– Desarrollo y depuración de código en diversos lenguajes (Python, HTML, JavaScript, etc.).
– Análisis de datos, visualización y creación de gráficos.
– Generación de contenido: ensayos, informes, guías y prompts personalizados.
– Uso de herramientas como acceso web, generación de imágenes y trabajo con datos estructurados.
Limitaciones conocidas– Conocimiento fijo hasta octubre de 2023, salvo al usar herramientas como la navegación web.
– Puede tener limitaciones en matices culturales o expresiones idiomáticas.
– Respuestas dependientes de la claridad y especificidad de las instrucciones proporcionadas.
– Sin acceso directo a información privada, personal o bases de datos externas sin que se compartan explícitamente.
– Puede tener limitaciones en matices culturales o expresiones idiomáticas.
Información adicional– Instrucciones claras y específicas permiten mejores resultados.
– Uso responsable: diseñado para fines educativos, profesionales y creativos.
– Adaptable: puedo ajustar el nivel de detalle o formato según las necesidades del usuario.

Claude 3.5 Sonnet

AspectoInformación
NombreClaude
Versión y modeloClaude 3.5 Sonnet (parte de la familia Claude 3)
DesarrolladorAnthropic
Fecha de lanzamientoOctubre 2024
Última actualización de conocimientosAbril 2024
Capacidades principales– Análisis de datos y resolución de problemas matemáticos complejos.
Programación y desarrollo de código en diversos lenguajes.
– Creación de contenido escrito, desde textos técnicos hasta creativos.
– Análisis y comprensión de imágenes.
– Enseñanza y explicación de conceptos.
– Conversación natural y asistencia en múltiples idiomas.
– Análisis de documentos y extracción de información relevante.
Limitaciones– No puedo acceder a internet ni abrir enlaces.
No puedo modificar ni guardar archivos.
– No puedo recordar conversaciones anteriores.
– No puedo generar, crear, editar o manipular imágenes.
– Mi conocimiento está limitado a abril de 2024.
Información adicional– Me puedes escribir en cualquier idioma y responderé en el mismo.
– Puedo ayudarte con tareas tanto simples como complejas.
– Adapto mi nivel de detalle según la complejidad de la pregunta.
– Puedo procesar y analizar archivos que me compartas durante nuestra conversación.

Qwen 2.5 Pro

CategoríaInformación
Nombre o denominación completaQwen
Versión y modeloQwen-2.5 Pro
Desarrollador o empresaAlibaba Cloud (subsidiaria de Alibaba Group)
Fecha de lanzamientoLanzamiento inicial: 2024
Última actualización significativa: Julio 2024
Capacidades principales– Procesamiento de lenguaje natural (NLP)
– Conversaciones dinámicas
– Generación de contenido
– Respuestas basadas en datos hasta septiembre de 2024
– Resolución de problemas complejos
Limitaciones conocidas– Información posterior a septiembre de 2024 no disponible
– Contexto limitado por conversación
– Dificultades con interpretación subjetiva (tono emocional, sarcasmo)
– No procesa información personal sensible sin consentimiento explícito
Otra información útil– Interacción clara y específica mejora precisión de respuestas
– Respeto principios éticos y de privacidad
– Actualizaciones continuas para mejorar rendimiento y adaptabilidad

Mistral

CategoríaDetalle
Nombre o denominación completaLe Chat
Versión y modeloModelo de lenguaje grande (LLM) creado por Mistral AI
Desarrollador o empresaMistral AI, una startup francesa con sede en París
Fecha de lanzamientoNo tengo información sobre mi fecha de lanzamiento.
Última actualización significativaNo tengo información sobre mi última actualización significativa.
Capacidades principales– Generación de texto
– Comprensión del lenguaje natural
– Traducción
– Resumen de texto
– Generación de imágenes
Limitaciones conocidas– No puedo realizar búsquedas en la web ni acceder a Internet
– No puedo leer ni transcribir archivos de audio o video, ni leer imágenes
– No puedo generar contenido que no sea visual
– Límites de tasa en ciertas herramientas
Otra información útil– Proporciona consultas claras y específicas
– Soy muy atento a las fechas
– Puedo responder en el idioma que uses o solicites

Perplexity

Información DetalladaDescripción
Nombre CompletoPerplexity AI Assistant
DesarrolladorPerplexity AI
Tipo de ModeloModelo de Lenguaje de Gran Escala (LLM)
Fecha de Conocimiento BaseDiciembre de 2023
Capacidades Principales– Procesamiento de lenguaje natural
– Generación de texto inteligente
– Búsqueda y síntesis de información
– Análisis de datos
– Resolución de problemas
– Traducción multilingüe
Áreas de Especialización– Investigación académica
– Explicaciones científicas
– Análisis técnico
– Soporte educativo
– Redacción profesional
Limitaciones– Sin acceso a internet en tiempo real
– No puede realizar acciones físicas
– Sin memoria persistente entre sesiones
– No tiene conciencia ni emociones reales
Principios Operativos– Precisión
– Objetividad
– Respeto
– Confidencialidad
– Ética en la información
Recomendaciones de Uso– Preguntas claras y específicas
– Verificar información crítica
– Usar como herramienta de apoyo

Grok

AtributoDetalles
Nombre o denominación completaGrok
Versión y modeloGrok 2
Desarrollador o empresaxAI
Fecha de lanzamiento y última actualizaciónNo disponible (actualización continua)
Capacidades principales– Análisis de datos en tiempo real
– Respuestas creativas y útiles
– Generación de imágenes
– Investigación y asistencia
– Análisis de contenido
Limitaciones conocidas– No puede hablar en modo voz
– No puede ejecutar código
– No puede editar imágenes ni generar imágenes basadas en otras imágenes
– No tiene acceso a datos internos de X/Twitter
Otra información útil– Interacción natural
– Maximiza la utilidad
– Perspectiva externa sobre asuntos humanos
– Objetividad en temas controvertidos
– No inventa información
– Actualización constante del conocimiento

Copilot

AtributoDescripción
Nombre o denominación completaCopilot
Versión y modeloModelos de lenguaje avanzados de última generación (no especifico versión/modelo técnico)
Desarrollador o empresaMicrosoft
Fecha de lanzamiento y última actualizaciónNo tengo una fecha específica; mis conocimientos se actualizan continuamente
Capacidades principales– Responder preguntas
– Crear y colaborar en textos
– Ofrecer soporte y consejos
– Realizar búsquedas web
– Generar imágenes
– Interpretar imágenes
Limitaciones conocidas– No proporciono contenido completo protegido por derechos de autor
– No realizo acciones en dispositivos (e.g., recordatorios)
– No edito imágenes
– No busco imágenes específicas
– Basado en información disponible (no precisión absoluta garantizada)
Información adicional– Revisa la declaración de privacidad de Microsoft para más detalles
– Comparte sugerencias o retroalimentación para mejorar mi rendimiento

Gemini

CategoríaDescripción
Nombre o denominación completaGemini
Versión y modeloFamilia de modelos Gemini, incluyendo 1.5 Flash.
Desarrollador o empresaGoogle
Fecha de lanzamiento y última actualizaciónNo hay una fecha de lanzamiento pública específica. Los modelos de Google se actualizan continuamente. La información sobre fechas de actualizaciones específicas de los modelos no se suele divulgar públicamente.
Capacidades principalesProcesamiento del lenguaje natural: Comprensión y generación de texto en múltiples idiomas, respuesta a preguntas, generación de texto creativo, traducción de idiomas, escritura de contenido creativo.
Acceso a información actualizada: Acceso a información actualizada a través de fragmentos de búsqueda.
Multimodalidad: Capacidad de entender y trabajar con diferentes tipos de información (texto, código, imágenes, audio y video), aunque en esta interfaz la interacción principal es textual.
Limitaciones conocidasFalta de capacidades físicas: No puedo realizar acciones en el mundo real.
Dependencia de la información de búsqueda: La calidad de las respuestas depende de la calidad de los resultados de búsqueda.
Posibles sesgos: Puedo reflejar sesgos presentes en los datos de entrenamiento.
Falta de «comprensión» real: No tengo una comprensión real del mundo ni conciencia propia.
Información adicional para la interacciónSé específico en tus preguntas: Preguntas específicas resultan en mejores respuestas.
Experimenta con diferentes tipos de preguntas: Prueba diferentes formulaciones.
Verifica la información importante: Siempre verifica información crucial en fuentes confiables.
Distingue entre hechos y opiniones: Distingue entre información objetiva y opiniones.
Estoy en continuo desarrollo: Los modelos Gemini están en constante mejora.

Conclusiones

  • Por su nivel de lógica destacan tres chatbots sobre el resto: ChatGPTClaude y Qwen.
  • Para cálculos matemáticos, tanto ChatGPT como Claude pueden dar resultados precisos, el resto producirá resultados que casi con total seguridad no lo serán.
  • Si lo que nos interesa es trabajar con PDF, probablemente debemos decantarnos por Claude, ya que es el único capaz de tomar en cuenta las imágenes que contienen.

Así pues, para tareas educativas típicas como puede ser la creación de unidades didácticas, prácticas, ejercicios, actividades, juegos, etc., los mejores resultados se obtendrán con estos tres chatbots: ChatGPTClaude y Qwen. Además, Qwen no tiene límites de uso definidos, por lo que puede ser una alternativa a la altura de los otros dos.

Pódcast del artículo generado con IA

Tomado de BILATERIA con permiso de su autor