jueves, 12 de septiembre de 2024

El costo ambiental de la IA

 Por Melissa Guerra Jáuregui

Aunque las emisiones de GEI (gases de efecto invernadero) no son exclusivas de una industria en particular, el impacto de la IA en el ambiente es un hecho, por lo que se debe tomar acción inmediata ante las altas emisiones de carbono propiciadas por su uso.



Es innegable que la Inteligencia Artificial (IA) ha sido un factor clave para el desarrollo de muchas industrias. Sin embargo, poco se habla de las consecuencias ambientales de su uso.

¿Qué son las emisiones de carbono?

Primeramente, hay que comprender que el dióxido de carbono (CO2), compuesto molecularmente de oxígeno e hidrógeno, es un gas que naturalmente se encuentra en diversas superficies de la Tierra, tales como la atmósfera, la biosfera, la hidrosfera y la litosfera (su existencia en estas conforma el ciclo del carbono), y tiene la finalidad de atrapar la radiación infrarroja para devolverla al espacio.

Entonces, si este gas se localiza en la atmósfera, ¿por qué afecta en el calentamiento global? Simple, debido a que las actividades humanas (la quema de combustibles fósiles, la deforestación, la generación de electricidad, etc.) aumentan drásticamente la concentración de dióxido de carbono, la cual es mayor a lo que la Tierra puede manejar.

Debido a que el CO2 atrapa el calor, el planeta se calienta más. Esto provoca que este gas ocasione estragos sobre el efecto invernadero. Por ende, se puede entender que las emisiones de carbono son estas liberaciones de CO2 y de GEI en altas proporciones, producidas por diversas actividades de la industria humana, que causan el calentamiento de la Tierra.

Huella de carbono

Según el especialista en mitigación del cambio climático y huella del carbono, Sebastián Galbusera, en una entrevista realizada por National Geographic, la huella de carbono se refiere a “la cantidad de emisiones de gases de efecto invernadero que se emitieron a la atmósfera por medio de alguna actividad humana, que puede ser un producto o un servicio, o por la acción diaria de un habitante”.

Por su parte, la huella de carbono personal es aquella que la produce un solo individuo al realizar sus actividades cotidianas, tales como usar recursos energéticos, tomar alimentos, entre otros. Actualmente, la huella de carbono promedio de cada individuo es de 4 toneladas de CO2  al año. Lo ideal es que esta se encuentre entre 2 a 2.5 T.

Tabla 1: Dióxido de carbono atmosférico a lo largo del tiempo. Fuente: Nasa Climate (2024).

El impacto de la IA en el ambiente

Es importante comprender que las emisiones globales se concentran en los sectores de energía, transporte, industria, construcción, agricultura, etcétera. Aunque la IA se encuentra en el sector tecnológico, su uso depende de la energía eléctrica.

A saber, la industria de la producción de electricidad y calor ha propiciado un aumento significativo del 46 % en las emisiones globales.

Tabla 2: Emisiones de GEI por sector a nivel mundial. Fuente: Our World in Data (2023).

Existe una creciente preocupación por este incremento de emisiones generadas por el uso de la electricidad, pero ¿de qué forma esto contribuye en las emisiones de CO2? Para contestar esta pregunta, primero hay que conocer cómo funciona este proceso, pero no a nivel usuario, sino a nivel operacional.

¿Qué es un centro de datos?

Un data center o centro de datos es un espacio físico que concentra la infraestructura necesaria para procesar, ordenar, proteger y conservar información. Dicho lugar asegura el funcionamiento eficiente de diversos sectores en la sociedad digital, puesto que posibilita la conectividad y los servicios en línea.

Un centro de datos consta de servidores (computadoras especializadas de mucha potencia), sistemas de almacenamiento (discos duros de alta capacidad), redes (permiten la conectividad y comunicación), sistemas de refrigeración (para mantener la temperatura adecuada y evitar que los equipos se sobrecalienten) y seguridad (contra personas no autorizadas o por desastres naturales).

Existen diversos tipos de data centers: corporativos, housing (colocation), hosting (gestionados) cloud (en la nube). A su vez, estos espacios pueden ser catalogados según su infraestructura: hiperescala, modulares y subterráneos. Algunos ejemplos de data centers conocidos son los siguientes: Google Data Center, Amazon Web Services y Microsoft Azure.

Cabe destacar que estos centros de datos son a hiperescala, lo que significa que son los más grandes y potentes del mundo. Para ser catalogados de esta forma, deben tener mínimamente las siguientes características: 5000 servidores, 930 metros cuadrados de extensión (mín.) y entregue al menos 40 MW (megavatio)* de capacidad.

*1 megavatio es equivalente a un millón de vatios o mil kilovatios.

Para entender el alcance de estos espacios, tan solo en 2020, más de la mitad de todos los datos procesados en el mundo pasaron por al menos una facilidad de hiperescala.

Los centros de datos, la IA y el consumo eléctrico

Una consulta con ChatGPT gasta 10 veces más electricidad que una búsqueda de Google (2.9 Wh contra 0.03 Wh*). De acuerdo con una investigación de Goldman Sachs Research, Generational Growth: AI, data centers and the coming US power demand surge, esta tendencia de uso de la IA y los centros de datos provocará un incremento significativo en la demanda energética de estos.

Este mismo reporte prevé un aumento del 15 % en la demanda de energía por la IA entre el 2023 y 2030, estimando que se requerirán 47 GW (gigavatio)** de capacidad para cumplir con la demanda de crecimiento en esta industria.

*Wh es igual a vatios por hora.

**1 gigavatio es equivalente a mil millones de vatios.

Por su parte, la International Energy Agency (IEA) menciona que la demanda mundial de electricidad aumentará un 5 % para 2025, es decir, 80 TWh* al consumo energético anual.

Asimismo, la IEA estableció que el consumo eléctrico de los centros de datos se encuentra entre el 1 y 1.3 % de la energía total, pero se espera que este número aumente a 4 % a finales de la década.

*TWh es igual a teravatios por hora.

Google presenta en su reporte que, de acuerdo con las estimaciones de la IEA, el consumo de sus centros de datos que sobrepasan los 24 TWh en 2023 representan entre el 7 y el 10 % del consumo mundial de electricidad de los data centers, siendo el 0.1 % de la demanda mundial de electricidad.

Los costos energéticos y económicos de la IA

Una de las razones por las cuales existe un alza en estas demandan energéticas se debe a un aumento en la escala de los parámetros (es decir, las configuraciones que aprenden los modelos durante su entrenamiento, los cuales se ajustan para modificar la forma de procesa información y generar respuestas, así como para adecuar sus comportamientos) de los modelos de lenguaje grande (LLM) y los modelos multimodales (LMM), así como por los procesos de entrenamiento e inferencia de los modelos de IA y el mantenimiento de los mismos.

Ejemplos de este incremento en la escala de los parámetros de modelo son: Google BERT-large (350 millones de parámetros), Open AI GPT2-XL (1.5 mil millones), NVIDIA Megatron-LM (8 mil millones), Google T5-11B (11 mil millones) y Open AI GPT-3 (175 mil millones).

Del mismo modo, se han amplificado las horas de entrenamiento de los modelos con datos, lo cual se traduce a un mayor gasto eléctrico y económico (tabla 3). OpenGPT-2-XL entrenó con 40 mil millones de palabras, RoBERTa (IA de Meta/Facebook) se entrenó con 160 GB de texto (la misma cantidad que OpenGPT-2XL). Por tanto, ambas requirieron aproximadamente 25,000 horas de GPU* para entrenarse.

*GPU: unidad de procesamiento gráfico. Indican la velocidad de las tarjetas gráficas. Una hora de GPU equivale a 20 horas de CPU (computadora).

Tabla 3: Costos de hardware y de energía para entrenar a los sistemas de IA. Fuente: Epoch (2024) (Tomado de Our World in Data).

Las empresas tecnológicas y su impacto ambiental

Según estudiosla creación de GPT-3 emitió 552 toneladas de CO2, produciendo 8.4 toneladas de CO2 anuales.

Por su parte, Google en su más reciente reporte Environmental Report 2024 declara que sus emisiones de GEI aumentaron 13 % en 2023 debido a dos factores importantes: (1) un incremento de consumo eléctrico por parte de sus data centers, y (2) por emisiones derivadas de su cadena de distribución y producción (supply chain). En datos más específicos, solamente los data centers de Google multiplicaron su consumo de electricidad un 17 % en 2023, a pesar de contar con programas de energía renovable.

Por otro lado, Microsoft, en su reporte 2024 Environmental Sustainability Reportmenciona que hubo un incremento general de emisiones en un 29.1 %. No obstante, esta empresa sí tiene una huella hídrica importante, puesto que se utilizaron 700,000 L de agua dulce para entrenar a GPT-3 en sus centros de datos, equivalente a la producción de 370 automóviles. A saber, para una consulta sencilla personal (de 20 a 50 preguntas) en ChatGPT se consumen 500 ml de agua.

Emisiones de alcance

Para entender el manejo de la información en estos reportes, es fundamental entender varios conceptos:

  • Carbono operacional: emisiones asociadas con la energía requerida para que un edificio o infraestructura funcione (ventilación, iluminación, etc.).
  • Carbono incorporado: se asocia con cualquier proceso, material o producto utilizado para construir, mantener, reparar, renovar y demoler un edificio/infraestructura.

Por otro lado, para medir la huella de carbono, se sigue un procedimiento llamado protocolo GHG, el cual divide las emisiones de gases en tres categorías:

¿Qué se está realizando para combatir la huella de carbono?

Actualmente, existe una tendencia de IA roja (red AI) en los modelos modernos, puesto que este se enfoca en la investigación para mejorar la precisión de los sistemas a través de un mayor costo computacional. Esto incluye el aumento en la cantidad de datos de entrenamiento y el número de experimentos de los modelos.

Como ya se vio con anterioridad, esta tecnología es muy costosa (en términos económicos y energéticos) para entrenar o ejecutar, puesto que su enfoque se dedica a la precisión (accuracy) antes que a la eficiencia (efficiency).

Por el contrario, la IA verde (green AI) sí toma en cuenta el costo computacional, fomentando la eficiencia (reducción de costos), con el objetivo de conseguir resultados favorables de rendimiento. La IA verde sugiere medidas de eficiencia para reducir los costos económicos y ecológicos, las cuales consideran las emisiones de carbono, la infraestructura eléctrica, el costo del FPO (floating point operations) para cuantificar la huella de carbono y el número de parámetros usados por modelo.

Estrategias

Conscientes del impacto ambiental, Google y Microsoft han establecido medidas hacia la sustentabilidad con la IA. A continuación, se enlistan algunas de ellas:

  • Integrar energía libre de carbono (CFE) (carbon-free energy).  Por ejemplo, Google planea comprar 4GW de energía limpia.
  • Alcanzar las cero emisiones (net-zero emissions) para el 2030, tanto para operaciones como para la cadena de valor.
  • Desarrollar la IA de manera responsable, abordando la huella ambiental a través de la optimización de modelos, infraestructura eficiente y reducción de emisiones.
  • Estrategias de water positive (gestión sostenible y restauración del agua). Por ejemplo, el climate-conscious cooling de Google para identificar soluciones de refrigeración.
  • Estrategias de zero waste o residuo cero (reducción y reutilización) en centros de datos e infraestructura.

No todo son malas noticias, ya que estudios señalan que la IA tiene el potencial de mitigar las emisiones globales de GEI de un 5 a 10 % para el 2030. Hoy en día existen diversas IA que ayudan a identificar la huella de carbono de los modelos y sistemas, con el fin de analizar, optimizar y construir estrategias que ayuden a reducir las emisiones de estos gases de efecto invernadero.

Aunque es un largo camino por recorrer, es necesario ser conscientes de que el cambio para ayudar al planeta está en manos de todos. Si bien la inteligencia artificial ha desbocado un aumento en el consumo energético, no debemos olvidar que este impacto negativo en el ambiente se alimenta de toda la actividad humana.

Tomado de EDUNEWS del Tec de Monterrey

No hay comentarios: