Código abierto en 2024: abordar los desafíos relacionados con la seguridad, la inteligencia artificial y la sostenibilidad a largo plazo

La primera pieza de código abierto se publicó hace poco más de 70 años y ahora el software de código abierto se encuentra en casi todas las aplicaciones que existen en la actualidad.

A informe 2024 de Synopsys descubrió que la aplicación promedio tiene más de 500 componentes de código abierto, y los informes más recientes de la industria muestran que más del 95% de las bases de código contienen software de código abierto.

Chris Aniszczyk, director de tecnología de Fundación de computación nativa en la nube y vicepresidente de relaciones con desarrolladores de la Fundación Linux, dice que si bien el código abierto se ha utilizado en gran medida en aplicaciones del sector tecnológico, en los últimos años se está expandiendo a casi todas las industrias, como la agricultura y la farmacéutica. La Fundación Linux también anunció recientemente OS-clima para abordar los problemas del cambio climático.

Dada la omnipresencia del software de código abierto, veamos algunas de las tendencias que hemos estado viendo durante el último año y lo que podemos esperar de la comunidad de código abierto este año.

La seguridad del código abierto ahora está siendo abordada por los gobiernos

En general, el software de código abierto ha estado bajo más lupa últimamente, debido a varios problemas de seguridad importantes durante la última década que involucran componentes de código abierto, como la vulnerabilidad Log4Shell en Log4J.

Tanto Estados Unidos como la Unión Europea están tomando medidas para mejorar la seguridad de los proyectos de código abierto. Dentro de Estados Unidos, el presidente Joe Biden firmó un orden ejecutiva en mejorar la ciberseguridad, y una parte de eso es mejorar la seguridad del código abierto. CISA también tiene varias iniciativas abordar esta cuestión.

En la UE, la Ley de Resiliencia Cibernética impone requisitos de seguridad más estrictos al software. Si bien no apunta específicamente al software de código abierto, Mike Milinkovich, director ejecutivo de Fundación Eclipsedice: «Realmente no hay manera de regular la industria del software sin regular el código abierto como una especie de efecto secundario de primer orden».

La Orden Ejecutiva ha hecho que la gente empiece a pensar más en cosas como la lista de materiales de software (SBOM) y la gestión de vulnerabilidades (incluida la gestión de licencias), dijo Michele Rosen, directora de investigación de IDC.

«Si estás instalando un paquete que tiene tres dependencias y utiliza algún tipo de software GPL, y ahora estás creando software sobre él, eso puede ser un gran riesgo legal para una empresa», dijo. «Entonces, una de las cosas que están encontrando es que los sistemas de administración SBOM pueden ayudar no solo a administrar las vulnerabilidades, sino también a administrar las licencias del código subyacente».

Según Aniszczyk, esta regulación y el impulso a la transparencia tienen sentido, porque cuando vamos al supermercado, por ejemplo, queremos saber exactamente qué hay en los alimentos que compramos. Hasta ahora, no ha habido realmente un incentivo para hacer eso con el software.

«Tenemos muchas opciones en el ámbito del código abierto y los desarrolladores simplemente usan lo que encuentran en GitHub o GitLab, o en Internet», dijo Aniszczyk. «Y simplemente no existe esta madurez que se encuentra en industrias como la manufacturera o similares, donde hay un poco más de escrutinio en la cadena de suministro».

Milinkovich tiene la esperanza de que un efecto secundario de esta regulación sea que incite a las corporaciones más grandes a contribuir más al código abierto.

«No hay absolutamente ningún incentivo en ninguna parte de esa relación para las empresas en particular que utilizan el código abierto para contribuir con algo», dijo Milinkovich. “No hay razón para hacerlo; es como «gracias por las cosas gratis». Y luego lo pondremos en nuestras aplicaciones en nuestros sistemas internos. Y eso es genial. Pero la regulación cambia un poco esa ecuación. Entonces, con la regulación, ahora podrían tener el requisito de poder producir SBOM, podrían tener el requisito de demostrar que los componentes de software que están usando en sus productos que venden al gobierno de EE. UU. tienen que seguir las Capacidades NIST SSVF”.

El código abierto puede ganar la carrera de la IA

A nota filtrada de un miembro del personal de Google en mayo pasado titulado “No tenemos foso y OpenAI tampoco” exploró la idea de que mientras Google estaba ocupado tratando de competir con OpenAI, se dieron cuenta de la posibilidad de que ninguna de las compañías ganaría la carrera de la IA: el código abierto podría hacerlo.

“El memorando de fosos básicamente decía que los chicos de código abierto están obteniendo resultados similares o, de alguna manera, incluso mejores resultados. Y están avanzando a un ritmo más rápido, incluso con conjuntos de datos mucho más pequeños”, afirmó Milinkovich.

El memorando dice: “En pocas palabras, nos están superando. Las cosas que consideramos “problemas abiertos importantes” están resueltas y en manos de la gente hoy… Los modelos de código abierto son más rápidos, más personalizables, más privados y más capaces. Están haciendo cosas con parámetros de $100 y 13 mil millones con los que nosotros luchamos con $10 millones y 540 mil millones. Y lo están haciendo en semanas, no en meses”.

Algunas de las grandes empresas incluso están empezando a abrir sus modelos en código abierto, y los fabricantes de código abierto también están cerrando acuerdos con las empresas más grandes, afirmó Rosen.

Por ejemplo, Meta ha abierto parcialmente Llama y Mistral, la startup francesa que produce modelos de código abierto, recientemente. hizo un trato con Microsoft.

«Así que creo que está bastante claro que los modelos abiertos van a desempeñar un papel en todo este espacio de la IA de una forma u otra… hubo una pregunta que yo diría el año pasado en la que algunas personas estaban insinuando que, siendo los efectos de red lo que son, nosotros Si todos íbamos a converger en un solo modelo y no veo que eso suceda en absoluto, creo que habrá una proliferación”, dijo.

Otra cosa a tener en cuenta cuando se trata de IA es cómo se manejarán las contribuciones realizadas utilizando la IA, dado el hecho de que el autor podría no ser realmente el autor, dijo Milinkovich.

Él cree que se volverá más popular el uso de herramientas que comprueben el plagio. «Hay algunas opciones en Copilot, donde comprobará si el código que ha producido es casi idéntico al código que se incluye en sus datos de entrenamiento», dijo. «Si hay algo que un humano interpretaría como plagio, es necesario intentar utilizar esas herramientas para evitarlo».

Rosen dice que «el problema es que, particularmente con un modelo de código abierto, es muy difícil saber cómo aplicar esas licencias, digamos al conjunto de datos de entrenamiento o la arquitectura o incluso el indicador del sistema o algo así».

El impacto de los despidos tecnológicos en el código abierto

Según Rosen, aproximadamente la mitad de los contribuyentes de código abierto reciben algún pago por contribuir al código abierto. Por eso, cuando Google decidió Suspender su división de código abierto el año pasado, causó cierta sensación.

Google no fue el único; De acuerdo a Rastreador de despidos de Crunchbase191.000 trabajadores tecnológicos perdieron su empleo en 2023 y, hasta el 8 de marzo, otros 31.000 ya habían sido despedidos este año.

Sin embargo, a pesar de los despidos, los datos del Índice de colaboradores de código abierto revela que la cantidad de contribuyentes activos de las principales empresas de tecnología (incluido Google) aumentó todos los meses en 2023.

«Es cierto que, obviamente, algunos de los líderes del software comercial de código abierto fueron objeto de despidos», dijo Rosen. “Y aunque sabemos que debe haber algunos desarrolladores despedidos que estaban contribuyendo a proyectos de código abierto, es importante poner esos despidos en contexto. Las pérdidas representaron una minoría relativa de las contrataciones que habían tenido lugar durante los dos o tres años anteriores, por lo que el impacto general no es algo que haya visto o que tenga la sensación de que haya habido una fuga”.

Cómo sostener proyectos de código abierto a largo plazo

La sostenibilidad a largo plazo de los proyectos de código abierto es otra cosa que ha recibido más atención en los últimos años. Hubo varios ejemplos de proyectos populares que cambiaron la licencia o el modelo de negocio de sus proyectos en el último año. Por ejemplo, HashiCorp cambió Terraform de MPL v2 a Business Source License el año pasado y, a principios de este año, Buoyant Anunciado que las versiones estables de Linkerd solo llegarían a usuarios empresariales. Además, Red Hat tenía previamente anunciado que sus versiones de RHEL solo estarían disponibles a través de CentOS Stream, lo que molestó a muchos en la comunidad de código abierto.

Sin embargo, estos no son incidentes aislados del último año; Varios otros proyectos de código abierto han cambiaron sus licencias a lo largo de los años, incluidos Akka, CockroachDB, Elasticsearch, MongoDB, Redis y más.

Aniszczyk cree que debido a las reacciones negativas que enfrentaron las empresas, esto no será algo común en los proyectos de código abierto. «Creo que eso sucederá menos debido al dolor que les causó, como si perdieran mucha confianza de la comunidad», dijo, hablando de HashiCorp.

Rosen dice que cree que las empresas están empezando a pensar más que antes en la estrategia a largo plazo de un proyecto.

“[They’re] tal vez ser un poco más activo en la diversificación de la gestión y realmente tratar de pensar en una estrategia a más largo plazo”, dijo. “Mientras que creo que muchos proyectos de código abierto se lanzan con una mentalidad de innovación y tal vez no piensen en la gobernanza a largo plazo. Si este proyecto tiene éxito, ¿cómo lo vamos a mantener? ¿Qué va a pasar?”

A artículo publicado En enero, la Harvard Business School reveló que el 96% del valor del código abierto lo genera el 5% de los desarrolladores.

“Tenemos una población relativamente pequeña de personas de las que, francamente, depende la sociedad”, dijo Milinkovich. “Y, ya sabes, ¿cómo nos aseguramos de que esas personas no se agoten? … ¿Cómo nos aseguramos de que esos desarrolladores sean sostenidos, pero también cómo se los reemplaza a medida que se jubilan y la próxima generación tiene que regresar detrás de ellos y tomar el mando de algunas de estas piezas centrales de infraestructura?

El valor del código abierto

Es un problema importante que hay que resolver, porque ese mismo artículo de la Escuela de Negocios de Harvard valoró la demanda de software de código abierto en 8,8 billones de dólares y la oferta en 4,150 millones de dólares.

«Encontramos que las empresas necesitarían gastar 3,5 veces más en software de lo que gastan actualmente si no existiera el OSS», afirmaron los investigadores en el informe.

Milinkovich cree que las cifras de Harvard subestiman el valor porque sólo midieron sitios web y no sistemas operativos.

“Algunos de los titulares que he visto me hacen pensar que en realidad no leyeron el periódico, porque dice, ya sabes, ‘¿el código abierto vale 8,8 billones de dólares?’ No, sólo midieron una fracción del ecosistema de código abierto, ¿verdad? Solo midieron sitios web y excluyeron específicamente los sistemas operativos. Básicamente, el valor económico de toda la infraestructura web en todo el planeta que utilizamos todos los días, y las contribuciones del código abierto a ella, es de aproximadamente 8,8 billones de dólares, pero eso excluye otros usos. Excluye los sistemas operativos. Así que obviamente es mucho, mucho más alto que eso”.


Source link

About David Lopez

Check Also

Perspectiva del analista: los líderes en ingeniería de software deben comprender el potencial de los datos sintéticos

Los datos sintéticos son una clase de datos generados artificialmente mediante métodos avanzados, como el …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *