Conecta con nosotros

Hola, ¿qué estás buscando?

Actualidad

ByteDance (TikTok) publica sus modelos de IA Seed-OSS como código abierto

ByteDance

Según informan en VentureBeat, ByteDance, la empresa matriz de TikTok, ha publicado dos nuevos modelos de lenguaje grande (LLM), Seed-OSS-36B-Base y Seed-OSS-36B-Instruct, para razonamiento avanzado. Según la compañía, ambos modelos son de código abierto bajo la licencia Apache 2 y pueden ser encontrados en GitHub bajo el paraguas de su Seed Team.

El modelo Seed-OSS-36B-Base está disponible en dos versiones, una con datos sintéticos y otra sin datos sintéticos, mientras que Seed-OSS-36B-Instruct se diferencia del otro por el hecho de que está posentrenado con datos de instrucciones para priorizar la ejecución de tareas y el seguimiento de instrucciones en lugar de servir puramente el modelo base.

El Seed-OSS-36B-Base con datos sintéticos está entrenado con datos de instrucciones adicionales, permitiéndole así ofrecer mejores resultados en las pruebas de rendimiento estándar y está más dirigido al propósito general de alto rendimiento. Por su parte, la versión sin datos sintéticos omite estas adiciones, creando así una base más limpia que evita sesgos y distorsiones introducidos por los datos de instrucción sintéticos.

La permisividad de la licencia Apache 2 abre la puerta al uso de los modelos en prácticamente cualquier contexto, desde aplicaciones comerciales hasta internas de una empresa o dirigidas a los clientes, todo sin ningún coste para los usuarios y desarrolladores tanto para usar los propios modelos como las API asociadas. Seed Team posiciona sus LLM para aplicaciones internacionales, haciendo énfasis en la versatilidad del razonamiento, la ejecución de tareas de forma similar a como lo haría un agente y entornos multilingües.

Advertencia, desplázate para continuar leyendo
Cargando anuncio...

El Seed Team de ByteDance ha resaltado la accesibilidad de sus LLM para desarrolladores y profesionales, ya que estos pueden ser implementados con Hugging Face Transformers, empleando cuantización de 4-bit u 8-bit, para reducir los requerimientos de memoria. Además, también pueden ser integrados con vLLM para un servicio escalable, abarcando ejemplos de configuraciones e instrucciones para el servidor de la API. Para reducir todavía más las barreras hay scripts para la inferencia, personalización de prompts, integración de herramientas y más opciones con el fin de poder adaptar las implementaciones de los modelos a diversos contextos.

Los modelos Seed-OSS-36B-Base y Seed-OSS-36B-Instruct de ByteDance podrían ser una respuesta a los gpt-oss-120b y gpt-oss-20b publicados este mismo mes por OpenAI, los cuales también están disponibles a través del mismo alojamiento de repositorios y bajo la misma licencia. De hecho, y teniendo en cuenta que cada empresa tiene su enfoque, ambas pretenden con sus modelos de código abierto abrir el abanico de usuarios reduciendo los requisitos y ampliando los contextos en los que pueden ser utilizados.

Parece que los últimos movimientos en torno a la inteligencia artificial se centran más en la accesibilidad y en hacer que la mayor cantidad de usuarios puedan utilizar los modelos. Esto tiene sentido, sobre todo si se pretende que el sector siga creciendo. Sin embargo, son cada vez más las voces que denuncian que en torno a la inteligencia artificial hay una burbuja que podría explotar de la peor manera, recordando al episodio conocido como la burbuja puntocom.

Click para comentar
Advertencia
Advertencia

Te recomendamos

Actualidad

IBM y Red Hat han anunciado Project Lightwell, una iniciativa con la que ambas compañías se comprometen a invertir 5.000 millones de dólares en...

Contenido patrocinado

Tuxedo Computers ha presentado el Tuxedo BM15, un portátil Linux de corte profesional que no llega para competir en espectacularidad, sino para cubrir un...

Actualidad

Si hace nada nos hacíamos eco del lanzamiento de Red Hat Enterprise Linux 10.2, la seguidilla ya está aquí y, como de costumbre, AlmaLinux...

Contenido patrocinado

ONLYOFFICE Docs 9.4 ya está disponible como la nueva actualización de la suite ofimática de código abierto, un lanzamiento que combina cambios relevantes en...