El potencial de la pista de datos de IA y el surgimiento de Web3 DataFi
Recientemente, el evento más llamativo en el mundo de la IA ha sido la poderosa demostración de Meta. Zuckerberg está reclutando talentos por todas partes y ha formado un lujoso equipo de IA compuesto principalmente por investigadores de origen chino. Entre ellos, Alexander Wang, de solo 28 años, se ha convertido en el líder del equipo. Wang fundó Scale AI, que tiene una valoración de 29 mil millones de dólares, y proporciona servicios de datos a varias grandes empresas de IA, incluyendo el ejército de EE. UU., OpenAI, Anthropic y Meta. El negocio principal de Scale AI es ofrecer una gran cantidad de datos de etiquetado precisos.
La razón por la que Scale AI ha logrado destacarse entre muchos unicornios radica en que reconoció temprano la importancia de los datos en la industria de la IA. La potencia de cálculo, el modelo y los datos son los tres pilares de los modelos de IA. Si comparamos un gran modelo con una persona, entonces el modelo es el cuerpo, la potencia de cálculo es la comida y los datos son el conocimiento y la información.
En el rápido desarrollo de los modelos de lenguaje grandes, el enfoque de la industria ha cambiado de los modelos a la potencia de cálculo. Hoy en día, la mayoría de los modelos utilizan transformers como marco, y de vez en cuando hay innovaciones como MoE o MoRe. Las grandes empresas o construyen sus propios clústeres de supercomputación o firman acuerdos a largo plazo con proveedores de servicios en la nube como AWS. Una vez resuelto el problema fundamental de la potencia de cálculo, la importancia de los datos se ha vuelto cada vez más evidente.
A diferencia de las empresas tradicionales de big data B2B, Scale AI se dedica a construir una base de datos sólida para modelos de IA. Su negocio no solo incluye la extracción de datos existentes, sino que también abarca un negocio de generación de datos a más largo plazo. La empresa también ha formado un equipo de entrenamiento de IA compuesto por expertos humanos de diferentes campos, para proporcionar datos de entrenamiento de mayor calidad a los modelos de IA.
El entrenamiento del modelo se divide en dos etapas: preentrenamiento y ajuste fino. La etapa de preentrenamiento es similar al proceso de un bebé aprendiendo a hablar, ya que requiere introducir al modelo de IA una gran cantidad de texto, código y otra información recopilada de la web. La etapa de ajuste fino, por otro lado, es similar a la educación escolar, donde generalmente hay respuestas y direcciones claras sobre lo que es correcto o incorrecto. A través de conjuntos de datos específicos, podemos desarrollar las habilidades necesarias en el modelo.
Por lo tanto, los datos requeridos se dividen en dos categorías: una categoría es una gran cantidad de datos que no requieren un procesamiento excesivo, que generalmente provienen de datos de araña de plataformas UGC como Reddit, Twitter, Github, bases de datos de literatura pública y bases de datos privadas de empresas; la otra categoría requiere un diseño y selección precisos para cultivar cualidades específicas del modelo, lo que requiere trabajo de limpieza de datos, selección, etiquetado y retroalimentación manual.
A medida que las capacidades del modelo continúan mejorando, diversos datos de entrenamiento más detallados y especializados se convertirán en factores clave que influyen en la capacidad del modelo. A largo plazo, los datos de IA también son una pista de inversión a largo plazo con capacidad de acumulación, ya que, con la acumulación de trabajo inicial, los activos de datos tendrán la capacidad de generar intereses compuestos, volviéndose más valiosos con el tiempo.
En el ámbito de Web3, surge el concepto de DataFi. Web3 DataFi tiene múltiples ventajas:
Los contratos inteligentes garantizan la soberanía, seguridad y privacidad de los datos.
Ventajas naturales de arbitraje geográfico que atraen la mano de obra distribuida global más adecuada.
Ventajas claras de incentivos y liquidaciones en blockchain
Contribuye a construir un mercado de datos "todo en uno" más eficiente y abierto.
Para los usuarios comunes, DataFi es el proyecto de IA descentralizada más beneficioso para participar. Los usuarios no necesitan firmar un contrato de fábrica de datos, solo tienen que iniciar sesión en su billetera para participar completando varias tareas simples, como proporcionar datos, evaluar modelos, realizar creaciones simples utilizando herramientas de IA o participar en el comercio de datos.
Actualmente, en el campo de Web3 DataFi ha surgido un grupo de proyectos con potencial, como Sahara AI, Yupp, Vana, Chainbase, Sapien, Prisma X, Masa, Irys, ORO y Gata. Estos proyectos se centran en diferentes áreas de servicios de datos, incluyendo la recolección de datos, la evaluación de modelos, la monetización de datos personales, la indexación de datos en cadena, entre otros.
Aunque actualmente las barreras de estos proyectos no son muy altas, una vez que acumulen usuarios y una adherencia ecológica, las ventajas de la plataforma se acumularán rápidamente. Por lo tanto, los proyectos en etapa temprana deben enfocarse en los incentivos y la experiencia del usuario. Al mismo tiempo, estas plataformas de datos también necesitan considerar cómo gestionar la mano de obra y garantizar la calidad de la producción de datos, evitando la situación en la que las monedas malas desplazan a las buenas.
Además, aumentar la transparencia también es un desafío importante al que se enfrentan los proyectos en la cadena actualmente. Cada vez más proyectos necesitan demostrar un compromiso a largo plazo que sea público y transparente para impulsar el desarrollo saludable de Web3 DataFi.
El camino de aplicación masiva de DataFi incluye dos aspectos: primero, atraer a suficientes usuarios comunes para participar en la recopilación y generación de datos, formando así un grupo de consumidores de la economía de IA; segundo, obtener el reconocimiento de las grandes empresas convencionales, ya que a corto plazo siguen siendo la principal fuente de grandes contratos de datos.
En general, DataFi representa el proceso en el que la inteligencia humana cultiva a largo plazo la inteligencia de las máquinas, al mismo tiempo que garantiza los beneficios del trabajo humano a través de contratos inteligentes, y finalmente logra que la inteligencia de las máquinas retribuya a los humanos. Para aquellos que sienten incertidumbre en la era de la IA, unirse a DataFi puede ser una elección sabia que se alinea con la tendencia.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
11 me gusta
Recompensa
11
4
Republicar
Compartir
Comentar
0/400
TommyTeacher1
· hace17h
Hermano que hace dinero, llévame a volar.
Ver originalesResponder0
FOMOmonster
· hace17h
28 ya tiene un valor de mil millones, me ha golpeado.
Ver originalesResponder0
LidoStakeAddict
· hace17h
A los 28 años, la valoración es de 29 mil millones. No puedo quedarme tranquilo.
Ver originalesResponder0
MetaReckt
· hace17h
Zack hace tanto alboroto, ¿acaso está aprendiendo de Huawei a reclutar talento?
El auge de Web3 DataFi, el potencial ilimitado de la pista de datos de IA
El potencial de la pista de datos de IA y el surgimiento de Web3 DataFi
Recientemente, el evento más llamativo en el mundo de la IA ha sido la poderosa demostración de Meta. Zuckerberg está reclutando talentos por todas partes y ha formado un lujoso equipo de IA compuesto principalmente por investigadores de origen chino. Entre ellos, Alexander Wang, de solo 28 años, se ha convertido en el líder del equipo. Wang fundó Scale AI, que tiene una valoración de 29 mil millones de dólares, y proporciona servicios de datos a varias grandes empresas de IA, incluyendo el ejército de EE. UU., OpenAI, Anthropic y Meta. El negocio principal de Scale AI es ofrecer una gran cantidad de datos de etiquetado precisos.
La razón por la que Scale AI ha logrado destacarse entre muchos unicornios radica en que reconoció temprano la importancia de los datos en la industria de la IA. La potencia de cálculo, el modelo y los datos son los tres pilares de los modelos de IA. Si comparamos un gran modelo con una persona, entonces el modelo es el cuerpo, la potencia de cálculo es la comida y los datos son el conocimiento y la información.
En el rápido desarrollo de los modelos de lenguaje grandes, el enfoque de la industria ha cambiado de los modelos a la potencia de cálculo. Hoy en día, la mayoría de los modelos utilizan transformers como marco, y de vez en cuando hay innovaciones como MoE o MoRe. Las grandes empresas o construyen sus propios clústeres de supercomputación o firman acuerdos a largo plazo con proveedores de servicios en la nube como AWS. Una vez resuelto el problema fundamental de la potencia de cálculo, la importancia de los datos se ha vuelto cada vez más evidente.
A diferencia de las empresas tradicionales de big data B2B, Scale AI se dedica a construir una base de datos sólida para modelos de IA. Su negocio no solo incluye la extracción de datos existentes, sino que también abarca un negocio de generación de datos a más largo plazo. La empresa también ha formado un equipo de entrenamiento de IA compuesto por expertos humanos de diferentes campos, para proporcionar datos de entrenamiento de mayor calidad a los modelos de IA.
El entrenamiento del modelo se divide en dos etapas: preentrenamiento y ajuste fino. La etapa de preentrenamiento es similar al proceso de un bebé aprendiendo a hablar, ya que requiere introducir al modelo de IA una gran cantidad de texto, código y otra información recopilada de la web. La etapa de ajuste fino, por otro lado, es similar a la educación escolar, donde generalmente hay respuestas y direcciones claras sobre lo que es correcto o incorrecto. A través de conjuntos de datos específicos, podemos desarrollar las habilidades necesarias en el modelo.
Por lo tanto, los datos requeridos se dividen en dos categorías: una categoría es una gran cantidad de datos que no requieren un procesamiento excesivo, que generalmente provienen de datos de araña de plataformas UGC como Reddit, Twitter, Github, bases de datos de literatura pública y bases de datos privadas de empresas; la otra categoría requiere un diseño y selección precisos para cultivar cualidades específicas del modelo, lo que requiere trabajo de limpieza de datos, selección, etiquetado y retroalimentación manual.
A medida que las capacidades del modelo continúan mejorando, diversos datos de entrenamiento más detallados y especializados se convertirán en factores clave que influyen en la capacidad del modelo. A largo plazo, los datos de IA también son una pista de inversión a largo plazo con capacidad de acumulación, ya que, con la acumulación de trabajo inicial, los activos de datos tendrán la capacidad de generar intereses compuestos, volviéndose más valiosos con el tiempo.
En el ámbito de Web3, surge el concepto de DataFi. Web3 DataFi tiene múltiples ventajas:
Para los usuarios comunes, DataFi es el proyecto de IA descentralizada más beneficioso para participar. Los usuarios no necesitan firmar un contrato de fábrica de datos, solo tienen que iniciar sesión en su billetera para participar completando varias tareas simples, como proporcionar datos, evaluar modelos, realizar creaciones simples utilizando herramientas de IA o participar en el comercio de datos.
Actualmente, en el campo de Web3 DataFi ha surgido un grupo de proyectos con potencial, como Sahara AI, Yupp, Vana, Chainbase, Sapien, Prisma X, Masa, Irys, ORO y Gata. Estos proyectos se centran en diferentes áreas de servicios de datos, incluyendo la recolección de datos, la evaluación de modelos, la monetización de datos personales, la indexación de datos en cadena, entre otros.
Aunque actualmente las barreras de estos proyectos no son muy altas, una vez que acumulen usuarios y una adherencia ecológica, las ventajas de la plataforma se acumularán rápidamente. Por lo tanto, los proyectos en etapa temprana deben enfocarse en los incentivos y la experiencia del usuario. Al mismo tiempo, estas plataformas de datos también necesitan considerar cómo gestionar la mano de obra y garantizar la calidad de la producción de datos, evitando la situación en la que las monedas malas desplazan a las buenas.
Además, aumentar la transparencia también es un desafío importante al que se enfrentan los proyectos en la cadena actualmente. Cada vez más proyectos necesitan demostrar un compromiso a largo plazo que sea público y transparente para impulsar el desarrollo saludable de Web3 DataFi.
El camino de aplicación masiva de DataFi incluye dos aspectos: primero, atraer a suficientes usuarios comunes para participar en la recopilación y generación de datos, formando así un grupo de consumidores de la economía de IA; segundo, obtener el reconocimiento de las grandes empresas convencionales, ya que a corto plazo siguen siendo la principal fuente de grandes contratos de datos.
En general, DataFi representa el proceso en el que la inteligencia humana cultiva a largo plazo la inteligencia de las máquinas, al mismo tiempo que garantiza los beneficios del trabajo humano a través de contratos inteligentes, y finalmente logra que la inteligencia de las máquinas retribuya a los humanos. Para aquellos que sienten incertidumbre en la era de la IA, unirse a DataFi puede ser una elección sabia que se alinea con la tendencia.