Cómo se compara el nuevo modelo de IA Claude 3 de Anthropic

0
14


La nueva inteligencia artificial (IA) de Anthropic Claude 3 modelos vencen a sus competidores en muchas áreas, dijeron los expertos a PYMNTS.

La empresa, que liberado los modelos el lunes (4 de marzo), afirma que Claude 3 Opus, el más avanzado entre los nuevos modelos, superó tanto al GPT-4 de OpenAI como al Gemini Ultra de Google en las evaluaciones de referencia de la industria. Las evaluaciones cubrieron áreas como conocimiento a nivel universitario, razonamiento a nivel de posgrado y matemáticas básicas.

Los nuevos modelos significan la competencia cada vez más intensa entre las empresas de IA para hacer avanzar sus tecnologías en un sector cada vez más candente.

“Claude supera al GPT-4 en casi todos los aspectos” Richard Gardnerdirector ejecutivo de una empresa de consultoría tecnológica Módulodijo a PYMNTS en una entrevista.

“Sin embargo, creemos que la capa de alineación de Claude es demasiado restrictiva. Dicho esto, la capa de alineación de GPT-4 también se está volviendo demasiado restrictiva”, dijo, y agregó que prefiere usar modelos de código abierto.

Nuevas características de Anthropic

Las nuevas herramientas de IA de Anthropic dentro de la familia Claude 3 se llaman Opus, Sonnet y Haiku. Los modelos Sonnet y Haiku son más sencillos y económicos que Opus. Sonnet y Opus están disponibles en 159 países y Haiku se lanzará pronto, dijo Anthropic. La compañía no ha compartido cuánto tiempo o cuánto costó desarrollar Claude 3, pero mencionó que compañías como mesa de aire y Asanas ayudó a probar los modelos.

Soneto también está disponible en Roca Amazónicacon planes de que Opus y Haiku estén disponibles en la plataforma en unas semanas.

Por primera vez, Anthropic permite a los usuarios analizar diversos tipos de datos, incluidas imágenes, gráficos y documentos, a través de su nueva función de soporte multimodal.

Las pruebas muestran que Claude 3 es mejor creando código fuente en comparación con otros modelos. Caleb Mooreel cofundador y director de tecnología de una empresa de software darwinio, dijo a PYMNTS en una entrevista.

“Otros factores comunes son la comparación del razonamiento (la capacidad de llegar a una conclusión lógica basada en información interrelacionada que se le proporciona), así como la profundidad del conocimiento ya codificado en el sistema que puede utilizar”, añadió.

Comparar modelos de IA puede ser complicado, Ilia Badeevjefe de ciencia de datos de Grupo Trevoluciónuna empresa de servicios de viajes que utiliza IA, dijo a PYMNTS en una entrevista.

“La gente a menudo confía en pruebas públicas para comparar, pero estas pruebas son bastante abstractas y es posible que no siempre reflejen escenarios del mundo real”, dijo Badeev. “El hecho de que un modelo sobresalga en algunas pruebas no significa que será perfecto para sus tareas específicas”.

Elegir modelos de IA

Un punto importante a considerar al elegir un modelo de IA es el costo, señaló Badeev. Por ejemplo, Claude 3 Opus le costará $75 por un millón de tokens, significativamente más que GPT-4 Turbo, con un precio de $30 por el mismo volumen.

Gardner dijo que casi cualquier modelo se puede ajustar para admitir un caso de uso empresarial específico. Algunos modelos pueden ser mejores que otros para tareas particulares, pero eso se debe principalmente a ajustes, señaló, citando aplicaciones diseñadas específicamente para gestionar notas clínicas o para ayudar a los trabajadores de la salud.

Las empresas deben elegir un modelo de IA en función de la precisión, la velocidad, la privacidad, la facilidad de implementación o mantenimiento y el costo, dijo Gardner, y agregó que los modelos de código abierto brindan a los usuarios más privacidad.

Para los escritores creativos, las capacidades de GPT-4 para generar texto podrían ser más útiles, Michal Oglodekdirector de tecnología de Ivy.aidijo a PYMNTS en una entrevista. Por otro lado, si un usuario busca precisión y mantener la coherencia de la marca, Gemini 1, con su enfoque en la veracidad y la seguridad, podría ser la opción preferible. Y para los usuarios que necesitan gestionar consultas complejas con precisión, Claude 3 podría ofrecer ventajas.

“Siempre que sea posible, pruebe los modelos directamente en su aplicación”, dijo Oglodek. “Los puntos de referencia son informativos, pero el uso en el mundo real proporciona la imagen más precisa”.

Para conocer toda la cobertura de PYMNTS AI, suscríbase al diario Boletín de IA.



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here