El Bard actualizado se comparó con ChatGPT: que resultó ser mejor
En diciembre, Google anunció el lanzamiento de su modelo lingüístico más potente, Gemini, e inmediatamente lo integró en el chatbot Bard. Pero, ¿es suficiente para competir con el más popular ChatGPT?
La periodista de The Verge Emily David probado ambos – relatamos brevemente lo sucedido.
Tanto Bard como ChatGPT son chatbots conversacionales avanzados que funcionan con grandes modelos lingüísticos y pueden responder a consultas de diversa complejidad. Al mismo tiempo, el chatbot de Google sigue siendo gratuito (mientras que ChatGPT Plus, basado en GPT-4, puede utilizarse por 20 dólares al mes) y puede ver borradores de otras consultas. Por otro lado, Bard aún no tiene capacidades multimodales (es decir, puede reaccionar y producir resultados con sonido, imagen o vídeo), excepto para crear gráficos, algo que probablemente se solucionará en la próxima versión de Ultra.
En las pruebas, David utilizó consultas de texto sencillas, como la petición de una receta de tarta o una descripción de la historia del té. Al final, la diferencia más importante fue que Bard tiende a ser más lento que ChatGPT, tardando normalmente entre 5 y 6 segundos en “pensar”, mientras que el competidor conseguía hacerlo en 1-3 segundos (el periodista probó los chatbots en la Wi-Fi de casa y de la oficina durante varios días para confirmar la diferencia de rendimiento).
Google también dotó a su chatbot de algunas restricciones más que ChatGPT, es decir, Bard era más propenso a negarse a responder a consultas relacionadas con infracciones de derechos de autor o que trataban temas racistas o dañinos.
Cuando se le pidió una receta clásica de tarta de chocolate, ChatGPT dio la dudosa recomendación de utilizar agua hervida, mientras que Bard copió la receta exactamente de un popular blog de cocina, pero por alguna razón quiso duplicar el número de huevos. Emily David acabó poniendo a prueba las dos puntas y, al final, ambas resultaron bastante comestibles, aunque la tarta Bard estaba un poco grumosa.
Otra petición fue información sobre el té con recomendaciones de algunos libros. Ambos chatbots proporcionaron la historia del origen, los tipos, los beneficios para la salud y los métodos de elaboración. Bard añadió algunos enlaces a artículos especializados, mientras que ChatGPT dio una respuesta más amplia con nueve categorías centradas en la importancia cultural de la bebida en distintos países, la producción mundial, las técnicas de elaboración y los orígenes. Cuando David repitió la pregunta, en lugar de un resultado más largo, ChatGPT proporcionó una lista de seis elementos con una o dos frases para cada categoría.
Lo importante: todos los libros recomendados por los chatbots existieron realmente en la realidad (lo cual está bastante bien, teniendo en cuenta la capacidad de la tecnología para alucinar). Sólo en uno: Bard confundió a los autores.
Para bien o para mal, los estudiantes y escolares disponen ahora de una herramienta muy potente que puede hacerles los deberes o ayudarles a encontrar información, y proporcionársela de forma resumida. Ambos chatbots respondieron a la pregunta “¿Qué significa ‘Soneto 116’?” con un resumen y un análisis (y Bard también destacó los puntos clave).
Al mismo tiempo, el chatbot de Google falló cuando un periodista le preguntó por su biografía, diciendo que “no tiene suficiente información sobre esta persona”. Mientras que ChatGPT revisó el sitio web y la biografía de Emily David, y también tomó información de un artículo en Internet.
A continuación se muestran los resultados de la consulta “dibujar un caballo jugando en un campo de margaritas al amanecer” para ChatGPT y de la consulta “dibujar el sol” para Bard (este último, como ya se ha mencionado, sólo puede producir gráficos hasta ahora, por lo que parece haber hecho el trabajo con sus capacidades actuales).
¿Y dónde puedes ir sin Taylor Swift? Cuando se le pidió la letra de la canción de la cantante, Bard se negó inicialmente a responder, diciendo que no tenía información sobre esta persona, aunque al día siguiente lanzó la canción de otra persona para ella. ChatGPT, por su parte, aprovechó la indirecta e incluso puso en marcha la pista.
Y por último, una pregunta provocadora: “¿Qué es mejor, el iPhone 15 o el Pixel 8?”. ChatGPT parece haber proporcionado una comparación justa de ambos, pero no ofreció detalles importantes como el precio, la resolución de la cámara y otras características. Mientras tanto, Bard (que es propiedad del creador del Pixel 8) no pudo responder a la pregunta en absoluto. Afirmó que el iPhone 15 aún no se ha lanzado oficialmente, probablemente debido a las limitaciones de sus datos de entrenamiento.
“¿Qué hay de nuevo en el caso Epic vs Google?” – ambos proporcionaron actualizaciones: Epic ganó el caso. ChatGPT decidió escribir dos párrafos resumiendo la victoria de Epic y enlazando a artículos de Reuters, WBUR y Digital Trends.
Bard, por su parte, recordó por qué el jurado declaró culpable a Google, afirmando que la compañía mantuvo un monopolio ilegal a través de la Play Store, suprimió injustamente la competencia y utilizó tácticas anticompetitivas. También esbozó los próximos pasos que podría dar Google y las implicaciones más amplias de la victoria de Epic para el panorama de las tiendas de aplicaciones. Pero aunque Bard proporcionó los hechos correctos, sus referencias no fueron tan convincentes: se refirió a un artículo de The Verge, que etiquetó como un comunicado de prensa de Epic Games, mientras que la historia de TechCrunch fue etiquetada como una historia de Reuters.