El CTO de Microsoft Alemania, Andreas Braun, confirmó que GPT-4 va a llegar una semana tras el 9 de marzo de 2023 y que va a ser multimodal. La inteligencia artificial multimodal quiere decir que va a poder trabajar en múltiples géneros de entradas, como vídeo, imágenes y sonido.

Enormes modelos de lenguaje multimodal

La conclusión más esencial del aviso es que GPT-4 es multimodo (SEJ pronosticó que GPT-4 va a ser multimodo en el primer mes del año de 2023).

El modo perfecto es una referencia al género de entrada que (en un caso así) maneja un modelo de lenguaje grande.

Multimodal puede integrar artículo, voz, imágenes y vídeo.

GPT-3 y GPT-3.5 solo funcionaban en un método, artículo.

Según reportes de novedades alemanes, GPT-4 puede operar en por lo menos 4 métodos, imágenes, sonido (auditivo), artículo y vídeo.

Se cita al Dr. Andreas Braun, CTO de Microsoft Alemania:

“Presentaremos GPT-4 la semana próxima, allí vamos a tener modelos multimodo que van a ofrecer opciones absolutamente distintas, por servirnos de un ejemplo, vídeo…”

El informe no fue concreto de GPT-4, con lo que no está claro si lo que se compartió sobre la multimodalidad fue concreto de GPT-4 o solo generalmente.

Estrategia empresarial de Microsoft Directivo holger kenn explicó las multimodalidades, pero el informe no se encontraba claro si se refería a la multimodalidad GPT-4 o a la multimodalidad en géneros.

Pienso que sus referencias a multimodo eran concretas de GPT-4.

La novedad compartida:

«Kenn explicó qué es la inteligencia artificial multimodal, que no solo puede traducir apropiadamente artículo en imágenes, sino más bien asimismo en música y vídeo».

Otro apunte atrayente es que Microsoft trabaja en “métricas de seguridadfundamentar su inteligencia artificial con hechos para hacerla mucho más fiable.

microsoft kosmo-1

Algo que supuestamente no se informó en los EE. UU. es que Microsoft lanzó un modelo de lenguaje multimodal llamado Kosmos-1 a inicios de marzo de 2023.

Según lo informado por el lugar de novedades alemán, Heise dY:

“…el equipo sometió el modelo antes entrenado a múltiples pruebas, con excelente resultados en la clasificación de imágenes, respondiendo cuestiones sobre el contenido de la imagen, etiquetado automático de imágenes, reconocimiento óptico de artículo y tareas de generación de voz.

…El razonamiento visual, o sea, realizar inferencias sobre imágenes sin usar el lenguaje como paso intermedio, semeja ser clave aquí…»

Kosmos-1 es un modal multimodal que integra métodos de artículo y también imagen.

GPT-4 va alén de Kosmos-1 puesto que añade un tercer modo, vídeo, y semeja integrar asimismo el modo perfecto de audio.

Marcha en múltiples lenguajes.

GPT-4 semeja marchar en todos y cada uno de los lenguajes. Se le detalla como con la capacidad de recibir una pregunta en alemán y responderla en italiano.

Es un caso de muestra extraño por el hecho de que, ¿quién haría una pregunta en alemán y conseguiría una contestación en italiano?

O sea lo que se confirmó:

“…la tecnología llegó tan lejos que prácticamente “marcha en todos y cada uno de los lenguajes”: puedes realizar una pregunta en alemán y conseguir una contestación en italiano.

Con multimodo, Microsoft (-OpenAI) «completará los modelos».

Pienso que el propósito del hallazgo es que el modelo trasciende el lenguaje con su aptitud para transladar entendimientos entre lenguajes. Entonces, si la contestación está en italiano, la va a saber y va a poder ofrecer la contestación en el idioma en el que se realizó el interrogante.

Sería afín al propósito de inteligencia artificial multimodal de Google plus, llamado MUM. Diríase que la madre puede proveer respuestas en inglés para las que solo hay datos en otro idioma, como el japonés.

Apps GPT-4

No se anunció ahora mismo dónde aparecerá GPT-4. Pero se mentó particularmente Azure-OpenAI.

Google plus trata de ponerse cada día con Microsoft a través de la integración de una tecnología contendiente en su motor de búsqueda. Este avance exacerba aún mucho más la percepción de que Google plus se queda atrás y no tiene liderazgo en la inteligencia artificial orientada al cliente.

Google plus ahora está incorporando inteligencia artificial en múltiples modelos, como Google plus Lens, Google plus Maps y otras áreas donde los usuarios interaccionan con Google plus. Este enfoque radica en usar la inteligencia artificial como tecnología de asistencia para contribuir a los humanos con pequeñas tareas.

La manera en que Microsoft incorpora o sea mucho más aparente y, como resultado, recibe toda la atención y fortalece la imagen de Google plus como una compañía que pelea y tiene adversidades para ponerse cada día.

Lea el informe alemán original aquí:

GPT-4 va a llegar la semana próxima y va a ser multimodal, afirma Microsoft Alemania

Imagen cortesía de Shutterstock/Master1305

Fuente: searchenginejournal

Hashtags: #OpenAI #GPT4 #llega #mediados #marzo