La puerta de entrada a la próxima generación de terminales superinteligentes: formada por la fusión de grandes modelos de IA y tecnología AR

en 4 jun 2024

La llegada de la era de la IA nunca ha sido más segura. El espacio para la imaginación del público y de la industria se está desplazando hacia las formas específicas de terminales inteligentes de próxima generación.


PC, portátiles, tablets, smartphones, sistemas de coche, relojes... ¿Serán estos terminales actuales la base de los dispositivos del futuro? Y en la era de la IA, ¿podremos realmente lograr el Internet de todo?


En medio de los avances inteligentes aportados por la tecnología de modelos grandes, están comenzando a surgir las puertas de enlace de interacción de próxima generación.

La evolución de la interacción hombre-máquina sigue un camino claro. Si bien la "interacción cerebro-computadora" a menudo se considera el objetivo final, sigue siendo en gran medida una fantasía. Desde el almacenamiento en cinta perforada hasta el mouse y el teclado, y ahora hasta las pantallas táctiles, la interacción humana con las máquinas ha sido en gran medida pasiva. Sin embargo, con la llegada de las interacciones multimodales, como el reconocimiento de voz, imagen y gestos, avanzamos hacia que las máquinas comprendan activamente a los humanos.


Las tecnologías digitales que respaldan estas interacciones muestran una tendencia similar. Los hitos de la IA, como la cibernética, la PNL y el aprendizaje profundo, marcan el camino de la IA hacia una mejor comprensión del mundo. Con la IA generativa, hemos llegado a una etapa en la que la IA no sólo percibe y comprende, sino que también crea.
Los dispositivos de interacción hombre-máquina están limitados por el desarrollo de tecnologías como la IA. Sin embargo, ya podemos vislumbrar las formas futuras de estos terminales. Tradicionalmente, el hardware evoluciona actualizando las formas existentes; por ejemplo, de teléfonos a teléfonos inteligentes y de relojes a relojes inteligentes.
Los futuros terminales inteligentes, o hardware de IA, tendrán la forma de sus productos dictados por métodos de interacción, alineándose con las experiencias mejoradas que brindan las nuevas tecnologías.

Actualmente, la actualización del hardware inteligente existente, como AIPC y AI Phones, enfrenta varios problemas. En la industria de las PC, el control del hardware está dominado por unos pocos gigantes, y la innovación está impulsada por fuerzas ascendentes. De manera similar, las mejoras de software y sistemas suelen ser actualizaciones incrementales de estos gigantes, lo que lleva a una innovación inconsistente entre hardware y software.


En la industria de los teléfonos inteligentes, la innovación se ha estancado y la IA se considera un nuevo punto de crecimiento más allá de las funciones de imágenes y las especificaciones de hardware. Sin embargo, esto mejora principalmente la capa de aplicación en lugar de introducir formas de productos verdaderamente nuevas.


El hardware de IA nativo, como los AI Pins, aún se encuentra en las primeras etapas y las experiencias están lejos de estar maduras. En consecuencia, las gafas inteligentes, como forma tradicional evolucionada, se consideran una dirección prometedora. Empresas como Pico, Bird, Microsoft y Apple están explorando auriculares AR, VR y XR, que se parecen cada vez más a gafas.

Específicamente, en términos de interacción, la distribución optimizada de grandes modelos de IA puede brindar a los usuarios una experiencia más natural. Esto incluye interacciones en tiempo real de menos de 2 segundos y una precisión de activación de voz superior al 99%. Aprovechando agentes de IA especializados, estos modelos ofrecen interacciones rápidas y de alta calidad.
Emocionalmente, los grandes modelos de IA ofrecen más que respuestas frías de máquinas.

Capacidades como la clonación de voz emocional permiten a la IA comprender y reconocer emociones, entablar conversaciones profundas basadas en preferencias y utilizar agentes de IA para abordar problemas específicos, proporcionando una compañía más conectada emocionalmente.


En los mercados verticales al aire libre, los grandes modelos de IA multimodales ofrecen servicios más precisos. Los datos de lugares turísticos, rutas escénicas específicas y cocinas locales pueden transformar funciones básicas como navegación, recomendaciones y guías en experiencias con gafas AR en tiempo real, como recorridos dinámicos y comentarios basados ​​en la ubicación.
Sin embargo, esta no es la forma definitiva. Las gafas AR representan un concepto y una dirección, pero no son el resultado final.


Esto puede verse como una evolución de las gafas inteligentes AR a las gafas AI, que sirven como un portador de IA contemporáneo.