Nota: Las descripciones de imágenes enriquecidas del Narrador están disponibles en vista previa a través del Programa Windows Insider.
Las descripciones de imágenes del Narrador proporcionan descripciones detalladas del contenido visual, como imágenes, gráficos, diagramas, botones sin etiqueta y mucho más. Las descripciones de imágenes enriquecidas permiten a los usuarios invidentes comprender el contenido visual a través del contexto detallado. Esta característica está disponible actualmente en equipos Copilot+ con tecnología de Snapdragon en el Programa Windows Insider. Otros dispositivos Windows seguirán usando la experiencia de descripción de imagen estándar, que se basa únicamente en servicios en línea.
El Narrador usa modelos de IA para proporcionar descripciones textuales detalladas de imágenes, gráficos y gráficos. Cuando narrador está activado, puedes presionar la tecla Narrador + Ctrl + D para obtener una descripción de la imagen o elemento en el que te centras.
Por ejemplo, la descripción de una imagen de un vivero sería:
La imagen representa una gran disposición organizada de pequeñas plantas de hoja verde que probablemente son brotes o plántidos organizados en un patrón de cuadrícula densa y ordenada. Cada planta está contenida dentro de un pequeño recipiente negro poco profundo que sugiere un vivero o una instalación de plantación. Las plantas están espaciadas uniformemente creando una apariencia uniforme y ordenada que puede simbolizar la organización del crecimiento o una colección. Los recipientes negros proporcionan un marcado contraste con los brotes verdes que resaltan el enfoque en las plantas.
Las descripciones de imágenes del Narrador están diseñadas para proporcionar descripciones textuales del contenido visual para personas ciegas o con deficiencias visuales. Las descripciones están pensadas para mejorar la comprensión de las imágenes, los gráficos y los gráficos, y admitir la accesibilidad. Puede regenerar la descripción de la imagen y puede copiar la descripción para futuras referencias.
Para garantizar la calidad de las descripciones generadas por el Narrador, se creó un conjunto de datos que incluye varios tipos de imágenes. Estas imágenes incluían fotografías naturales, gráficos, capturas de pantalla e interfaces de usuario de aplicaciones. Las descripciones generadas se evaluaron para la precisión, integridad, relevancia y utilidad. Se utilizaron varios métodos de evaluación, incluidos los juicios de expertos humanos y la puntuación asistida por LLM, para encontrar áreas para mejorar la calidad de las descripciones generadas.
Microsoft se compromete a crear inteligencia artificial responsable por diseño. Nuestro trabajo está guiado por un conjunto básico de principios: equidad, fiabilidad y seguridad, privacidad y seguridad, inclusividad, transparencia y responsabilidad. Cómo proporcionar comentarios sobre las descripciones de imágenes en el Narrador?
El Narrador puede proporcionar una descripción de imagen inexacta, datos en gráficos o deducciones emocionales. Esto puede dar lugar a suposiciones incorrectas sobre una imagen o la intención de contenido visual en función de la descripción generada. Seguimos trabajando en los modelos que el Narrador usa para mejorar la calidad de las descripciones de imagen proporcionadas. ¿Puedes enviar comentarios mediante cualquiera de los métodos descritos enEsta característica no debe usarse para:
-
generar descripciones de imágenes médicas o relacionadas con la salud que podrían interpretarse incorrectamente como consejos médicos. Las descripciones incorrectas podrían provocar desinformación y decisiones potencialmente perjudiciales para los usuarios.
-
generar descripciones de imágenes en documentos legales o financieros en los que la precisión es crítica. La interpretación incorrecta de tales imágenes podría conducir a disputas legales o pérdidas financieras
-
generar descripciones de imágenes que contengan símbolos culturales o religiosos sin un contexto adecuado. Una interpretación incorrecta podría llevar a una insensibilidad u ofensa cultural.
-
generar descripciones de imágenes que contengan mapas, marcas o globos terráqueos. La interpretación incorrecta de estas imágenes podría dar lugar a desinformación e implicación en asuntos internacionales.
Para obtener una descripción de imagen cuando el Narrador está activado, presiona la tecla Narrador + Ctrl + D mientras te centras en el contenido visual. Para desactivar las descripciones de imágenes en el Narrador, vaya a Configuración > Accesibilidad > Narrador > Obtener descripciones de imágenes, títulos de página y vínculos populares y seleccione el botón de alternancia.
Puede haber imprecisiones en las descripciones que proporciona el Narrador. Para mejorar la calidad de las descripciones, puede proporcionar comentarios mediante:
-
Seleccionar el icono de pulgar hacia arriba o hacia abajo en una descripción de imagen en la interfaz de usuario del Narrador.
-
Responder a mensajes ocasionales de Windows que te pidan valorar o proporcionar comentarios por escrito sobre el producto o los servicios que usas.
-
Abre el Centro de opiniones para encontrar comentarios similares para votar a favor o enviar nuevos comentarios rellenando el formulario.
Compromiso de Microsoft con la inteligencia artificial responsable y la privacidad
Microsoft ha estado trabajando para avanzar en la inteligencia artificial de forma responsable desde 2017, cuando definimos por primera vez nuestros principios de inteligencia artificial y, posteriormente, pusimos en funcionamiento nuestro enfoque a través de nuestro Estándar de inteligencia artificial responsable. La privacidad y la seguridad son principios básicos a medida que desarrollamos e implementamos sistemas de inteligencia artificial. Trabajamos para ayudar a nuestros clientes a usar nuestros productos de inteligencia artificial de forma responsable, compartir nuestros aprendizajes y crear asociaciones basadas en la confianza. Para más información sobre nuestros esfuerzos de IA responsable, los principios que nos guían y las herramientas y capacidades que hemos creado para garantizar que desarrollamos la tecnología de IA de forma responsable, consulte IA responsable.
La descripción de imagen enriquecida del Narrador está diseñada para mejorar la accesibilidad para usuarios ciegos y con deficiencias visuales y no está pensada para un público más amplio. Los modelos de IA para esta característica usan indicaciones contextuales en toda la imagen, incluidas las personas o entidades en segundo plano, que es cómo los modelos pueden asociar la imagen a un individuo o describir emociones. Las descripciones de imágenes enriquecidas del Narrador permiten inferencias emocionales, pero no usan datos biométricos. Cualquier procesamiento que devuelva resultados que identifiquen a un individuo o deduzcan la emoción de un individuo no es el resultado del procesamiento de la cara, como el reconocimiento facial, la generación y comparación de plantillas faciales. Por ejemplo, si una imagen contiene una foto de un atleta popular que usa la camiseta de su equipo y su número específico, los modelos pueden devolver un resultado que pueda identificar a la persona en función de esas indicaciones contextuales.
Esta característica no debe utilizarse para deducir las emociones de las personas físicas en el lugar de trabajo o en instituciones educativas (por ejemplo, empleados o estudiantes). La descripción de la imagen del Narrador puede proporcionar descripciones de texto detalladas relacionadas con las emociones percibidas de las personas en las imágenes. Los procesos subyacentes a la emoción humana son complejos y existen diferencias culturales, geográficas e individuales que influyen en la forma en que podemos percibir, experimentar y expresar emociones. Las respuestas relacionadas con las emociones de las personas en las imágenes se basan en cómo aparecen y puede que no indiquen necesariamente el estado interno de las personas individuales.
Fecha de publicación: 11 de febrero de 2025
Última actualización: 11 de febrero de 2025