微软用AI为Word和PPT增加解读图像能力，让盲人也能“看”图

转载时间：2022.10.30（原文发布时间：2016.12.03）

135

转载作者：36氪企服点评小编

阅读次数：135次

对于盲人来说，辅助性技术对电脑使用起到了关键作用。比如，TTS（文本转语音）技术对盲人就很关键，这让他们可以阅读文章。但是媒体不仅仅是由文字构成的，图像也是很重要的一部分。而图像和视频在数字世界中正日益占据着更显著的位置。视力受损者看不到这部分内容实在是一件憾事。不过微软正在为他们弥补这一遗憾，近日Office 官方博客宣布，已经增强了该办公套件的辅助选项功能，其中就包括利用人工智能来描述Word和PowerPoint文档中的图像，让盲人也能“看”到图片的内容。这些新特性将会在2017年初正式推出，Office 365订户可以在PC版的Word和PowerPoint先睹为快。

PPT或Word的图片原来都有一项Alt Text（可选文字，右键图片—设置图片格式—可选文字可以设置）功能，通过它可以设置图片的标题和描述，目的就是为了让视力或者认知能力存在障碍的人能理解图片而设计的。遗憾的是，绝大部分人都不会输入这部分的信息。而对于盲人来说，可选文字其实应该是必选的。

微软用AI为Word和PPT增加解读图像能力，让盲人也能“看”图

为了改变这一现状，微软决定自动完成这个图片描述的过程。其解决方案是利用自己的认知服务计算机视觉（Cognitive Services Computer Vision）API，通过这项API将图片自动用文字描述出来，文档作者只需右键点击图片然后勾选“自动完成可选文字（Automatic Alt Text）”即可。该API就会自动对图片做出描述，然后再由屏幕阅读器把图片标题和描述读出来。

微软的图像识别技术为深度学习技术，它可以识别图片当中的对象，然后想出最适当的文字来表述整幅图像。鉴于这项技术背后采用的是机器学习技术，所以使用这项功能的人越多，其表述能力就会越强。

除了微软以外，Google、Facebook、苹果、Twitter等也都开发了类似的图片描述技术。比如Facebook就利用了类似技术给用户分享的图片添加标题，这样盲人用户通过iPhone手机浏览新闻流时，内嵌的VoiceOver屏幕阅读器就会把图片的标题读出来，帮助盲人用户更好地理解相关内容。

本文由「 boxi 」原创出品，转载或内容合作请点击转载说明；违规转载必究。

寻求报道。

[免责声明]

资讯标题：微软用AI为Word和PPT增加解读图像能力，让盲人也能“看”图

资讯来源： 36氪官网