Facebook发布了新工具AAT 盲人也可以“看到”图片
Facebook新发布了一个工具——自动选择文本,通过物体识别技术识别图像内容并读出相关文本,帮助盲人和视力障碍者“看到”网站上的图片。这个工具由Facebook的无障碍小组研发,他们已经在这一项工具的研发上花费了几个月的精力。
Facebook的AAT工具已经经过了上百万样本的测试,技术基于类神经网络,这种网络基于上亿的参数,也是一种机器学习模型。不过简而言之,类神经网络运用到Facebook的AAT工具上,作用类似于图像识别系统。
MattKing是Facebook的首个盲人工程师,谈及AAT工具的时候他说:“研发AAT的时候我们主要考虑的是有多少信息是视觉性的,难点是,通常用户发布图片的时候会对图片做个相关评价或者说点别的,他们并不会很直白地描绘图片上到底有什么东西。对于像我这样的来说,我很想知道图片到底是什么,关于这张图片的评论是什么?”
在AAT推出之前,人们使用的是一些屏幕阅读器,在Facebook上使用只能读出人们发布的文本,AAT的改进是,通过物体识别技术,使用者可以听到图片可能包含的内容,比如图片中有多少个人、他们的表情和他们在室外还是室内。
AAT工具目前可以自动分辨图片的几个大类信息:交通、自然、体育、食物,在描述性判断描述方面,AAT暂时可以识别出“婴儿”、“眼镜”、“微笑”、“珠宝”和“自拍”等等。
现在用户可以在iOS系统使用AAT功能,但语言设定暂且只有英文,Facebook解释说这是根据用户需求暂定的。Facebook承诺会尽快在其他平台上线AAT功能并扩展它的语言范围。
你也可以测试一下实际效果,根据Facebook发布的AAT工具视频介绍,这个工具对下列几张示例图片是这么描述的“树、天空、户外”、“披萨、食物”、“两个人、微笑、太阳镜、户外、水”,不看图只听AAT描述的话,你的想象离实际图片有多远呢?