脸书更新了其自动替代文本(AAT)系统,该系统用于为视觉障碍者生成自动照片描述。脸书表示,其AAT系统现在可以识别比以前多10倍的照片,并且可以识别照片中的更多细节。
脸书在2016年推出了AAT,此后一直在用新功能改进其技术。以前,照片描述是“照片”这个词和分享者的名字。在最新的更新中,脸书的AAT可以提供更详细的描述,比如识别活动、地标、动物类型等等。
脸书还引用了一个照片的例子,说:“可能是两个人在户外,比萨斜塔上自拍。”它还可以包含照片中元素的位置和相对大小等信息。脸书的AAT现在可以说出照片中人物的确切位置,而不仅仅是照片中的人数。还进行了改进,突出照片中较大的对象作为主要对象。它补充说,ATT仍然在每个描述中使用“可能是”,因为其中可能有错误。
“AAT在默认描述中使用简单的词语,而不是冗长的句子。这不是诗意,但很有力量。我们的用户可以快速阅读和理解说明,并进行翻译,因此所有替代文字说明都可以用45种不同的语言提供,从而确保AAT对全世界的人都有用。”在脸书的博客中解释道。
脸书的AAT现在可以识别1200多个概念,是其原始模型的10倍。