IBM希望通过新的不同数据集来改善人脸识别的种族偏见

识别
  • cnbeta
  • 2018-06-28 17:19

种族识别成功率差异是面部识别中的一个大问题,研究表明,如果对象是白人和男人,商业系统会更加准确。部分原因是培训数据缺乏多样性,有色人种的出现频率低于同龄人。 IBM是试图解决这个问题的公司之一,并且今天宣布了两个新的公共数据集,任何人都可以使用它来训练面部识别系统,其中一个专门用来帮助消除偏见。

a875ea90c109987.png

第一个数据集包含100万张图像,并将帮助培训能够识别特定属性的系统,如头发颜色,眼睛颜色和面部毛发。每张脸都有这些特征的注释,使程序员更容易磨练他们的系统,以更好地区分山羊胡和其他胡须。这不是用于训练面部识别系统的最大的公共数据集,但是IBM表示包含这种标签的规模最大。

第二个数据集是更有趣的一个。它比第一张还要小,包含36,000张照片,但内部的人脸是相同的种族,性别和年龄组合。就像人脸属性标签帮助训练AI系统识别这些差异一样,拥有多种面部组合可以帮助系统克服各种偏见。这两个数据集均来自张贴到Flickr的带有Creative Commons许可证的照片,这些照片经常可以用于研究目的。

IBM的商业面部识别系统在过去被批评为存在明显的种族偏见。麻省理工学院媒体实验室2月份发表的一项研究发现,IBM识别黑皮肤女性性别的错误率接近35%,而识别白人男性错误率仅为1%。这些错误将变得越来越重要,因为面部识别系统被用于从雇用到识别犯罪嫌疑人的任务。

IBM表示正在努力改善这些错误,并且其面部识别系统的更新版本使用了更广泛的训练集(比如今天公布的那种训练集),以便将错误减少近十倍。然而,如果没有用于评估偏倚的标准化指标,要准确判断这些系统的改善程度仍然很难。


来源:cnbeta作者:编辑:jinpeng

本文链接: http://www.aiust.com/article/20180628/396.html

声明:除非注明,本站文章均为AIUST.Com原创或编译,转载时请注明文章作者和“来源:AIUST.Com”,AIUST.Com尊重行业规范,每篇文章都标有明确的作者和来源。文章为作者观点,不代表AIUST.Com立场。

相关文章

资讯

原创

荐读

热门标签