bigbaicai

芯方式是以开云棋牌官网在线客服人、电子工程师等电子行业相关领域从业人员为核心的知识经验学习、分享、交流社群。 凭借开放、合作、共赢的运营理念,聚集了来自国内外知名院校和顶尖科技公司的开云棋牌官网在线客服人、电子工程师。 我们致力于营造专业、认真、有温度的分享交流环境,将高质量的内容和方案成规模地生产和分享,帮助个人和团队在芯方式找到有价值的Key。 http://www.icfans.com/

物种识别AI可以从公民自然主义者拍摄的图像中获得提升

0
阅读(1160)

有一天,我们将有一个应用程序,你可以指向一个奇怪的错误或陌生的蕨类植物,并吐出属和物种。但是现在计算机视觉系统不能胜任这项工作。为了解决这些问题,研究人员已经汇集了成千上万的真人生物中常见的生物图像 - 通过研究这些图像,我们的人工智能助手可能能够掌握生物多样性。


许多计算机视觉算法都在几套大型图像之一上进行了培训,这些图像可能包含从人到家庭物品到水果和蔬菜等各种物品。对于了解许多事情来说,这非常棒,但如果您想深入研究特定主题或图像类型,该怎么办?你需要一组特殊的图像。


对于一些专业,我们已经有了:例如,FaceNet是学习如何识别或复制面部的标准设置。但是,尽管电脑在识别脸部时可能会遇到麻烦,但我们很少这么做 - 但另一方面,我永远不会记住春天在我的喂食器上着陆的鸟的名字。


幸运的是,我不是唯一有这个问题的人,多年来,iNaturalist应用程序社区一直在收集常见和不常见的动物图片以供识别。事实证明,这些图像是教导系统如何识别野外植物和动物的完美方式。

image.png


你可能认为一台电脑可以从生物学教科书,现场指南和国家地理学习中获得所需的一切。但是当我们拍摄海狮的照片时,它看起来与专业拍摄有很大不同:背景不同,背景不同,角度不完美,焦点可能关闭,拍摄中甚至可能还有其他动物。即使一个好的计算机视觉算法可能在两者之间看不到太多共同之处。


然而,通过iNaturalist应用程序拍摄的照片都是业余类型的 - 但它们也被专业人士验证和识别,这些专业人员远比任何计算机都好,即使在被遮挡,光线不好或模糊的情况下也能识别物种。芯方式


加州理工学院,谷歌,康奈尔大学和iNaturalist本身将应用数据库中超过160万张图片的一小部分放在一起,本周在盐湖城的CVPR上发布。他们认为,为了保持这个集合的健壮性,它应该有很多不同的角度和情况,所以他们搜索了至少有20个不同的人发现它们的物种。


由此产生的一套图像(PDF)仍然有超过859,000张超过5000种的图片。这些他们让人们通过在图片中的小动物周围绘制框注释,以便计算机知道要注意什么。一套图像被留出用于训练系统,另一套用于测试它。


边界框放在图像上的例子。


具有讽刺意味的是,他们可以告诉它这是一个很好的设置,因为现有的图像识别引擎的表现很差,甚至没有达到70%的猜测准确率。使图像本身非常业余且难以分析的特性使得它们作为原始数据非常有价值; 这些图片没有经过清理或设置,以使算法更容易排序。


即使是研究人员用iNat2017组合创建的系统也没有那么好。但没关系 - 找到有改进空间的地方是定义问题空间的一部分。


与其他人一样,该集合正在扩展,研究人员指出,自从开始编写数据集以来,拥有20个独立观测值的物种数量增加了一倍多。这意味着已经在开发中的iNat2018将会更大,并且可能会导致更强大的识别系统。


该团队表示,他们正在努力为该集合增加更多属性,以便系统不仅能够报告物种,而且还能报告性别,生活阶段,栖息地记录和其他元数据。如果它不能确定这个物种,它可能在未来至少会猜测它的属性或是它自信的任何分类学级别 - 例如它可能无法判断它是anthopleura elegantissima还是Anthopleura xanthogrammica,但它绝对是肯定的一只海葵。


这只是改善自然环境中计算机视觉状态的许多并行努力之一; 您可以了解更多关于持续收集和竞争的信息,这些信息会导致iNat数据集在此处出现,其他更多类别特定的挑战将在此处列出。


Baidu
map