世界植物图片搜索引擎上线

  我们日常使用的图片搜索引擎,功能强大,似乎什么都能搜,但是在搜索植物时往往有很大局限性,国内搜索引擎搜索国外的植物很难,国外的搜索引擎国内不好用,尤其使用中文名作为关键词搜索时,经常会出现大量与关键词不相关的结果,这是由于植物中文名称和日常交流使用的中文不同,是自成体系的。比如搜索“夜花”,搜索引擎会把关键词理解为“晚上+花”,所以搜索结果大多不是“夜花”这种植物。

图1 某搜索引擎搜索“夜花”的结果

  在地球大数据科学工程专项支持下,研究人员专门设计了一款植物图片搜索引擎(搜索入口:https://espc.cubg.cn/photos/index),按照一定规则为全球植物图片建立索引,可以用中文名或者学名快速搜索相关照片,并连接至图片所在网页。目前已为12.7万个种(占全球植物种数的约1/3)和1.1万个品种的植物建立了图片索引,其中4.3万种可以检索到10张以上的图片,这些图片来自180个国家或地区。

图2 索引图片来源

  中国植物园联盟是按照自愿参加的原则建立的我国植物园(包括树木园、药用植物园等)之间开展战略合作的公益性组织,旨在通过联盟这一平台的桥梁纽带作用,发挥各方优势,推进我国植物园的规范化建设和有序发展,完善植物园布局,加强植物园间物种资源、信息的共享与人员技术交流,促进中国植物园体系建立和创新能力的提升,服务于生态文明发展和创新型国家建设。

主要功能: 1. 任意等级搜索 搜索引擎可以实现“超目-目-亚目-总科-科-亚科-超族-族-亚族-属-种”任意级别学名或中文名搜索,种以上级别的中文名以多识植物百科(http://duocet.ibiodiversity.net/)为准,需完全匹配,搜索物种级别时,可以是任意与植物名称相关的关键词,如学名或俗名。除了植物外,还可以搜索动物、真菌等其他生物,搜索方法同植物。此外,索引还收录了大量植物园景观图片,供植物园同仁互相学习。

图3 关键词“玉凤花亚族”搜索结果

图4 关键词“蛱蝶科”搜索结果

图5 关键词“日内瓦植物园”搜索结果

  2. 按关联度排序 搜索物种级别时,与关键词越相关的图片排序越靠前,比如搜索“荷花”,最先出现的结果是莲(Nelumbo nucifera)这种植物,其次出现俗名中带“荷花”的植物,比如姜荷花、荷花木兰等。

图6 关键词“荷花”搜索结果

  3. 关键词自动修正 平台有一套完整的异名、接受名系统,并且可以随时根据最新研究文献进行修订,被平台加入索引的图片,无论原始鉴定是否为异名,显示时均可自动转换为平台的接受名,比如搜索“Magnolia denudata”,显示结果为“Yulania denudata“,这些结果里包含了被鉴定为“Magnolia denudate”或“Yulania denudata“的图片。部分常见错误也能自动修正,比如搜索“白芍兜兰”会自动修正为“白旗兜兰”。

图7 关键词“Magnolia denudate”搜索结果自动修正

  4. 进一步查看信息 点击目标图片后,可进一步查看大图、拍摄时间、拍摄地点、科属等信息,直接点击缩略图右下方的红色字体或者大图左下方的版权信息,可以跳转至图片出处。点击学名后进入物种详情页面,可以进一步查看该物种的其他信息,如野外受威胁现状、哪些植物园有栽培、用途、描述、分布、物候信息等等。

图8 点击目标图片后的显示情况

图9 物种详情页面