【经济日报】模式识别,行走在电脑与人脑之间

作者:余慧敏    来源:经济日报    发布时间:2014年08月18日 09:47

 

作为国家科技创新体系的重要组成部分,国家重点实验室是国家组织高水平基础研究和应用基础研究、聚集和培养优秀科学家、开展高层次学术交流的重要基地。自1984年启动国家重点实验室建设计划以来,我国已有约300个国家重点实验室投入运行。这些实验室是如何开展创新性研究的呢?

模式识别国家重点实验室是这组系列采访的第一站。它筹建于1984年,1987年正式对外开放并通过国家验收,是首批国家重点实验室之一。

打开大门

墙上挂着一幅画,有人从墙边走过,取下画框。

嘀嘀嘀!尖利的报警声响起,监控室的显示屏上,这幅画所在的监控视频从数十个视频中脱颖而出,瞬间被电脑挪至屏幕中心并放大,墙上放置画框处被加上了一闪一闪的红框,画框被人取走的那一小段镜头被反复重放。

“这可以用于博物馆画展防盗,是视频识别技术在安保领域中的应用。”中科唯实科技(北京)有限公司总经理王海滨说,“我们的核心技术来自模式识别国家重点实验室。”

随着现代社会摄像头的普及,平均一个市级城市的摄像头就有2.5万个以上,海量数据仅靠人力难以监控,必须依靠电脑辅助挖掘,智能视频分析系统的市场因此越来越大。“我们竞争的是百亿级的市场。”王海滨充满信心地说。

事实上,在这家公司成立(2012年7月)之前,模式识别国家重点实验室的视频分析与监控技术就获得过国家科技进步二等奖,在北京城铁13号线得到成功应用。13号线自2002年开通运营以后,电缆线被盗案件时有发生。2007年初,城铁13号线安装了智能视频分析系统,对每个角落进行24小时的实时监控,一接到智能系统的报警信号,安保力量就会及时出动。在几个盗贼被当场擒获之后,城铁13号线近几年就再也没有发生过类似案件了。

偷盗、打架?有异常行为分析系统。

公众场所会否发生踩踏?有人群密度监测系统。

电影中用正常视频替换掉异常视频的黑客行为怎么防范?有视频篡改检测软件。

想查明星身上的衣服包包哪里卖?有图片检索技术。

如何扩大市场并精准投放产品?可用电脑分析目标人群的行为偏好和行动规律。

实验室博士张俊格的研究方向就是图像视频分析,他对这个研究方向充满信心:“模式识别是大数据技术的核心,十几年前看不到太多应用,现在应用需求非常大。”

“数据本身没价值,挖掘数据中的模式才有价值。大数据时代,模式识别很重要。”中科院院士谭铁牛表示,几十年前国家就在这个方向设立重点实验室,具有超前的战略眼光。

坚持国际水准

模式识别实验室的国际范儿很浓厚:早在1997年就成立中法联合实验室,后来扩展成中欧联合实验室;早在2001年就有一位来此做博士后、后来成为实验室正式员工的法国女士普林特申请到我国的国家基金项目,成为外籍科学家申请国内科研项目的第一人;有19人次担任模式识别领域一些重要国际学术组织的职位。

频繁的国际交流与合作,昭示了模式识别实验室坚持国际水准的雄心壮志。要建设世界一流实验室,“顶天”的国际水准和“立地”的成果应用缺一不可。

虹膜识别,就是实验室中非常有代表性的一个“顶天立地”的技术。

虹膜是人眼瞳孔和眼白之间的环状组织,包含了丰富的纹理信息,是人体中最独特的结构之一。虹膜识别技术是目前精确度最高的生物识别技术。

模式识别国家重点实验室的虹膜识别技术在国际上名列前茅。眼睛半睁,可以识别;戴上美瞳片,可以识别;甚至3米远看一眼,也能识别……实验室的虹膜识别技术参加国际比赛,连续排名第一。这个领域最顶尖的刊物上,关于虹膜识别的文章,近一半出自这个实验室。他们提出了自己的基础理论,掌握了数据源头,参与制定国际标准,并有成功的产业化实践。

实验室建成的虹膜图像数据库是国际上目前规模最大、使用最广的共享虹膜图像数据库,有来自100多个国家和地区的8000多个研究团队使用。美国国家标准研究院曾在公开报告中表示,中科院自动化所发布的虹膜图像数据库推动了国际虹膜识别研究的发展。

如今,实验室自主研制的人脸识别和虹膜识别技术已经成为国产生物特征识别产品的核心技术来源,有11项虹膜识别专利的所有权成功转让给北京中科虹霸科技有限公司。在2006年成立这家公司之前,中国虹膜识别的市场都被日本松下、韩国LG垄断,国产技术推出之后,打破国外垄断,产品价格至少下降了三分之二,中科虹霸公司如今已占据了国内80%以上的虹膜识别市场份额。

实验室的虹膜识别技术不仅占据国内市场,还通过技术授权在国际上首次大规模实际应用于银行ATM机。

寄望基础创新

如今,实验室做出的包括人脸识别和虹膜识别技术在内的新一代生物特征识别系统,已在奥运会、世博会、海关、银行、军队、公安、煤矿等领域取得实际应用。

作为国家重点实验室,模式识别实验室还建立了人脸数据库(2D和3D)、虹膜数据库、掌纹数据库、语音语料数据库、步态数据库、手写文字数据库等15个大型数据库,并免费提供学术界共享。这么多数据库,其实也反映了模式识别研究领域的复杂性。

作为信息科学和人工智能的重要组成部分,模式识别牵涉的学科很多,与数学、统计学、心理学、语言学、计算机科学等都有关系;它研究的对象更多,要让计算机会看、会听、会说、会思考,就要让电脑像人脑那样分析和识别文字、图像、视频、音频……

在如此纷繁的头绪中,实验室的重点发展方向是什么呢?

刚刚就任模式识别国家重点实验室主任的中科院自动化所研究员刘成林表示,实验室未来的主要研究领域和研究方向不变,即模式识别基础、图像处理与计算机视觉、语音语言信息处理。“我们在部分方向上,如虹膜识别、文字识别、机器翻译是领先的,这些我们还将继续保持。在模式识别基础理论方面,如机器学习、视觉计算基础等,我们有一些零散的成果,但没有形成大的学术影响,还需要重点投入力量开展原创性研究。”

在模式识别领域,各种识别问题的核心都是模式分类。目前模式分类的基本理论和方法,主要有统计分类器、神经网络、支撑向量机、Boosting、稀疏表示等,这些国际上常用的模式识别理论和方法大多为国外科学家首先提出。

“新的理论方法有可能提高所有模式识别任务的准确率,并在国际上产生重大学术影响,我们现在缺乏这方面的工作。”刘成林说,要产生这样的成果,需要吸引这方面最好的人才,给予稳定的支持。“至少稳定10年以上,就可能出很好的东西。我们考虑将国家重点实验室的专项经费向基础理论研究倾斜。”

术有千变,道法归一。我们期待着,模式识别实验室能早日实现基础理论的突破,实现电脑与人脑之间的无缝衔接。