腾讯优图黄飞跃:视觉识别之路,被质疑的成长,短暂的迷茫

时间:2024-11-03 分类:
黄飞跃回顾这4年,项目曾经受到质疑,也陷入无目标、短暂迷茫状态,从人才缺乏、数据不足、品牌无存、场景不明到现在的柳暗花明,他觉得“产品有价值”是核心。

腾讯优图团队是从事视觉识别研发和应用的团队,从2012年总共5号人的小团队发展到现在接近100号人的实验室,已经走过4年。黄飞跃回顾这4年,项目曾经受到质疑,也陷入无目标、短暂迷茫状态,从人才缺乏、数据不足、品牌无存、场景不明到现在的柳暗花明,他觉得“产生价值”是核心。

黄飞跃博士定位腾讯优图实验室做国际顶级的人工智能实验室,4年来,将人脸检测、五官定位、人脸识别、人脸核身、图像理解技术落地于滴滴代驾司机身份核实、公安刑犯追逃、人脸识别门禁、南宁公安电子身份证等场景。

基于腾讯自营项目(QQ空间、微众银行、广点通、腾讯云)和腾讯投资项目(滴滴出行、微影时代、京东)的服务需求,腾讯优图团队的任务就包括利用AI技术,提高腾讯系产品的竞争力

优图团队的战略路线是:首选腾讯标杆项目,让视觉识别算法不断优化,沉淀技术和产品化,再通过腾讯云平台将技术开放给中小企业

回顾2012年初,腾讯优图团队仅有5号人,隶属于腾讯社交网络SNG事业部,在初始阶段,处于“无航标”阶段,团队手握着“图片二次压缩”的技术,但是不清楚应用场景,这是基于现成技术成果找应用场景的情况,在偶然情况下,他觉得这个技术能够应用在QQ空间中,能够有效地减少存储、降低带宽流量

接着,在2012年优图团队基于QQ空间图片缩略功能中,以往算法都是将图片居中提取,这种情况人物头像有可能不被收录在镜框中,基于这个需求,优图团队研发了人脸识别技术,能够算法识别到人脸,以人脸为中心的缩略图算法,解决了这个需求,这是基于需求找解决方案的情况。

在2013年-2014年间,与QQ空间合作相册中的人脸识别,尽管效果达到,但报告总结却说不清楚产品价值点在哪里,黄飞跃陷入迷茫的困境,前路该怎么走,他并没有方向,身边声音也怀疑视觉识别有没有价值。

一直处于接散单”状态的优图团队就像消防员,哪里有需要就扑到哪里,而这些并不是黄飞跃想要的,如何将已有的成果产品化成为核心思考。

迷茫之后,微众银行(腾讯旗下项目)的同事找到黄飞跃,希望他们做一个工具,能够实现线上注册和银行开户,用户只需要通过手机,扫描身份证以及真人头像,系统就能够判别是否本人,基于这个功能的开发,引来了更多类同的需求方。

随后广点通的同事也提出需求,需要一个工具,能够对客户提交的工商营业执照和客户身份证能够文字提取,以便于录入存档和信息核实,减少人工操作。南宁公安局希望联合腾讯优图推出“电子身份证”服务,个人通过手机办理“电子身份证”,即可实现酒店入住、场馆检票、机场身份核验服务。

随着这些需求的密集型爆发,黄飞跃顺势而为,将团队继续壮大,木桶理论,当需求木板摆脱最后一名的时候,人才、品牌、场景、优质数据、精确算法这些要素轮番成为短板,黄飞跃坦言:这些成长所带来的压力他都记住。

随着越来越多的腾讯内部项目和腾讯投资项目有类似的需求,黄飞跃就开始思考如何将技术对外输出,具备复制性,服务到更多的中小企业。因此黄飞跃用了标杆策略先选择行业中的标杆案例(金融行业的微众银行、出行领域的滴滴、电子商务的京东、公安行业),做成行业方案、然后将技术通过“腾讯优图开放平台”开放给中小企业,当企业需求量比较大就推荐到腾讯云平台购买服务。

区别于其他个体创业的视觉识别公司,黄飞跃博士直言自己的团队并没有盈利指标,公司赋予腾讯优图的使命,作为一个技术团队,核心是提高腾讯系产品的竞争力,其次AI处于早期,可以起到教育用户的作用。

除此之外,背靠腾讯,资金充裕,可用的资源也比较丰富,对比同一赛道的初创企业,腾讯优图团队经费充裕,在首批优质数据资源上,可以第三方购买的形式获得,而后续标杆性项目提供海量的用户数据,为算法的调优提供很好保障,而初创企业,往往都是负责人疲惫奔跑获得第一批种子客户。

没有盈利指标的优图团队,产品该走向何方呢?

黄飞跃博士认为:算法准确度够用就好,技术指标和产品可用性要找一个平衡

以人脸核身功能而言,准确率已经达到99.99%,这意味着10000个才有1个识别错误,而我们实际的使用场景并不需要那么高的准确度。例如,在人脸门禁识别中,准确度只需要99.9%即可(意味着允许1000个里面有一个出错),另一方面,影响准确率有时候不在于算法本身,而在于工具使用正确与否,例如:光照效果欠佳、姿势不端正。因此在一个面向C端的产品中,方向是优化产品本身,而不是算法。

作为国内视觉识别最早的一批从业者,黄飞跃博士有很多感概,人工智能宛如互联网,互联网在给人类带来便利的同时,也带来不少的麻烦,从1995年互联网元年算起,已经走过21载,在历史的长河中,21年依然是“too young too simple”,互联网将带人类走向何方,仍然不能盖棺而论。

同理,人工智能将人类带向何方更需要谨慎,博士认为人工智能核心是算法,它是一个机器,黑色产业链会不断地破解,以欺骗机器,随着人工视觉识别技术提升,人脸仿真合成的技术也随之提升,这是不断赛马的过程,我们需要谨慎过于依靠机器同时,人类的思考反而少了。

高榕、真格、GGV、达晨、昆仲、启赋六位投资人解读人工智能泡沫指数

深度:无人机带动植保行业大变革

富士康昆山裁员6万是前奏 勿惊慌 “机器换人”或为制造业未来2年主调

搜于特:一个民营服装企业的转型之路

双11营业额不能靠营销撑着,人工智能驱动的虚拟试衣是2017年重头戏


活动推荐:“5G物联峰会”

作为信息社会通用基础设施,时下5G产业建设以及发展如火如荼,并将最终带动数十万亿规模的社会经济发展。但5G在正式进行商用化普及应用前的态势如何发展?5G将为哪些领域的变革带来有益赋能?5G将在各行各业掀起什么样的市场风暴?系列问题依然困扰着各界人士。

为进一步深入了解产业发展脉络,理解5G产业现状以及未来趋势,让各界人士更清晰的洞察5G产业发展过程中的机遇点。6月14日,经上海市经济和信息化委员会、上海市商务委员会、上海市长宁区人民政府指导,由亿欧公司联合承办的“5G物联峰会”将于上海虹桥世贸展馆举办。

亿欧“5G物联峰会”将特邀政府、学界、商业、投资机构等领域的专业人士,以多领域视角切入,深究5G产业发展脉络,探索5G赋能各行各业的新思路、新方法,供行业内外各界人士参考。活动详情请戳:https://www.iyiou.com/post/ad/id/824