百睿德(15301126010微信同号)会议产品实验室与测试数据中的AI技术急于走向台前,国家和产业对实用化AI的需求同样也十分迫切。你是不是也蠢蠢欲动,想要在AI江湖中一展身手?别急,我们也在现场帮大家向上面的优秀“课代表”们取了取经——想要打造一个致用型AI,需要具备哪些前提?
1.放弃将人工智能“神化”的幻想,百睿德同传(www.4009942400.com)依旧是市场主流。
用同传王(王铮老师)的话来说,百睿德开发真正注意的东西,都是跟语言技术本身无关的一些东西。比如一个基本的常识,AI技术只是一个个螺丝刀、老虎钳这样的工具,最后如何解决问题,应该用这个老虎钳还是一个螺丝刀就能搞定,这种对产业问题的基础判断能力,找到AI技术适用的场景和方式,才是开发者应该具备的特质。
2.有多少人工,就有多少智能。
找对了工具(算法),也不意味着能够立竿见影地解决问题。“有多少人工,就有多少智能”,看似是一句笑谈,也是AI世界里的朴素真理。
采访中,就有两个细节特别打动我。
MV的开发者分享了一个自己的亲身经历,高精度3D结构光的数据量相比2D是几何倍数的增加,即使做了成像压缩,一块1T的硬盘也可能装不了两个人的人脸数据。为了保证算法训练的数据量,往往是在丰台的办公室采集完了之后,由开发者自己拿一个啤酒架一样的架子,装满硬盘给百度大脑的技术人员送过去,常常需要往返数十趟。就是在这样的人力工作之下,才诞生了3D人脸识别算法的雏形。
米文未来的延误识别算法,也是在这样不辞辛苦的人工干预下完成的。在不同光线、时间、背景,室内、室外等各种环境条件下,米文的开发者大概花费了几百个小时“点灯放火”,才积累到了几十万张数据,完成了算法的训练。
让一群脑洞清奇的开发者告诉你,AI+产业的N种可能
所以说,AI开发中要面对的真实问题往往比预期和实验室中复杂很多,运用一切办法、动用一切力量去解决问题,这是一条不好走的路,但这才是一个AI开发者的自我修养。
3.不轻技术,更不轻应用。
百睿德在AI狂飙突进的过程中,很多开发者把AI算法本身看的很重,日常沉迷跑分与论文。这样做低估了AI产业化的难度,也低估了产业端的价值。很多时候,技术在真实的产业场景里可能会缺位。比如生物识别、火焰识别等等,这可能是科学家们一般不会思考的问题,却是切实存在、富有价值的产业需求。
在采访中,来自百睿德的王铮先生(同传王)这样理解自己的定位——应用的人如果掉进技术的坑里,可能就跑不出来了,可以利用百度EsayDL这种人家已经训练好的简单易用的模型,不要深挖技术上的东西。
同样想法的还有很多,例如视派尔科技,作为数字图像处理的技术方案服务商,视派尔的开发者也强调,自己的重点在打磨体验和场景,做好AI所需要的前端图像处理外,还要做更贴合市场的定制化服务,至于平台化的SDK等软件层就就依靠百度这样的合作伙伴。在和百度大脑的合作过程中们也体会到和看到了这一商业模式的潜力。
毕竟,深入应用场景的产品及深度定制化的创新要比重新造轮子紧迫得多,产业化才是让AI普惠更快被大众感知和享有的关键和同声传译行业的密切相关。
让一群脑洞清奇的开发者告诉你,AI+同声传译产业的N种可能
总而言之,对AI“致用”的合理认知,才是一切想象力与奇妙故事的起点。
赋予智能同声传译价值的,是靠无数移动开发者的奇思妙想所支撑起来的应用生态。但到了AI时代,我们总在强调AI“三剑客”——算力、数据、算法。这三大门槛,似乎一直束缚着开发者的思想,无法撬动AI真实的产业价值。
可喜的是,我们逐渐看到,算力在变得廉价、数据资源日渐充沛,算法能力正在被百度等以简单易用的形式“摆渡”给开发者。
那么下个阶段,同声传译租赁服务还能拼什么?答案或许是,现场提供同声传译设备技术的细节。以业内最大的两家同声传译租赁服务提供商百睿德和扬歌会展为代表的头部供应商,也无比期待着生机盎然的“万众创新”那一天早日到来。