雪豹

专访和鲸科技CEO范向伟距离中国数据科学

发布时间:2023/6/8 18:10:37   

原创:谭婧

人类正从IT走向DT(DataTechnology),这是个大背景。

企业处在数据产品和AI产品的红海,想活命就必须手持一本《AI避坑逃生指南》。

个人处在竞争与内卷的浪潮,数据思维和工具是护身符。

在上海市徐汇区虹漕路77号C8,我见到了和鲸科技创始人范向伟与首席产品官殷自强。

这是一家拥有近15万注册数据科学家社区的公司,这是一家在数据科学的江湖里无论如何也不会错过的公司。

我们曾经从年就开始“聊天”。

这次只是,无数次中的一次。

只是这次,忠实地做了记录。

和鲸早期网站

出发时,和鲸只是一家被称作“对标谷歌Kaggle”的公司。

到如今,和鲸是一家“走通”从竞赛到社区,再到产品的公司。

在中国,乃至全球,这条路,都是独一无二的。

彼时,美国有,中国抄。

那一轮,投资人拿和鲸和Kaggle做中美对标,数据竞赛玩家拿“中国版Kaggle”指代和鲸。

Kaggle是什么?

是全球最大的数据科学技术分享社区(在线分享代码、项目和数据集等),创立于年。“Kaggle大神”是数据科学竞赛界顶礼膜拜的江湖称谓,可见其地位之显赫。

年,Kaggle被谷歌收购,宣布收购消息是彼时谷歌云首席科学家李飞飞。消息漂洋过海,范向伟耳边都是:“卖给BAT,财富就自由”。

01.Kaggle被谷歌收购上岸,和鲸去向何方?

范向伟不想“卖”公司,因为他一开始就没有“抄”。办竞赛、搭平台、建社区、出产品,全套拳法,天人合一。

到今天,真相大白了。因为没得抄了,反而能看出来谁在踏踏实实做数据科学的产品。

年的创业团队

既然不被收购,那接下来,路在何方?

这个问题,范向伟这几年应该被问了无数次。

当年,有人说Kaggle可以推出SaaS产品,因为抓住了一群独特的、技术含量极高的、小众的群体。这群人的需求,比中情局的情报还珍贵。

四年过去了,Kaggle始终没有迈出这一步。被误称为“中国版Kaggle”的公司却做到了。

SaaS产品“数据科学云端协作工具”,并非诞生美国硅谷车库,而诞生在中国人自己的数据科学社区。如果它有口号的话,估计会和熊猫、雪豹、金丝猴“撞稿”:“我们诞生在中国。”

彼时,数据化浪潮开天劈地,数据竞赛风起云涌,范向伟从上海交通大学统计系的教室里缓步走出。他并不热心于完成硕士学业,而是心心念念数据竞赛。

兴趣是最好的开始,而同行者最是惺惺相惜。社区就是吸铁石,把同类人“吸”在一起。

和鲸早期网站

和鲸早期网站

数据竞赛社区高手云集,人气高,思路广,不乏大量活跃者,贡献算法、案例、数据集,吸引更多数据人才,武林高手齐聚光明顶,围攻“挑战性数据问题”。

数据竞赛社区中国不止一家,阿里巴巴、百度都有,是不是论规模,定输赢?

范向伟的答案是否定的。和鲸不只是数据竞赛举办方。

别人仅仅是办一场活动,和鲸团队则在打磨产品——先做竞赛系统,再把整个竞赛系统SaaS化。他们做到了从人力运营转换到竞赛产品。

范向伟说:“多年前,比赛客户就开始自办比赛了,我们只提供竞赛产品。比如华东师范大学,就是用和鲸的比赛系统直接办比赛。”

演化与进化都是悄然发生的。

歌手唱:《想爱谁你就去爱谁》

范向伟说:“想办竞赛你就去办竞赛”,下半句是:“给你工具就行了。”

中国移动、中国电信、南方电网、中华医学会、鹏城实验室、北京医保局都来找和鲸办数据竞赛,范向伟拿出产品——数据竞赛管理平台。

一面办比赛,一面产品化。这是一件很有趣的事儿。

数据竞赛不崇尚孤胆英雄,团队作战更为常见。一起写代码,让“协作”成为参赛选手的刚需。从那时开始,像种子一样的“协作”产品理念,已经发芽了。数据竞赛系统突出竞赛,数据科学云端协作工具突出协同,两个产品的底层模块有共同之处。

首席产品官殷自强说:“SaaS化是因为有抓手,我们才有机会摸索产品化的道路。”和鲸社区打磨产品的方法是独一无二的,类似开源软件的方法论,千手捉虫(bug)快,和真实需求的距离最近。

“有多近?”“和鲸团队的办公室,是距离中国数据科学竞赛比赛现场最近的地方。”

打磨,是SaaS产品的必由之路。

殷自强说:“数据竞赛的价值是什么?这个问题我们思考了五年,这五年来,我们办了多场比赛,个不同的场景,家不同的机构,处理个人工智能需求,个机器学习需求,共性在哪?”

“直接给到客户的,相当于为客户做定制开发。某一模块可能只是客户唯一需求。对于高速迭代的工具平台,这种先定制开发,再产品化的模式会遇到很大的挑战。”殷自强说。

“和鲸的做法是,某个产品模块上新,让社区先使用。”

社区,是和鲸得天独厚的宝地,是孙悟空的花果山,是哪咤的陈塘关。

“比赛结束,一切都结束了,那是活动营销公司的生意。”殷自强补充说。

这时候,有人质疑,是不是和鲸的产品,只用于数据竞赛?

答案并不是。

产品要在场景无数次验证大规模的需求,数据竞赛就是这样的场景,证明产品是可以支撑千人同时在线编程。若论同时使用产品的人数,一家普通公司不可能比社区里的人多。所以,和鲸的产品对客户的服务,变成了降维满足客户需求。

和鲸社区里的各色需求都被提炼成产品的迭代需求。这既是一种“折磨”,也是一种“幸福”。折磨受得越多,产品越成熟。很多时候,在和鲸办公室里看见研发团队谁的神情最焦灼,那人便是殷自强。

但是他说这句话的时候充满自(fan)信(er)心(sai):“从来没有碰到过哪个公司的并发,把我们给卡住了。”

02.准确判断AI的技术趋势

数据与AI的发展既强势,又混沌。做数据和AI产品要对主流技术趋势敏感,有判断力。

用范向伟的话说就是:“数据科学已经发展到第三阶段(3.0),数据类型、基础设施、分析工具和工程任务中的行为,发生巨大变化。”一个软件版本用N年的时代,已经一去不复返了。

殷自强自问自答:“快速扩容是一个里程碑。10台变成台,0台变成00台,这种变化不能影响服务。支持大规模工程的能力,业界迟早要有,且大家都会去选最好的。这件事情,为什么不是我们来做?”

当K8s刚出1.0版本的时候,CTO和技术团队敏锐地

转载请注明:http://www.aideyishus.com/lktp/4969.html

------分隔线----------------------------